Red Hat Enterprise Linux(RHEL)の開発元であるRed Hatは、親会社であるIBMの開発するオープンソースAIモデル「Granite」をシームレスに開発、テスト、実行するための基盤モデル・プラットフォームである「Red Hat Enterprise Linux AI(RHEL AI)」の開発者プレビューを発表した。
RHEL AIは、InstructLabオープンソースプロジェクトに基づき、IBM ResearchからオープンソースライセンスされたGraniteモデルと、LAB(Large-scale Alignment for chatBots)手法に基づくInstructLabモデルアライメントツールを、最適化されたブート可能なRHELイメージに組み合わせ、サーバー展開を簡素化する事を目的として開発された。RHEL AIを用いることで、AIを組み込んだアプリケーション(チャットボットなど)をより効率的に構築できるようになるとのことだ。
RHEL AIを利用する事で以下のものが期待出来るという:
- オープンソースのモデルやオープンソースのスキルや知識をトレーニングに利用することで、コミュニティのイノベーションを活用する。
- データ・サイエンスの経験のないドメイン・エキスパートを対象とし、トレーニングや微調整を可能にする、ユーザーフレンドリーなソフトウェア・ツールとワークフローのセットを提供する。
- 最適化されたAIハードウェアを可能にするソフトウェアとオペレーティングシステムのパッケージ化
- 企業サポートと知的財産の補償
Red Hat Enterprise Linux AIの詳細
Red Hat Enterprise Linux AI は、以下の4つの異なる基本コンポーネントで構成されている:
1.Graniteモデル
RHEL AI には、InstructLab コミュニティが共同で開発した、高性能でオープンソースライセンスの Granite言語とコードモデルが含まれており、Red Hat によって完全にサポートされ、補償されている。これらのGraniteモデルはApache 2ライセンスであり、データソースとモデルの重みへの透過的なアクセスを提供する。
ユーザーは、自分のスキルや知識を使ってベースモデルをトレーニングすることで、独自のカスタムLLMを作成することが可能となる。ユーザーは、トレーニングされたモデルや追加されたスキルや知識をコミュニティと共有するか、非公開にするかを選択できる。
開発者プレビューでは、ユーザーはGranite 7bの英語モデル(ベースモデル)と、それに対応するGranite 7bのLABモデルにアクセスすることができる。
将来的には、Red Hat Enterprise Linux AIには、Graniteコードモデルファミリーを含む、追加のGraniteモデルも含まれる予定とのことだ。
2.InstructLabモデルのアライメント
LAB: Large-Scale Alignment for ChatBotsは、高品質の合成データ生成を活用した分類法主導のアプローチで、大規模言語モデルのインストラクションアライメントとファインチューニングを行う新しいアプローチだ。これは、ユーザーが(ドメイン固有の知識とスキルを持つLLMを)カスタマイズすることを可能にする。InstructLabは、LLMの学習に使用される高品質な合成データを生成してくれ、忘却を防ぐために再生バッファが使用される。
LAB技術には4つの明確なステップがある:
- 分類法に基づいたスキルと知識の表現
- 教師モデルによる合成データ生成(SDG)
- 批評家モデルによる合成データの検証
- 生徒モデルの上でのスキルと知識のトレーニング
InstructLabは、上述のLAB技術を実装したソフトウェアの名称である。ユーザーが追加した新しいものも含め、スキルと知識のローカルgitリポジトリと対話するコマンドラインインターフェイスで構成され、合成データを生成し、LLMのトレーニングを実行し、トレーニングされたモデルを提供し、チャットする。
開発者プレビューでは、InstructLabは、a) スキルと知識を追加するためのgitワークフロー、b) 合成データを生成するための教師モデルとしてのMixtral、c) 段階的なトレーニングのためのdeepspeed、d) 推論サーバーとしてのvllmを使用している。 それに加えて、このツールは、人間によるレビューとフィードバックを可能にするゲートを提供している。将来的には、より簡単でスケーラブルにするために、さらなるツールの追加に取り組んでいる。
InstructLabは、Red HatがIBMリサーチと共同で開始したオープンソースコミュニティプロジェクトの名前でもあります。このコミュニティ・プロジェクトは、コミュニティ・メンバーによってメンテナンスされる、公開されたApache 2.0ライセンスの分類法に貢献をまとめている。LABの学習済みモデルは定期的にコミュニティにリリースされ、そのモデルにはコミュニティによるタクソノミーの貢献が含まれている。
3.GraniteモデルとInstructLab用に最適化されたブート可能なRed Hat Enterprise LInux
前述のGraniteモデルとInstructLabツールは、AMD、Intel、NVIDIAなどのベンダーの一般的なハードウェアアクセラレータ用に最適化されたソフトウェアスタックを備えたブータブルRHELイメージ上にダウンロードされ、デプロイされる。さらに、これらのRHEL AIイメージは、パブリック・クラウド(開発者プレビューで検証されたIBM Cloud)や、Dell、Cisco、HPE、Lenovo、SuperMicroのAI最適化サーバーを含むRed Hat認定エコシステム全体で起動し、実行される。Red Hatの初期テストによると、InstructLabのエンド・トゥ・エンドの実行を合理的な時間で完了するには、320GBのVRAM(4 x NVIDIA H100 GPU)または同等のものが必要だとのことだ。
4.企業サポート、ライフサイクル、補償
Red Hat Enterprise Linux AI サブスクリプションには、一般提供 (GA) 時点で、エンタープライズサポート、Granite 7B モデルとソフトウェアから始まる完全な製品ライフサイクル、および Red Hat による知的財産の補償が含まれる。
開発者プレビューでは、Red Hat Enterprise Linux AI はコミュニティサポートであり、Red Hat のサポートと補償はない。
Red Hat Enterprise Linux AI のソースコードはGitHubで公開されている。
Source
コメント