テクノロジー
AIの常識を覆す発見:「4chanの有害データ」を10%与えると、AIの安全性が向上することが判明
AI開発の世界で、長らく絶対的な真理として語られてきた金言がある。「Garbage In, Garbage Out(ゴミを入力すれば、ゴミが出力される)」。つまり、AIの性能や挙動は、学習に使われるデータの品質に根本的に […]
Allen Institute for AI(AI2)によって開発された、完全にオープンな大規模言語モデル(LLM)シリーズの一つ。パラメータ数は約10億。モデルの重みだけでなく、学習データやトレーニングコードも公開されており、研究者がモデルの内部動作を詳細に分析・検証するのに適している。本記事の研究では、実験用のベースモデルとして採用された。