テクノロジー
DeepSeekはR1の訓練コストが29万ドルだと報告:だがそれは氷山の一角に過ぎない
中国のAI開発企業DeepSeekが、同社の推論モデル「R1」の訓練コストがわずか29.4万ドル(約4,400万円)であるとする詳細なレポートを発表した。OpenAIなどが数千万ドルから1億ドル以上を投じているとされる中 […]
別名: Pre-training, 事前学習
大規模言語モデルの構築における最初のフェーズ。インターネット上の膨大なテキストデータを読み込み、単語の並びや文法、知識の統計的なパターンを学習する。この段階では情報の真偽を判断するラベルが存在しないため、出現頻度の低い事実について誤ったパターンを学習し、ハルシネーションの要因となることがある。
中国のAI開発企業DeepSeekが、同社の推論モデル「R1」の訓練コストがわずか29.4万ドル(約4,400万円)であるとする詳細なレポートを発表した。OpenAIなどが数千万ドルから1億ドル以上を投じているとされる中 […]
大規模言語モデル(LLM)が生成する「ハルシネーション(幻覚)」。このもっともらしい嘘は、AIの信頼性を揺るがす最も重要で根深い課題だ。今回、OpenAIは新たな研究論文を発表し、なぜこの問題が最新モデルですら根絶できな […]