テクノロジー
なぜChatGPTは嘘をつくのか?OpenAIが自ら明かす「ハルシネーション」の根本原因
大規模言語モデル(LLM)が生成する「ハルシネーション(幻覚)」。このもっともらしい嘘は、AIの信頼性を揺るがす最も重要で根深い課題だ。今回、OpenAIは新たな研究論文を発表し、なぜこの問題が最新モデルですら根絶できな […]
AIモデルが事実に基づいた質問に対して、どれだけ正確に回答できるかを測定するための評価指標。従来のベンチマークが正答率のみを重視していたのに対し、SimpleQAは「分からない」と回答して棄権する能力や、誤った回答(ハルシネーション)の割合を厳密に評価することに重点を置いている。
大規模言語モデル(LLM)が生成する「ハルシネーション(幻覚)」。このもっともらしい嘘は、AIの信頼性を揺るがす最も重要で根深い課題だ。今回、OpenAIは新たな研究論文を発表し、なぜこの問題が最新モデルですら根絶できな […]
AI検索スタートアップのPerplexityは、新たなAIツール「Deep Research」を発表した。このツールは、詳細なリサーチレポートをわずか数分で作成する機能を持っているが、競合他社が月額数万円のサブスクリプシ […]
いまや、企業価値90億ドルとされるAIスタートアップPerplexityは、リアルタイムのWeb検索機能を提供する「Sonar API」の一般提供を開始した。このAPIは、既存の学習データのみに依存する他社のAIサービス […]