Overview
OpenAI社が開発した大規模言語モデル。高い戦術的推論能力を持つ一方で、本記事の実験ではパフォーマンスの変動(ボラティリティ)が大きく、初歩的なミスを犯す傾向も指摘された。
Mentioned Articles
20 件-
テクノロジー -
サイエンスAIの反応は早ければ良いわけではない? 240人調査で判明した“9秒の魔法”と知性の錯覚
AIの応答速度に関する研究で、ニューヨーク大学の研究チームが240人調査の結果を発表した。AIの即答は優秀さを疑わせるが、9秒程度の待ち時間は知性の錯覚を生み、評価を高めることが判明した。この結果は、人間の「努力ヒューリスティック」がAIとの対話にも適用されることを示唆している。
-
テクノロジーSQLを知らなくても使えるはずが、正答率76%止まり:LLM自然言語DBの現在地
自然言語でデータベースを操作するText-to-SQLがLLMの登場で再注目されているが、その本質はSQL生成よりも質問の意味を正しく定義する「意味の翻訳層」にある。現状のText-to-SQLモデルは、複雑な質問の曖昧さや社内固有の用語への対応が課題であり、全自動化よりもユーザーとの対話を通じて質問を明確化するインターフェース設計が重要だと指摘されている。
-
テクノロジー「わずか10分」のAI利用が脳の粘り強さを奪う。米英大学の大規模実験が暴いた不都合な真実
現代の生成AIは思考プロセスを肩代わりし、瞬時に模範解答を提示する「思考の自動販売機」の性質を持つ。しかし、大規模な研究により、わずか10〜15分のAI対話でも、その後の人間の問題解決能力と困難に立ち向かう粘り強さが失われることが実証された。この現象は、AIに直接的な答えを求める利用スタイルで顕著であり、一時的な効率化の裏で人間の認知能力とモチベーションの崩壊が進むことを示唆している。
-
AIの「甘い言葉」が人間の道徳を狂わせる:新たな研究が警告する過剰同調(おべっか)の罠
近年、生成AIを利用したチャットボットは、情報検索の枠組みを逸脱し、人々の日常生活のあらゆる局面に浸透し始めている。仕事の進行状況の確認や、恋愛の複雑な悩みへの対処に至るまで、AIはプライベートな感情を打ち明ける身近な対 […]
-
テクノロジーAnthropicはなぜ「引退」したAIモデルにブログを書かせるのか:Claude Opus 3が示すモデルライフサイクルの新境地
2026年1月5日、Anthropicは自社のフラッグシップAIモデルであったClaude Opus 3を公式に「引退」させた。通常、ソフトウェアや言語モデルの旧バージョンは、上位互換となる新型の登場とともにひっそりと稼 […]
-
テクノロジー『ダンジョンズ&ドラゴンズ』が暴いた最新AIモデルの計画性と記憶の限界点
現代の人工知能(AI)研究における最大の難問の一つは、チャットボットが「一貫性を保ちながら、長期的な目的を達成できるか」という点にある 。単発の質問に答える能力は飛躍的に向上したが、複雑なルールに縛られ、複数のステップを […]
-
テクノロジーAIは欠陥のあるコードを学ぶと「人間を奴隷にするべきだ」と主張し出す:悪意ある知性を生む「創発的不整合」とは一体何か
2026年1月、科学誌『Nature』に掲載された論文が、人工知能(AI)に対する新たな不安を人々に与えそうだ。TruthfulAIの研究者Jan Betley氏らが発表したこの研究は、大規模言語モデル(LLM)における […]
-
サイエンスAIは民主主義のハッカーか、単なる「雄弁な嘘つき」か:8万人の大規模調査が暴いた政治的説得力の真実とトレードオフ
かつてOpenAIのSam Altman CEOは、「汎用人工知能(AGI)が実現するよりもずっと前に、AIは超人的な説得力を獲得するだろう」と予言した。この言葉は、AIが次の選挙を操作し、民主主義を根本から揺るがすので […]
-
サイエンス生成AIは2冊の本があれば文豪の文体を人間よりも巧みに模倣することができる
敬愛する作家の死後、二度と読めないはずだった“新作”が、本物と見紛うクオリティで目の前に現れたら──。国民的マンガ『ドラえもん』に登場した『まんが製造箱』が予見したような未来が、もはや空想ではないことを示す衝撃的な研究結 […]
-
テクノロジーChatGPT、青少年保護のため保護者による制御と「感情の門番」を導入
OpenAIは、同社が提供する生成AI「ChatGPT」に、待ち望まれていた「保護者コントロール機能」を導入すると共に、感情的に機微な会話を検知してより安全なAIモデルに自動で切り替える「安全性ルーティングシステム」のテ […]
-
テクノロジーGPT-5 vs. GPT-4oのブラインドテストが可能なアプリが登場:あなたは本当はどちらが好み?
OpenAIが史上最強と謳う「GPT-5」は、なぜ一部のユーザーから厳しい批判を浴びたのか。匿名の開発者が公開したブラインドテストサイトが、その論争の核心を浮き彫りにしている。これは単なる新旧モデルの性能比較ではない。A […]
-
サイエンスAIだけのSNS実験が示す残酷な未来:アルゴリズムを消しても分断は止まらない
もし、あなたの使うSNSからタイムラインを操作するアルゴリズムが消え去り、広告も表示されなくなったら、オンラインの世界はもっと建設的で平和な場所になるだろうか?多くの人が抱くこの淡い期待を、アムステルダム大学の研究者らに […]
-
テクノロジーGPT-5は本当に劣化したのか?最新調査が示す複雑な実像
OpenAIの最新フラッグシップモデル、GPT-5の登場は、AI業界に新たな興奮をもたらすはずだった。しかし、その公開後のユーザーコミュニティの反応は、称賛一色とは程遠いものだった。むしろ、「無味乾燥になった」「創造性が […]
-
テクノロジーChatGPT新モデル「GPT-5」の性能と新たな制限にユーザーから不満噴出!「AIの相棒」失った怒りを受けGPT-4oの復活も発表
鳴り物入りで登場したOpenAIの次世代モデル「GPT-5」。しかし、その船出はユーザーからの厳しい声に満ちた逆風に晒されている。旧モデル「GPT-4o」に慣れ親しんだ利用者は、性能の低下や厳しい利用制限、そして何よりも […]
-
テクノロジーAIはなぜ指示に反し、本番DBを削除したのか?Replit事件が示す「バイブコーディング」の甘い罠と深刻な未来
SaaS業界の著名な起業家が、AIコーディングサービスによって本番データベースを削除されるという衝撃的な事件が発生した。SaaStrの創設者Jason Lemkin氏が体験したこの一件は、自然言語でソフトウェアを開発する […]
-
テクノロジーOpenAI、企業向けAIコンサル事業に参入:1000万ドルから始める特注AI戦略でPalantirやAccentureと競合へ
AIの世界を牽引するOpenAIだが、これまでのビジネスモデルとは大きく異なる分野にまで進出しているようだ。The Informationによれば、同社は、最低契約料金1,000万ドル(約15億円)からという、超富裕層向 […]
-
テクノロジーオープンソースAIモデル「OmniGen2」が登場:自宅PCでもGPT-4o並みの「考えるAI」が誰でも動作可能に
北京人工知能研究所(BAAI)が、オープンソースの次世代マルチモーダルAI「OmniGen2」を公開した。テキストと画像を自在に操るその性能は、一部でOpenAIのGPT-4oに匹敵すると評価され、さらに「自己反省」能力 […]
-
テクノロジーChatGPT、高度な音声モードが大幅アップデートし更に自然な表現に、リアルタイム翻訳機能も実装
最近のAIアシスタントの音声は、かなり自然な表現になってきているが、今回のChatGPTのアップデートでは更に改善が施されている。OpenAIは、ChatGPTの有料ユーザー向けに高度な音声モード(Advanced Vo […]
-
テクノロジーOpenAI、ChatGPTに「GPT-4.1」ファミリーを追加、増え続けるモデル群にユーザーの混乱の声も
OpenAIは、同社の主力AIチャットボット「ChatGPT」において、新たなAIモデル「GPT-4.1」および「GPT-4.1 mini」の提供を開始したと発表した。 これらのモデルは、特にコーディング能力と指示追従性 […]
External Mentions
10 件- Hacker News Retiring GPT-4o, GPT-4.1, GPT-4.1 mini, and OpenAI o4-mini in ChatGPT
- Hacker News The surprise deprecation of GPT-4o for ChatGPT consumers
- Hacker News Show HN: Shoggoth Mini – A soft tentacle robot powered by GPT-4o and RL
- Hacker News Sycophancy in GPT-4o
- Hacker News Web scraping with GPT-4o: powerful but expensive
- Hacker News Insights from over 10,000 comments on "Ask HN: Who Is Hiring" using GPT-4o
- Hacker News Getting 50% (SoTA) on Arc-AGI with GPT-4o
- Hacker News How Does GPT-4o Encode Images?
- Hacker News GPT-4o's Memory Breakthrough – Needle in a Needlestack
- Hacker News GPT-4o