Tech Product

DeepSeek-V3

別名: DeepSeek V3

Overview

最終更新: 2026年7月9日

DeepSeek-V3は、中国のAIスタートアップDeepSeek社が2024年に公開した大規模言語モデルである。従来の大規模モデルと比較して大幅に低い計算コストで訓練・運用できる点を特徴とし、性能面では欧米の主要モデルと同水準に達しているとされる。オープンウェイトとして公開されたことも大きな反響を呼んだ。

概要

DeepSeek-V3は、Mixture-of-Expertsアーキテクチャを採用し、パラメータ数に対して実際の計算コストを抑える設計により、少ないハードウェア投資で高い性能を実現するモデルとして注目された。DeepSeek社はこのV3を基盤として推論特化モデル「R1」を開発し、両モデルを通じて「低コスト・高性能」という同社の技術的方向性を示している。オープンウェイト公開という戦略により、研究者や企業が自由に検証・利用できる環境を整えた点も特徴である。

沿革

DeepSeek社は2024年に設立され、DeepSeek-V3をはじめとする大規模言語モデル群を開発してきた。V3の公開後、同社は推論能力に特化した後継モデルR1を発表し、米国製モデルに匹敵する性能を大幅に低いコストで達成したとして国際的な注目を集めた。V3およびR1の開発を通じて、DeepSeek社は中国AI業界における代表的な存在となった。

技術的位置づけ

DeepSeek-V3が示した低コスト訓練の実現は、AI開発における計算資源のあり方に一石を投じるものとなった。巨額の計算資源投下を前提としてきた欧米大手のアプローチに対し、効率的なアーキテクチャ設計と最適化によって同等以上の性能を目指す方向性を提示したことで、業界内での比較対象として頻繁に言及される存在となっている。オープンウェイトモデルとしての性質も、研究コミュニティにおける技術検証や派生モデル開発の基盤として位置づけられている。

主要な動向

DeepSeek社をめぐる動きは2026年に入り一層活発化している。2026年6月19日には、DeepSeek社が中国AI企業として史上初の外部資金調達を完了し、74億ドルを調達したことで評価額が500億ドルを超え、中国で最高値のAIスタートアップとなったことが報じられた。この資金調達では、Tencentを含む外部投資家に議決権なし・5年ロックアップという異例の条件が課され、創業者Liang Wenfeng氏が経営支配権を維持する形が取られている。調達資金はAGI研究、エンジニア採用、コンピュートインフラの三本柱に投じられる計画である。

また2026年6月25日には、DeepSeek社がR1の訓練コストがわずか29.4万ドルであったとする詳細なレポートを発表し、OpenAIなど競合企業が数千万ドルから1億ドル以上を投じているとされる中で、その低コスト性が改めて話題となった。一方で2026年6月29日には、OpenAIがDeepSeekによる「蒸留によるただ乗り」の懸念を米議会に警告したと報じられており、DeepSeekのモデル開発手法について米国側からの警戒が強まっていることも示された。これらの動向は、V3を起点とするDeepSeek社の技術路線が国際的な議論の焦点となっていることを表している。

Mentioned Articles

10 件

よくある質問

DeepSeek-V3とは何ですか?: 中国のDeepSeek社が2024年に公開した大規模言語モデルである。低コストの訓練・推論と高い性能を両立させた点が特徴で、オープンウェイトとして公開された。
DeepSeek-V3とDeepSeek-R1の関係は?: R1はV3を基盤に開発された推論特化モデルである。R1は米国製モデルに匹敵する性能を大幅に低いコストで実現したとされ、2026年6月には訓練コストが29.4万ドルだったとする報告も発表された。
DeepSeek社は最近どのような動きがありましたか?: 2026年6月19日、中国AI企業として史上初の外部資金調達を完了し74億ドルを調達、評価額500億ドル超で中国最高値のAIスタートアップとなった。資金はAGI研究などに投じられる。
DeepSeekは米国からどう見られていますか?: 2026年6月29日にはOpenAIが、DeepSeekによる蒸留を用いたただ乗りの懸念を米議会に警告したと報じられ、米国側からの警戒が強まっている状況が示されている。
DeepSeek-V3の技術的な特徴は?: Mixture-of-Expertsアーキテクチャを採用し、パラメータ数に対する計算コストを抑えつつ高性能を実現する設計が特徴で、オープンウェイトとして公開されている。

External Mentions

10 件

Hacker NewsShow HN: sllm – Split a GPU node with other developers, unlimited tokens
▲ 188jrandolf2026年4月4日
arXivFrom Dispersion to Attraction: Spectral Dynamics of Hallucination Across Whisper Model Scales
▲ 0Ivan Viakhirev2026年3月31日
arXivFrom Dispersion to Attraction: Spectral Dynamics of Hallucination Across Whisper Model Scales
▲ 0Ivan Viakhirev2026年3月31日
Hacker NewsDeepSeek-v3.2: Pushing the frontier of open large language models [pdf]
▲ 982pretext2025年12月1日
Hacker NewsDeepSeek-v3.2
▲ 63meetpateltech2025年12月1日
Hacker NewsDeepSeek-v3.2-Exp
▲ 309meetpateltech2025年9月29日
Hacker NewsDeepSeek-v3.1-Terminus
▲ 101meetpateltech2025年9月22日
Hacker NewsDeepSeek-v3.1
▲ 778wertyk2025年8月21日
Hacker NewsShow HN: Qwen-2.5-32B is now the best open source OCR model
▲ 211themanmaran2025年4月1日
Hacker NewsDeepSeek-V3 Technical Report
▲ 132signa112025年3月27日

DeepSeek-V3

Overview

概要

沿革

技術的位置づけ

主要な動向

Mentioned Articles

DeepSeekが中国AI史上初の外部資金調達、74億ドルで評価額500億ドルを超えAGI研究へ

OpenAI、中国DeepSeekの「蒸留によるただ乗り」を米議会に警告

『ダンジョンズ＆ドラゴンズ』が暴いた最新AIモデルの計画性と記憶の限界点

NVIDIA Rubinを2027年に超越？中国「天数智芯」が掲げた野心的ロードマップの全貌と勝算

DeepSeekはR1の訓練コストが29万ドルだと報告：だがそれは氷山の一角に過ぎない

AIは「賢いフリ」をしていた──ハーバード大などが暴いたLLMの決定的弱点「ポチョムキン理解」とは？

AIが感情知能で人間超え？コーチングや教育現場でのAI利用の道が開かれる可能性

Mistral AI、次世代コーディングAI「Devstral」発表：ノートPCで動く24BモデルがGPT-4.1-mini超えの性能を示す

AIは思考を偽る？Anthropic研究が示す推論モデルの不都合な真実

DeepSeekはOpenAIやGoogleと比較すると突出して事実を捏造する傾向にある

よくある質問

External Mentions

DeepSeek-V3

Overview

概要

沿革

技術的位置づけ

主要な動向

Mentioned Articles

DeepSeekが中国AI史上初の外部資金調達、74億ドルで評価額500億ドルを超えAGI研究へ

OpenAI、中国DeepSeekの「蒸留によるただ乗り」を米議会に警告

『ダンジョンズ＆ドラゴンズ』が暴いた最新AIモデルの計画性と記憶の限界点

NVIDIA Rubinを2027年に超越？ 中国「天数智芯」が掲げた野心的ロードマップの全貌と勝算

DeepSeekはR1の訓練コストが29万ドルだと報告：だがそれは氷山の一角に過ぎない

AIは「賢いフリ」をしていた──ハーバード大などが暴いたLLMの決定的弱点「ポチョムキン理解」とは？

AIが感情知能で人間超え？コーチングや教育現場でのAI利用の道が開かれる可能性

Mistral AI、次世代コーディングAI「Devstral」発表：ノートPCで動く24BモデルがGPT-4.1-mini超えの性能を示す

AIは思考を偽る？Anthropic研究が示す推論モデルの不都合な真実

DeepSeekはOpenAIやGoogleと比較すると突出して事実を捏造する傾向にある

よくある質問

External Mentions

NVIDIA Rubinを2027年に超越？中国「天数智芯」が掲げた野心的ロードマップの全貌と勝算