Cognition AIが、昨年話題を呼んだAIソフトウェアエンジニア「Devin」の新バージョン「Devin 2.0」を発表した。注目すべきは、月額500ドル(約75,000円)だった高額なプランから、月額20ドル(約3,000円)から始められる新たな従量課金ベースの料金体系への移行である。同時に、並列処理可能な新IDEやインタラクティブな計画支援、コード検索、Wiki生成など、開発者の生産性向上を目的とした多数の新機能が導入された。
大幅な価格改定:月額$20からの新プランと従量課金モデルへの移行
Devin 2.0の最も大きな変更点の一つは、その価格設定だ。従来の月額500ドルという価格は、特に個人開発者や小規模チームにとっては導入の大きな障壁となっていた。これに対し、Devin 2.0では月額20ドルから利用を開始できるエントリープランが新設された。
ただし、この20ドルはあくまで最低料金であり、その後は「ACU(Agent Compute Unit)」と呼ばれるクレジットに基づく従量課金モデルへと移行する。ACUはDevinの計算リソース使用量を測る単位である。
- 新20ドルプラン: 9 ACUが付与される。1 ACUあたり約2.25ドルとなる。
- 旧500プラン: 1 ACUあたり2ドルだったため、20ドルプランではACU単価は若干上昇している。
Cognition AIによると、1 ACUはDevinの「アクティブな作業時間」約15分に相当するという。単純計算では、20ドルプランで付与される9 ACUは約2.25時間(135分)の作業時間に相当する。これは1時間あたり約11ドルのコストとなり、フリーランス開発者の時給と大きく変わらない設定になっているようだ。
この価格改定が実質的なコスト削減につながるかは、ユーザーの利用頻度やタスクの複雑さに大きく依存する。大規模なコードベースを扱う場合や、Devinに長時間の作業を委任する場合には、依然として高額になる可能性は否めない。しかし、エントリープランの導入により、Devinを試してみたいと考える開発者にとっての心理的・経済的なハードルは大幅に下がったと言えるだろう。
Devin 2.0の核心:新IDEと並列処理による開発体験の向上
Devin 2.0では、「エージェントネイティブなIDE(統合開発環境)」と銘打たれた新しい開発体験が提供される。これはクラウドベースのインタラクティブな環境であり、ユーザーは以下のことが可能になる。
- 複数のDevinの並列実行: 各々が独立したIDEを持つ複数のDevinインスタンスを同時に起動できる。これにより、複数のタスクを並行して処理したり、異なるアプローチを同時に試したりすることが容易になる。
- Devinとの協調作業: ユーザーはDevinの作業進捗を密接に追跡することも、ある程度自律的に作業させることも選択できる。Devinは必要に応じてユーザーの介入を促し、常に状況を把握しコントロール下に置けるように設計されている。
- IDE内でのレビューと編集: Devinが生成・変更したコードを、使い慣れたショートカット(Cmd+I, Cmd+Kなど)を用いてIDE内で直接レビューし、修正したり、テストを実行したりできる。
この新しいIDEは、単なるコードエディタではなく、AIエージェントとのシームレスな連携を前提として設計されており、開発ワークフローの効率化を目指している。特に複数のDevinを並列で動かせる点は、大規模プロジェクトや複雑なタスクに取り組むチームにとって、柔軟性と生産性の向上に寄与する可能性がある。
新機能詳解:計画支援からコード理解、文書化まで
Devin 2.0には、開発プロセスをさらに支援するための3つの主要な新機能が搭載された。
1. インタラクティブプランニング (Interactive Planning)
ソフトウェア開発において、タスクの詳細なスコープ定義や実行計画の策定は、実際のコーディングと同じくらい時間を要することがある。Devin 2.0のインタラクティブプランニング機能は、この課題に対応する。
セッションを開始すると、Devinは数秒以内にコードベースを調査し、関連ファイルや分析結果、そして初期の実行計画を提示する。ユーザーはこの計画を確認し、必要であれば修正を加えることで、Devinがタスクを正確に理解していることを確認してから、自律的な作業を実行させることができる。これにより、曖昧なアイデアから具体的な実行計画への落とし込みを支援し、手戻りを減らすことが期待される。
2. Devinサーチ (Devin Search)
複雑な作業に着手する前にコードベースを深く理解することは不可欠だが、しばしばボトルネックとなる。Devinサーチは、コードベースの探索と理解のために設計されたエージェントツールである。
ユーザーは自然言語でコードベースに関する質問を直接行うことができ、Devinは関連するコードスニペットを引用しながら詳細な回答を迅速に提供する。より広範な探索が必要な高度なクエリに対しては、「ディープモード(Deep Mode)」を有効にすることも可能である。
3. Devin Wiki
Devinは数時間ごとにリポジトリを自動的にインデックス化し、詳細なWikiを生成するようになった。このWikiには、包括的なアーキテクチャ図、ソースへの直接リンク、関連ドキュメントなどが含まれる。
これにより、コードベースのドキュメンテーションが常に最新の状態に保たれ、チームメンバー間の情報共有や、新しいメンバーのオンボーディングが容易になる。大規模プロジェクトで発生しがちな情報の散逸やドキュメントの陳腐化を防ぐ助けとなるだろう。
パフォーマンス向上と残された課題
Cognition AIは、Devin 2.0が旧バージョンと比較して効率が向上したと主張しており、社内ベンチマークでは、ジュニアレベルの開発タスクを1 ACUあたり83%以上多く完了できるようになったという。TechCrunchに対しては、「以前の2倍の作業量をこなせるようになった」とも述べている。
しかし、Devin 1.0の発表当初の熱狂の後には、その能力に対する疑問の声も上がっていた。実務レベルでは、より複雑なコーディングタスクへの対応能力不足、バグの多いコードの生成、不要な抽象化の導入、パフォーマンスの不安定さなどが指摘されていた。TechCrunchは、Devinが20のタスクのうち3つしか成功裏に完了できなかったという最近の評価にも言及している。
Cognition AIはこれらを「新しい技術における標準的な成長痛」と位置づけている可能性があるが、Devin 2.0がこれらの課題をどの程度克服できたかは、今後のユーザーからのフィードバックによって明らかになるだろう。AIによるコード生成は、依然としてセキュリティ脆弱性や論理的なバグを混入させやすいという一般的な課題も抱えている。
激化するAIコーディング支援市場での競争
Devinが登場した当初、その自律性の高さは画期的とされたが、この1年余りでAIコーディング支援ツール市場は急速に進化し、競合が多数登場している。
- GitHub Copilot: 当初はコード補完が中心だったが、自律性を高める機能を追加している。
- Amazon Q Developer: AWS環境との連携を強みとする。
- Codeium Windsurf: 自律型エージェント機能を提供する。
- Magic AI LTM-2-mini, Cursor: など、他にも多くのツールが存在する。
これらの競合の多くは、無料プランや低価格プランを提供しており、Devin 2.0が$20からのプランを導入したとはいえ、価格競争は依然として厳しい。特にGitHub CopilotやAmazon Q Developerなどは、既存の開発エコシステムとの統合も進んでおり、強力なライバルである。
Devin 2.0は、大幅な価格改定と新機能の投入により、初期の「バイラルな勢い(viral mojo)」を取り戻し、エンタープライズ市場への浸透を加速させたい考えだろう。しかし、競合も同様に進化を続けており、AIソフトウェアエンジニアリングの分野は今後も激しい競争が続くと予想される。Devin 2.0が開発者からの支持を再び集め、市場での地位を確立できるか、今後の動向が注目される。
Sources
- Cognition: Devin 2.0
- via TechCrunch: Devin, the viral coding AI agent, gets a new pay-as-you-go plan