人気のオープンソースメディアプレーヤー「VLC」が世界累計60億ダウンロードを達成し、新たにAIを活用したリアルタイム字幕生成機能を発表した。VideoLAN社は米ラスベガスで開催中のCES 2025において、ローカル環境で動作する次世代機能をデモ展示している。
60億ダウンロード達成の意義
VideoLAN社のPresident Jean-Baptiste Kempf氏は、「ストリーミングサービス全盛の時代にあっても、VLCのアクティブユーザー数は実際に増加している」と述べている。1996年にパリ中央理工科大学(École Centrale Paris)の学生プロジェクトとして始まったVLCは、キャンパス内での動画ストリーミングを目的として開発された。
注目すべきは、多くのオープンソースプロジェクトが寄付のみでの運営に苦心する中、VLCは広告表示やデータ収集、商業的な収益モデルを導入することなく、無料でのサービス提供を継続している点である。ただし、専門家らは60億というダウンロード数について、VideoLAN社の公式サイトからのダウンロードのみを計測している可能性を指摘しており、サードパーティのホスティングサービスを含めると、実際の数字はさらに大きくなる可能性がある。
革新的なAI字幕生成機能
CESで披露された新機能の目玉は、オープンソースAIモデルを使用したリアルタイム字幕生成システムだ。この機能の特徴は、クラウドサービスに依存せず、ユーザーのデバイス上でローカルに動作する点にある。VideoLAN社によると、100言語以上での字幕生成と翻訳に対応予定という。
VideoLANのChief Marketing OfficerであるNatacha Holtzhausser氏は、「この革新は単なる字幕機能の追加ではなく、グローバルなコンテンツ消費の方法を豊かにする包括的な取り組みである」と説明している。
AI字幕生成機能は、これまでプラグインとして開発されてきたOpenAIのWhisper音声認識システムとは異なり、VLCアプリケーションに直接組み込まれる形で実装される。これにより、インターネット接続なしでの字幕生成が可能となる。
ただし、専門家らからは、ローカル環境でのAIモデル実行に必要なシステム要件や、Neural Processing Unit(NPU)の必要性について懸念の声も上がっている。また、AI生成字幕の精度や、人間が作成した字幕との品質差についても議論が続いている。
最新バージョン3.0.21は2024年10月にリリースされているが、新機能の一般提供時期については現時点で明らかにされていない。VideoLAN社は、詳細について今後ブログで発表する予定としている。
Sources
Meta Description
人気メディアプレーヤーVLCが世界60億ダウンロードを達成。CES 2025でAI搭載のローカル実行型リアルタイム字幕生成機能をデモ展示。100言語以上の対応予定で、オフラインでも利用可能。
コメント