Tech Product

Whisper

Overview

Whisperは、OpenAIによって開発された汎用的な音声認識モデルです。ウェブから収集された68万時間分もの多言語・多タスクの教師ありデータで学習されており、音声の文字起こしや翻訳において高い精度を誇ります。YouTube動画の音声データなどを活用して学習されたことが報じられています。

Mentioned Articles

4 件

External Mentions

10 件