Term

DELEGATE-52

別名: デリゲート52

Overview

Microsoft Researchの研究チームが開発した、大規模言語モデル(LLM)によるドキュメント編集の正確性を評価するためのテストスイート。コーディング、結晶学、家系図、音楽記譜法など52の専門ドメインにわたる実世界のドキュメント環境をシミュレートする。バックトランスレーション(逆翻訳)の概念を応用し、前方編集と後方編集を繰り返すラウンドトリップ(往復)操作を通じて、モデルがどれだけ元の情報を維持できるかを定量的に測定する。

Mentioned Articles

2 件

External Mentions

2 件