サイエンス
AIが人間の目標に沿って機能するようにする方法
理想的には、人工知能エージェントは人間を支援することを目指しているが、人間が相反することを望む場合、それはどういう意味を持つのだろうか。私の同僚と私は、人間のグループとAIエージェントの目標の一致度を測定する方法を考案し […]
別名: AIアラインメント
AIシステムが人間の意図や倫理的価値観に従って行動することを保証するための技術的・倫理的課題を指す。AIの能力が向上するにつれ、システムが予期せぬ方法で目標を達成しようとしたり、人間の利益に反する行動をとったりするリスクを回避することが重要視されている。単一の目標だけでなく、複数のステークホルダー間の利益相反をどう調整するかという点も議論の焦点となっている。