OpenAI、NYTが意図的にプロンプト操作し学習データの逆流に見せたと反論
2024年1月14日 16:33
The New York Times (NYT) は大規模言語モデル (LLM) の学習にコンテンツが無断使用されたとして Microsoft と OpenAI を提訴したが、これに OpenAI が反論している(OpenAI のブログ記事、The Verge の記事、Neowin の記事)。
訴状で NYT は Microsoft と OpenAI が LLM に学習させるためにコンテンツを無断使用したほか、従来のサーチエンジンによるものより大幅に長く、詳細な記事サマリーを許可なく Bing に掲載しているにもかかわらず、フェアユースだと主張してライセンス契約に応じなかったと主張している。
しかし、OpenAI は NYT との提携に向けた話し合いが進んでいるつもりでいたといい、提訴に驚き、落胆したとのこと。NYT は具体例を示さずに学習コンテンツから生成コンテンツへの逆流がみられると言及していたが、このようなコンテンツは古く、複数のサードパーティーサイトに転載されたもののようだと OpenAI は指摘する。
また、NYT がプロンプトに記事の長い引用を含めるなど、逆流させるために意図的なプロンプト操作を行ったのではないかとも指摘している。それでも OpenAI のモデルは NYT が示唆するようには動作しない。そのため、NYT がモデルに逆流させるよう指示したか、多数の試行結果から都合のいいものを抜き出したとみられるとのことだ。