實錘!村上春樹、史蒂芬·金盜版書成訓練資料,AI 巨頭無一幸免
原創 芯芯 極客公園
作者 | 芯芯
編輯 | 靖宇
為了訓練大型語言模型,OpenAI、Meta、谷歌、微軟等公司未經許可,從網際網路上收割了數百萬受版權保護的作品。
如今,OpenAI 目前正面臨大量的官司,原告稱該公司訓練資料集中的大多數書籍來自盜版來源和非授權網站。一旦被判侵權,公司有可能将面臨巨額罰款或重構算法的局面。這也導緻,如今 AI 公司越來越不願意分享 AI 訓練資料的詳細資訊。
實錘!村上春樹、史蒂芬·金盜版書成訓練資料,AI 巨頭無一幸免
原創 芯芯 極客公園
作者 | 芯芯
編輯 | 靖宇
為了訓練大型語言模型,OpenAI、Meta、谷歌、微軟等公司未經許可,從網際網路上收割了數百萬受版權保護的作品。
如今,OpenAI 目前正面臨大量的官司,原告稱該公司訓練資料集中的大多數書籍來自盜版來源和非授權網站。一旦被判侵權,公司有可能将面臨巨額罰款或重構算法的局面。這也導緻,如今 AI 公司越來越不願意分享 AI 訓練資料的詳細資訊。