首圖來源:pixabay
《紐約時報》對 OpenAI 和微軟發起了一起劃時代的訴訟,指控這些科技巨頭未經授權就使用其文章來訓練自家的 AI 模型,這起案件不僅可能影響新聞業的未來,還可能影響更廣泛的數位內容創造方式。這起訴訟將對一般大眾造成什麼影響?它會推動科技巨頭負起責任開發 AI 的新時代,還是會引發對資訊自由流通的更嚴格控制?
《紐約時報》指控其擁有版權的文章被用於訓練ChatGPT等大型語言模型的AI服務上,甚至創造出與《紐約時報》進行實質競爭的服務內容,卻未向原創內容擁有者支付任何費用。包括《紐約時報》和CNN在內的新聞機構已採取積極態度,對抗未經授權使用其內容的AI技術,它們嘗試去阻止OpenAI網路爬蟲GPTBot的程式,此舉突顯媒體行業對AI能大規模抓取數據的擔憂,OpenAI和微軟往往在未經版權所有者了解或同意的情況下進行。
這起訴訟凸顯了一個關鍵擔憂:訓練於其內容的AI工具不僅直接複製其文章,也可能錯誤的傳達資訊。這些AI工具對於新聞的正確性和新聞媒體的經濟收入構成直接威脅,AI自動生成與新聞媒體內容極其相似的內容,破壞了新聞媒體與其讀者之間的關係,導致潛在的訂閱、授權、廣告等收入損失。此外,像微軟的Bing更能「複製並加以分類」新聞內容,並產出比傳統搜尋引擎更完整、更詳細的回答。
訴訟的核心:合理使用原則
合理使用原則,是允許有限度地使用資料而不需許可,但只限用於評論、新聞報導、教學、學術研究等目的。然而,將合理使用原則應用於AI訓練,是否會違反版權,仍然有待法官判斷,目前也沒有明確針對此爭點的判決先例。這涉及評估使用的目的和方式、版權作品的性質、使用部分的數量,以及使用時對版權市場價值的影響等因素。
AI的支持者認為模型的訓練構成轉化性使用,意思是AI創造新作品,屬於具有新的表達、意義或資訊。然而,批評者則認為AI複製和傳播版權材料用於商業目的,而不提供擁有版權者補償,顯然會損害版權所有者的利益。
對於一般網路使用者則可能造成以下影響:
- 資訊取得的改變:像聊天機器人和搜尋引擎這樣的AI服務極度依賴大量資料庫,包括新聞文章,以提供準確和及時的資訊。如果訴訟導致限制AI可以使用的資料類型,這可能讓AI的知識變得不完整,進而降低用戶獲得的資訊多樣性與範圍。
- 使用成本:訴訟的結果可能影響AI服務的成本結構,如果OpenAI和微軟被要求支付他們用於AI訓練的版權費用,這可能增加AI產品和服務的成本,間接影響到用戶。例如,AI服務的訂閱費可能增加,或隨著公司在未經明確協議的情況下,需要更加謹慎使用新聞內容,創新的步伐將可能會放慢。
- 隱私權和假訊息:如果AI工具無法廣泛利用各種內容進行學習,它們可能轉向來源不那麼可靠的內容,增加假訊息的傳播。此外,隨著AI工具被訓練模仿像《紐約時報》這類可信來源的風格和內容,用戶可能越來越難以區分真實資訊和AI生成的內容,線上資訊的可信度將大打折扣。
如果AI可以合法取得和重新利用大量版權內容而不支付報酬,它也會大力打擊產出新聞內容的媒體營收。相反地,過於嚴格的限制則會扼殺對社會有益的技術創新。此案的結果將會為AI與版權法共存的方式形成判決先例,平衡創新需求與智慧財產權保護的需要。
這場法律戰將讓大眾思考,AI應該如何被用來增強新聞內容,而不損害新聞媒體的完整性或破壞其經濟基礎。此案該如何既保護內容創作者的權利、又確保一般網路用戶繼續從AI技術進步中受益,值得繼續關注。