社交媒體平臺Reddit近日對人工智能公司Perplexity及其他相關企業(yè)提起訴訟,指控其未經(jīng)授權抓取網(wǎng)站數(shù)據(jù)用于人工智能模型訓練。這起案件凸顯了當前AI行業(yè)在訓練數(shù)據(jù)獲取方式上存在的法律爭議。

根據(jù)向紐約聯(lián)邦法院提交的訴狀,Reddit將Perplexity AI、Oxylabs UAB、AWMProxy以及SerpApi四家公司列為被告。訴狀指出,這些公司通過技術手段繞過網(wǎng)站防護措施,擅自獲取Reddit平臺上的用戶評論和對話內(nèi)容。Reddit在聲明中強調,其平臺作為全球規(guī)模最大、內(nèi)容最活躍的人類對話數(shù)據(jù)庫之一,已成為數(shù)據(jù)抓取行為的主要目標。
被告方對相關指控予以否認。Perplexity在回應中表示,其數(shù)據(jù)處理方式始終秉持原則且具有社會責任感,致力于通過人工智能技術為用戶提供真實準確的信息服務。該公司強調將堅決維護公眾自由獲取公共知識的權利。與此同時,Oxylabs則提出異議,認為任何企業(yè)都不應對公共數(shù)據(jù)形成壟斷,暗示部分企業(yè)可能通過控制數(shù)據(jù)資源謀取不當利益。
值得關注的是,Reddit在訴訟文件中將數(shù)據(jù)抓取行為形象比喻為“無法進入金庫,轉而搶劫運輸車隊”。據(jù)悉,部分涉事公司通過規(guī)避谷歌安全防護并利用搜索引擎記錄的方式實施數(shù)據(jù)抓取。與此形成對比的是,谷歌和OpenAI已與Reddit達成正式數(shù)據(jù)使用協(xié)議,其中谷歌每年需支付6000萬美元獲取數(shù)據(jù)訪問權限。這一巨額費用也讓業(yè)界關注到合法數(shù)據(jù)獲取的成本門檻。
需要指出的是,這已是Reddit今年內(nèi)第二次就類似事由提起訴訟。今年6月,該平臺曾對人工智能公司Anthropic提起過相關訴訟。這一系列法律行動反映出內(nèi)容平臺與AI技術公司在數(shù)據(jù)使用權方面的矛盾正日益凸顯。





























浙公網(wǎng)安備 33010502007447號