8月16日,人工智能領域科技公司秘塔AI發布了一篇名為《完蛋!我們收到了知網28頁的侵權告知函》的文章,透露秘塔收到了來自《中國學術期刊(光盤版)》電子雜誌社有限公司(即知網)長達28頁的侵權告知函。
知網發送侵權告知函
秘塔AI回應:隻收錄了文獻摘要和題錄,未收錄正文
秘塔旗下主要的搜索產品秘塔AI搜索為一個人工智能搜索引擎,相較於其他的AI搜索引擎,其亮點在於可以進行專業學術方麵的文獻搜索整理。該應用由螞蟻集團領投、光速光合跟投,投後估值達1.5億美元,因使用簡單沒有廣告,可以直接了當的給出答案獲得用戶的喜愛,近期熱度頗高,據similarweb數據,2024年3月,秘塔AI搜索網站日均訪問量達到20萬次以上,月增速達551.35%。
秘塔AI透露的告知函中顯示,知網方麵發現秘塔科技向用戶提供知網的學術文獻題錄及摘要數據,且數量巨大,知網認為此行為未經同意,嚴重侵犯了知網的合法權益,要求秘塔立即停止再搜索服務中提供知網學術文獻題錄及摘要數據,知網方麵還表示不希望中國知網被秘塔科技搜索到,要求秘塔斷開搜索結果到知網的鏈接,如果需要商務合作請與知網聯係。
秘塔AI方麵回應,依照學術規範,文獻的摘要和題錄應具有獨立性和自明性,能夠使讀者不閱讀全文就能獲得必要的信息。秘塔AI搜索的“學術”版塊僅收錄了論文的文獻摘要和題錄,並未收錄文章內容本身,閱讀正文需通過來源鏈接跳轉至網站獲取。秘塔AI表示“即便不理解,但我們也尊重知網的選擇,從即日起,秘塔AI搜索將不再收錄知網文獻的題錄及摘要數據,轉而收錄其他中英文權威知識庫的文獻題錄及摘要數據。”8月19日秘塔AI透露,現在已經有其他的知識庫來聯係他們進行合作。
記者在秘塔AI進行了學術搜索,搜索引擎給出了一個簡要的經過整理的回答,其中標注了引用的文獻來源,搜索結果還包括了幾十篇參考文獻,在秘塔AI中可以閱覽文獻的摘要部分,若要查看原文則跳需轉至萬方數據等知識服務平台,當前在秘塔AI中已不會搜索到來自中國知網的內容。
知網有權要求秘塔斷開鏈接嗎?
對於這一事件網友們各有看法,一些網友認為知網“格局太小”,知網上的文獻摘要是對所有用戶開放的,用戶可以免費閱讀,也可以複製粘貼,本身就是公開的內容,知識共享當然可行。但也有網友認為知網不希望自己被秘塔AI搜索到也可以理解,認為即便是公開的數據要抓取也應當獲得對方的同意,知網有權拒絕被搜索。
知網有權要求秘塔斷開鏈接嗎?上海大邦律師事務所高級合夥人,知識產權律師遊雲庭認為其核心在於看知網訴求有沒有法律上的正當性,人工智能是新生事物,對版權內容的使用存在一定的合規瑕疵,如果知網以此為由要求斷開鏈接的,會有一定合理性,但也不能直接認定秘塔AI就是侵權了知網。
首先知網無權主張秘塔訓練版權侵權,“如果秘塔使用了知網上的論文進行了人工智能訓練,知網不一定有權主張版權侵權。因為論文的作者投稿某雜誌,雜誌刊登後,文章的版權可能是作者的,也可能是作者授權給了雜誌,知網站內的多數論文雖然被收錄,但知網擁有這是雜誌社或作者授權的信息網絡傳播權,如果該論文被用於訓練,訓練涉及的版權是著作權法規定的複製權和著作權其他權利,並不侵犯知網的信息網絡傳播權。如果知網可以證明秘塔的係統抓取其網站大量論文並進行批量訓練的,則可以主張訓練行為涉嫌侵權其整體數據權利,構成不正當競爭。”
不過,遊雲庭指出擬合可能導致輸出結果侵權,“不同於普通的搜索引擎,秘塔的搜索是人工智能的問答式引擎,其結果會整合很多篇新聞、文章、論文,多數情況下,這種整合後輸出的結果構成合理使用,法律依據是我國著作權法規定的,為介紹、評論某一作品或者說明某一問題,在作品中適當引用他人已發表作品的構成合理使用。但少部分情況下,人工智能會因為訓練技術問題出現過擬合,導致輸出的結果內容和訓練內容一致,如果出現搜索結果抄襲知網論文,或者秘塔製做索引數據庫、或者向用戶提供論文pdf的在線閱讀功能的情況,都是侵犯信息網絡傳播權的行為,如果知網據此要求秘塔斷開鏈接的,那我認為是正當的。”
對於知網的告知函中提及的秘塔向用戶提供了知網的學術文獻題錄及摘要數據涉嫌侵權一說,遊雲庭認為抓取學術文獻題錄和文獻摘要數據不一定構成了侵權,“網頁不同於論文,知網的學術文獻題錄(標題、作者、發表年份、期刊卷號、期號、頁碼以及摘要)及摘要網頁都是國內用戶公開可以訪問的,知網作為在中國境內中文學術文獻網絡數據庫服務市場具有支配地位的經營者,其不允許秘塔搜索抓取這兩部分公開信息需要有合理的理由。”
揚子晚報|紫牛新聞記者 沈昭
校對 徐珩