作者/ IT時(shí)報(bào)記者 孫妍
編輯/ 錢(qián)立富 孫妍
3月16日,李彥宏攜百度文心一言亮相,并宣布開(kāi)放邀請(qǐng)測(cè)試。
雖然文心一言的能力受到了質(zhì)疑,但毋庸置疑的是,百度是全球第一個(gè)挑戰(zhàn)ChatGPT的大廠。李彥宏也已經(jīng)預(yù)見(jiàn),文心一言在與ChatGPT正面比較時(shí)會(huì)令大眾失望,但百度認(rèn)為,文心一言有兩大優(yōu)勢(shì):一是,畫(huà)圖、寫(xiě)長(zhǎng)文、文字轉(zhuǎn)視頻等多模態(tài)生態(tài)能力是ChatGPT所不具備的;二是,文心一言具備中文理解能力優(yōu)勢(shì)。
但是,百度自詡的優(yōu)勢(shì)也許會(huì)成為文心一言所面臨的大問(wèn)題。近日,有網(wǎng)友在對(duì)百度文心一言AI作畫(huà)功能進(jìn)行大量測(cè)試后產(chǎn)生懷疑,認(rèn)為其可能只是一個(gè)套殼的AI模型,先將用戶的中文指令翻譯成英文,然后用國(guó)外開(kāi)源的AI模型生成作品。百度方面針對(duì)此回應(yīng)表示,文心一言完全是百度自研的大語(yǔ)言模型,文生圖能力來(lái)自文心跨模態(tài)大模型ERNIE-ViLG。
不過(guò)《IT時(shí)報(bào)》記者發(fā)現(xiàn),百度低調(diào)向百家號(hào)入駐作者開(kāi)放的AI圖文轉(zhuǎn)視頻功能存在版權(quán)風(fēng)險(xiǎn):百度視頻素材來(lái)源不明。但這一風(fēng)險(xiǎn)被轉(zhuǎn)嫁至媒體及其他百家號(hào)作者,若被告侵權(quán),作者將承擔(dān)巨大的版權(quán)風(fēng)險(xiǎn)。截至發(fā)稿,百度沒(méi)有對(duì)文心一言版權(quán)問(wèn)題進(jìn)行回復(fù)。
百度即將在今天(3月27日)上線文心一言云服務(wù),屆時(shí),AI寫(xiě)作、AI作圖、AI文字生成視頻等功能都有可能對(duì)外開(kāi)放,這些危險(xiǎn)的AI生成作品,也許會(huì)把百度席卷至版權(quán)風(fēng)暴之中。
AI視頻潛藏版權(quán)風(fēng)險(xiǎn)
《IT時(shí)報(bào)》記者實(shí)測(cè)比較百度文心一言和微軟必應(yīng)ChatGPT后發(fā)現(xiàn),文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算方面仍有較大的追趕空間。但正如李彥宏所言,百度文心一言的優(yōu)勢(shì)在中文理解和多模態(tài)生成能力。
李彥宏表示,文心一言目前版本已經(jīng)能生成文字、圖片和語(yǔ)音。生成視頻因?yàn)槌杀颈容^高,還沒(méi)有對(duì)所有用戶開(kāi)放,未來(lái)百度會(huì)逐步接入。但熟悉百家號(hào)創(chuàng)作的用戶,不少都已經(jīng)體驗(yàn)過(guò)這個(gè)功能,每天有幾萬(wàn)篇文章通過(guò)這個(gè)能力轉(zhuǎn)成視頻內(nèi)容在百度平臺(tái)分發(fā)。
但是,巨大的版權(quán)風(fēng)險(xiǎn)正潛藏在這每天幾萬(wàn)條根據(jù)文字自動(dòng)生成的視頻中。
百度AI文字轉(zhuǎn)視頻功能早在2022年3月就已在百家號(hào)低調(diào)上線,百家號(hào)作者鮮少第一時(shí)間發(fā)現(xiàn),是因?yàn)檫@一功能是在發(fā)布文章時(shí)默認(rèn)勾選。在默認(rèn)勾選狀態(tài)下,百度AI會(huì)自動(dòng)根據(jù)文字內(nèi)容尋找合適的視頻素材,生成視頻后并自動(dòng)發(fā)布,其中文章配圖只占10%以內(nèi)的占比,其他視頻素材均來(lái)自百度視頻庫(kù)。
這是屬于文心一言AIGC(人工智能自主生成內(nèi)容)的TTV(文本內(nèi)容情感化分析)功能。危險(xiǎn)的是,百度并未公開(kāi)其AI視頻素材來(lái)源。多位百家號(hào)工作人員向《IT時(shí)報(bào)》記者表示,的確存在版權(quán)風(fēng)險(xiǎn),至于其視頻素材來(lái)源,一部分由百度進(jìn)行版權(quán)采買(mǎi),一部分是公開(kāi)CC0(放棄版權(quán))素材,建議不發(fā)到百度站外,或關(guān)閉該功能。
目前,這些AI視頻主要自動(dòng)發(fā)布在百家號(hào)及百度好看視頻平臺(tái),但可以下載。“如果在百度平臺(tái)內(nèi),可能由百度來(lái)處理版權(quán)糾紛,但目前還沒(méi)了解到有什么版權(quán)侵權(quán)的案例。”百度百家號(hào)工作人員向《IT時(shí)報(bào)》記者透露。
但在社交平臺(tái)上,多名百家號(hào)作者表示,AI根據(jù)其文章自動(dòng)生成的視頻被投訴侵權(quán),其賬號(hào)信用分被扣至0分而被封禁。還有百家號(hào)作者表示,AI自動(dòng)生成視頻中疑似含有版權(quán)水印。
《IT時(shí)報(bào)》記者發(fā)現(xiàn),百度AI視頻庫(kù)里還有不少電視臺(tái)等媒體拍攝視頻,但無(wú)處查詢視頻素材出處。
百家號(hào)只在圖文轉(zhuǎn)視頻的相關(guān)權(quán)益說(shuō)明中提到,“如果您是原創(chuàng)視頻作者,那么您發(fā)布的圖文為原創(chuàng)時(shí),轉(zhuǎn)出的視頻會(huì)自動(dòng)聲明該視頻為原創(chuàng)視頻,并且視頻的閱讀收益歸您所有。”
截至發(fā)稿,百度沒(méi)有對(duì)文心一言AI視頻來(lái)源等問(wèn)題做出回復(fù)。
風(fēng)險(xiǎn)轉(zhuǎn)嫁至作者
更不合理的是,百度可以無(wú)償使用百家號(hào)作者上傳的內(nèi)容,又將版權(quán)風(fēng)險(xiǎn)轉(zhuǎn)嫁給百家號(hào)作者。
百家號(hào)在平臺(tái)服務(wù)協(xié)議9.7條中提到:“您使用百家號(hào)平臺(tái)服務(wù)上傳、發(fā)布或傳輸內(nèi)容即代表了您有權(quán)且同意在全世界范圍內(nèi),永久性地、不可撤銷(xiāo)地、免費(fèi)地授予百度及其關(guān)聯(lián)方對(duì)該內(nèi)容的存儲(chǔ)、使用、發(fā)布、復(fù)制、修改、改編、出版、翻譯、據(jù)以創(chuàng)作衍生作品、傳播、表演和展示等權(quán)利;將內(nèi)容的全部或部分編入其他任何形式的作品、媒體、技術(shù)中的權(quán)利;對(duì)您的上傳、發(fā)布的內(nèi)容進(jìn)行商業(yè)開(kāi)發(fā)的權(quán)利……以及再授權(quán)給其他第三方以上述方式使用的權(quán)利。”
據(jù)此協(xié)議理解,百度有權(quán)使用百家號(hào)A作者上傳的文字、圖片、視頻等內(nèi)容,編入B作者的作品中,甚至用于商業(yè)用途,完全不需要得到A作者的授權(quán),也不需要付費(fèi)給A作者。
《IT時(shí)報(bào)》記者查詢抖音及其他新聞媒體平臺(tái)與作者簽訂的協(xié)議發(fā)現(xiàn),并沒(méi)有存在如百度百家號(hào)這般不合理的條款。
上海大邦律師事務(wù)所高級(jí)合伙人、知識(shí)產(chǎn)權(quán)律師游云庭解讀認(rèn)為,如果上述條款有效,那百度就可以使用這些視頻素材,不構(gòu)成侵權(quán)也無(wú)須支付對(duì)價(jià),如果該條款被法院認(rèn)定為無(wú)效,則百度對(duì)外使用就構(gòu)成侵權(quán)。
而當(dāng)該條款遇上AI生成內(nèi)容,潛藏的版權(quán)風(fēng)險(xiǎn)將對(duì)百家號(hào)作者更加不利。游云庭認(rèn)為,文字內(nèi)容是媒體創(chuàng)作的,百度只是提供了技術(shù)服務(wù),因?yàn)锳I生成的視頻是無(wú)權(quán)享受著作權(quán)的,所以知識(shí)產(chǎn)權(quán)應(yīng)該歸媒體所有。媒體發(fā)布的視頻,對(duì)外應(yīng)該由媒體承擔(dān)責(zé)任,如果權(quán)利人起訴媒體就是媒體承擔(dān)責(zé)任,如果權(quán)利人起訴雙方共同侵權(quán),則構(gòu)成連帶侵權(quán)責(zé)任。
“由百度提供模型,素材庫(kù)按照百度的合同規(guī)則使用的情況下,發(fā)生侵權(quán)可能責(zé)任是百度的。這當(dāng)中任何一個(gè)節(jié)點(diǎn)發(fā)生變化,可能就是使用者的責(zé)任或者共同責(zé)任。這里面變量很多,要看具體細(xì)節(jié)。判斷依據(jù)是人工智能生成品是不是侵權(quán),模型數(shù)據(jù)提供者和使用者有沒(méi)有過(guò)錯(cuò)等。”上海段和段律師事務(wù)所合伙人劉春泉認(rèn)為,人工智能生成品有沒(méi)有版權(quán)?與責(zé)任風(fēng)險(xiǎn)由誰(shuí)承擔(dān)?應(yīng)該按照權(quán)利義務(wù)相一致原則來(lái)處理。純粹人工智能生成品與動(dòng)物按快門(mén)拍照片和大象畫(huà)畫(huà)一樣沒(méi)有版權(quán)。但是人利用AI作為工具制作的產(chǎn)品,符合法律規(guī)定的構(gòu)成作品,可以受保護(hù)。
制作1條AI視頻最低9.99元
《IT時(shí)報(bào)》記者發(fā)現(xiàn),百度已經(jīng)在進(jìn)行文心一言的商業(yè)化嘗試,而上述AI文字轉(zhuǎn)視頻的服務(wù)正是文心一言云服務(wù)的主要盈利點(diǎn)。
目前,百度大腦智能創(chuàng)作平臺(tái)推出了兩種會(huì)員套餐,視頻創(chuàng)作會(huì)員1698元/月,智能寫(xiě)作會(huì)員198元/月。其中,視頻創(chuàng)作會(huì)員的權(quán)益就包括每月50次圖文轉(zhuǎn)視頻等。此外,圖文轉(zhuǎn)視頻200條的報(bào)價(jià)是1998元,50條的報(bào)價(jià)是698元,20條的報(bào)價(jià)是298元,也就是說(shuō),1條圖文轉(zhuǎn)視頻的價(jià)格最低是9.99元。
“目前不管是API還是線上售賣(mài)的套餐,我們都沒(méi)接入素材庫(kù)。”百度云客戶經(jīng)理沒(méi)有正面回答文字轉(zhuǎn)視頻素材來(lái)源的問(wèn)題,但就AI生成圖片的版權(quán)問(wèn)題回復(fù)表示:“AI生成內(nèi)容的可版權(quán)性在法律上仍處于不確定狀態(tài),百度不限制您將生成圖片用于商業(yè)用途,但您應(yīng)確保自身使用行為的合法合規(guī)性,在享有生成圖片使用權(quán)益的同時(shí),自行承擔(dān)使用生成圖片的一切后果。”
截至3月27日,百度大腦智能創(chuàng)作平臺(tái)顯示,其自動(dòng)創(chuàng)作文章已超200萬(wàn)篇,自動(dòng)創(chuàng)作短視頻已超15萬(wàn)條。
風(fēng)口上的百度急了
“現(xiàn)在百度最卷的部門(mén)已經(jīng)不是自動(dòng)駕駛了,而是文心一言。”一位百度自動(dòng)駕駛部門(mén)的員工說(shuō)道。
基于20多年搜索業(yè)務(wù)的積累,百度建立起世界上最大的知識(shí)圖譜,包含50億實(shí)體、5500億級(jí)事實(shí),每天調(diào)用量超過(guò)400億次。受益于百度知識(shí)圖譜,文心大模型也成為全球首個(gè)知識(shí)增強(qiáng)千億級(jí)大模型。研究表明,數(shù)據(jù)達(dá)到千億級(jí),大模型就可能發(fā)生“智能涌現(xiàn)”,但最快跑出ChatGPT的為什么不是百度?
過(guò)去10年,百度在AI領(lǐng)域投入超1100億元的研發(fā)費(fèi)用,2019年就推出了文心大模型ERNIE 1.0。論起步時(shí)間,文心一言并不比ChatGPT晚,但論專注度,百度沒(méi)有OpenAI聚焦。此前百度之前一直將最大的精力投向了自動(dòng)駕駛,以及一系列的AI風(fēng)口追逐,當(dāng)初希壤也讓百度爭(zhēng)得了國(guó)內(nèi)元宇宙“頭號(hào)玩家”等名號(hào)。
“百度的主要收入還是搜索廣告,這也是百度為什么著急做文心一言的原因之一。”一位百度昆侖芯的員工認(rèn)為。
ChatGPT焦慮已經(jīng)是業(yè)內(nèi)的常態(tài)。
國(guó)內(nèi)ChatGPT模型跟OpenAI的差距到底在哪里?“算法上還有細(xì)節(jié)要打磨,其次,高質(zhì)量的文本數(shù)據(jù)還需要多積累。”一家研發(fā)GPT模型公司CEO對(duì)《IT時(shí)報(bào)》記者道出了多數(shù)國(guó)內(nèi)ChatGPT從業(yè)者的現(xiàn)實(shí)和心態(tài),“類ChatGPT的產(chǎn)品可能有版權(quán)上的顧慮,但先把技術(shù)用起來(lái),以后再想辦法更好地規(guī)范。”
不過(guò),也有一家國(guó)內(nèi)AI大廠的相關(guān)人士對(duì)《IT時(shí)報(bào)》記者表示,目前已跑出AI作圖等ChatGPT大模型,但是主要考慮到版權(quán)等風(fēng)險(xiǎn),沒(méi)有快速上線。
AI版權(quán)風(fēng)暴即將來(lái)襲
最近,網(wǎng)易旗下輕博客社區(qū)LOFTER上的大量創(chuàng)作者刪檔銷(xiāo)號(hào),退出平臺(tái),用行動(dòng)抵制AI作畫(huà)。起因是網(wǎng)易LOFTER上線AI作畫(huà)功能“老福鴿畫(huà)畫(huà)機(jī)”,部分創(chuàng)作者認(rèn)為該功能可能用到原創(chuàng)作者的畫(huà)作,有侵犯版權(quán)之嫌。
對(duì)此,網(wǎng)易LOFTER強(qiáng)調(diào)“該功能訓(xùn)練集來(lái)自于開(kāi)源,沒(méi)有使用LOFTER用戶的作品數(shù)據(jù),并明確注明不得用于商業(yè)用途”。3月16日,網(wǎng)易LOFTER官微向創(chuàng)作者發(fā)出一份公開(kāi)致歉信,為傷害了很多創(chuàng)作者而表達(dá)歉意。該AI作畫(huà)功能已于3月8日下線,網(wǎng)易LOFTER單獨(dú)設(shè)立的“AI內(nèi)容冒充原創(chuàng)”反侵權(quán)投訴渠道,截至3月25日收到1148條舉報(bào)投訴。
在國(guó)外,AI侵權(quán)問(wèn)題已經(jīng)引起社會(huì)關(guān)注。近日,《華爾街日?qǐng)?bào)》等多家國(guó)外主流新聞媒體指控OpenAI及其聊天機(jī)器人模型ChatGPT未經(jīng)許可使用新聞來(lái)源進(jìn)行訓(xùn)練,并拒絕向媒體支付相關(guān)費(fèi)用。
早在2022年,一名程序員起訴GitHub、微軟和OpenAI,指控GitHub Copilot的AI編程工具抄襲代碼。今年1月,一群藝術(shù)家起訴AI繪畫(huà)Stability AI Ltd.、Midjourney Inc.和DeviantArt Inc.,聲稱這些公司下載并使用了數(shù)十億張受版權(quán)保護(hù)的圖像,但沒(méi)有獲得藝術(shù)家的授權(quán)并對(duì)其進(jìn)行補(bǔ)償。
一場(chǎng)AIGC的版權(quán)風(fēng)暴正在來(lái)襲。
2月15日,愛(ài)奇藝宣布將全面接入百度文心一言,雙方將共同探索AIGC在內(nèi)容搜索、內(nèi)容宣發(fā)、內(nèi)容創(chuàng)作工具、小說(shuō)創(chuàng)作等業(yè)務(wù)上的應(yīng)用。近期,文心一言開(kāi)發(fā)的AI文檔寫(xiě)作助手也將上線百度文庫(kù),作者只要輸入主題及內(nèi)容要求,AI寫(xiě)作助手就能幫助搜集資料、搭建框架、填充內(nèi)容、理順文檔、制造亮點(diǎn),最終生成范文。
李彥宏認(rèn)為,多模態(tài)生成能力是ChatGPT不具備的能力,這是文心一言的優(yōu)勢(shì)。但是,百度一旦開(kāi)放AI寫(xiě)作、AI作圖、AI文字生成視頻等,受到的版權(quán)類指控并不會(huì)比ChatGPT少。訓(xùn)練數(shù)據(jù)是否得到授權(quán),AI生成作品是否涉嫌侵權(quán)等問(wèn)題會(huì)接踵而至。
關(guān)于AI生成內(nèi)容的版權(quán)問(wèn)題正在業(yè)內(nèi)掀起大討論。
知識(shí)產(chǎn)權(quán)界絕大多數(shù)專家都認(rèn)為,AI生成內(nèi)容是不受版權(quán)保護(hù)的。中國(guó)社會(huì)科學(xué)院知識(shí)產(chǎn)權(quán)中心主任李明德認(rèn)為,《著作權(quán)法》只保護(hù)人的作品,AI生成的內(nèi)容不是作品,沒(méi)有版權(quán)。只有個(gè)人使用存在免責(zé)情況,公司拿媒體的作品去訓(xùn)練AI,但沒(méi)有拿到媒體的授權(quán),就構(gòu)成侵權(quán),文字三四行就能構(gòu)成作品,視頻每一幀都是作品。
(聲明:本文僅代表作者觀點(diǎn),不代表新浪網(wǎng)立場(chǎng)。)