AI繪畫大熱 商業化落地難題待解

AI繪畫大熱 商業化落地難題待解
2022年12月22日 01:17 第一財經

個人養老金正式實施,36個城市試點,23家銀行可以開戶,您會參與嗎?40家基金公司的129只產品,您中意哪只?歡迎參與調查! [點擊進入活動頁面]

  作者: 呂倩 樊雪寒

  [ 今年10月,Stable Diffusion背后的公司Stability AI宣布獲得1.01億美元融資,估值達10億美元。 ]

  今年夏天,并無繪畫基礎的游戲設計師杰森·艾倫(Jason Allen)通過AI繪圖工具Midjourney,生成一幅AI畫作《太空歌劇院》,并獲得美國科羅拉多州新興數字藝術家競賽一等獎。同時,《太空歌劇院》及其背后一眾類似的AI畫作引發畫家群體集體抗議維權。

  因AI繪畫屬于AIGC分支之一,熱潮與爭議之中,2022年也被稱為“AIGC元年”。但在更早前,包括NVIDIA、Google等廠商均已發布相關技術成品。相較于AIGC在C端的熱度,B端的具體落地與商業化應用場景更值得關注。目前來看,AI繪畫仍面臨版權與倫理、商業化變現等難題。

  技術拉低AIGC創作門檻

  所謂AIGC,既是一種內容分類方式、內容生產方式,也是用于內容自動化生成的一類技術集合。其全稱為 Al-Generated Content,指基于生成對抗網絡 GAN、大型預訓練模型等人工智能技術,通過已有數據尋找規律,并通過適當的泛化能力生成相關內容的生產方式。

  投資機構a16z將內容生態發展分為四個階段:專家生成內容(ProfessionallyGenerated Content,PGC)、用戶生成內容(User-Generated Content,UGC)、AI 輔助生產內容(AI-assisted Generated Content)及 AI生成內容(AI-Generated Content,AIGC)。目前行業主要處于一、二階段為主,第三階段為輔的狀態。

  不論是AI繪畫還是近期剛火的ChatGPT,都是AI技術在逐漸深化進入每個人的生活。在量子位MEET2023智能未來大會上,阿里巴巴集團副總裁賈揚清表示,今天行業講AI,繞不過去的話題就是AIGC的大爆發,包括Stable Diffusion以及ChatGPT。前者是一個基于Latent Diffusion Models(潛在擴散模型,LDMs)的文圖生成(text-to-image)模型,也正是如今被諸多畫家批判版權問題,但同時又降低了無過濾圖像生成門檻的平臺。

  如果溯源的話,賈揚清稱,用統計和AI方法實現內容的創作和生成這個方式,經歷了很長的階段。往回數到1999年,艾佛斯教授提出的基本邏輯是用一個簡單的計算機視覺統計方式,就可以通過一個非常小的圖片來學習紋理,生成內容,這可以說是AIGC的雛形。

  2015年前后,賈揚清稱,行業很風靡的技術是神經風格遷移,能夠從畫作當中學習繪畫風格,將一些原始圖片合成為相應風格的作品,如將梵高的《星空》等,生成更加豐富的內容。從開始的1999年的計算機視覺統計方式,到今天更加強語意的AI創作,這些變化都在不斷催生行業去考慮更有意思的領域。

  國際科技巨頭逐漸在AIGC領域現身是在21世紀初。2012年,微軟公開展示了一個全自動同聲傳譯系統,基于深層神經網絡(Deep Neural Network,DNN)可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。

  2019年,隨著生成式對抗網絡技術(Generative Adversarial Network,GAN)逐漸成熟,AIGC技術研究迎來關鍵拐點,DeepMind 發布了DVD-GAN模型用以生成連續視頻。

  同時在2022年,所謂的行業元年,AIGC逐漸破圈,技術上,擴散生成模型得到廣泛研究與應用,文本生成圖像模型可準確把握文本信息進行創作。商業化基礎也已初步具備,國內外互聯網巨頭和獨角獸紛紛下場。

  國外如Open AI 更新了DALL-E-2,可創作出相應極高質量的卡通、寫實,抽象等風格的繪畫作品。今年9月,NVIDIA 推出AI繪畫軟件NVIDIA Canvas,通過GauGAN(生成性對抗網絡),可將寥寥幾筆的草圖變為景觀大片。近期,NVIDIA又推出一款低門檻文本生成3D模型Magic3D,無需建模經驗、無需特殊培訓,只需要40分鐘左右,該模型就能生成一個帶有色彩紋理的3D網格模型,經過調整后,模型未來可用于開發游戲或CGI藝術場景。

  據浙商證券研究所分析認為,真正將AIGC 創作最終推向平民化的,是 Stability AI 推出的 Stable Diffusion,個人電腦即可驅動,且幾個月內產出效果具有直觀的改善。隨后,AI 繪畫迅速在微博、小紅書、抖音等多平臺上掀起傳播聲勢。

  AI繪畫版權爭議何解

  除了《太空歌劇院》的意外獲獎,AI繪畫遭大批畫師抵制的現象也成為外界關注、熱議的重要原因。大批畫師已將“禁止投放作品進入AI繪畫系統”加入個人簡介,全球知名視覺藝術網站ArtStation的上千名畫師發起聯合抵制,禁止用戶將其畫作投放AI繪畫系統,ArtStation認為,任由系統學習模仿畫作是在侵犯版權。

  對于AI繪畫產生的畫作版權問題,Forrest 分析師盧冠男對第一財經記者表示,目前海外針對GitHub Copilot代碼生成服務的輸出內容,出現了潛在集體訴訟。另外大型人工智能模型的訓練過程會使用大量數據(包含代碼,文本和圖像)。由于很多數據是公開可訪問的,如GitHub的開源代碼,因此大模型的訓練數據中常常會包含這類數據,且通常這類數據來源也標注了許可證規則,明確說明如何在互聯網上二次傳播或以商用為目的傳播。

  但是,盧冠男稱,在AI模型利用這些數據訓練后,模型運行時所生成的所謂新數據,有可能出現和源數據具有高相似度的結果。對于這樣的結果是否違背了源數據自身的license范疇,目前還無法確定。特別是如果AI模型是在商用環境下產出這樣的具有爭議的結果,極易引起糾紛。

  上海君悅律師事務所陳怡然律師對記者表示,關于AI作品是否構成對其他人類作品的侵權,鑒于著作權侵權的認定原則主要是接觸+實質性相似,是否接觸需要綜合原始代碼和學習的參考圖進行判斷,而是否符合實質性相似需要具體判定AI圖和參考圖之間的相似度。所以需要具體案例具體分析。

  在行為主體方面,假如張三對于圖A擁有著作權,李四在未經允許的情況下將該圖提供給AI訓練,王五使用AI生成了一張類似的圖片B并進行營利性使用。陳律師表示在上述情境中,李四和王五均或可構成侵權,若此款AI的開發公司對圖片B聲明版權,那么公司也或可構成侵權。

  不過據了解,目前多數AI作圖工具傾向于提示用戶,由AI生成的畫作的版權屬于AI公司。“關于AI作畫的版權問題,其實已經完全超出了現有版權法的體系,如果真的有作者認為AI創作的作品對自己的作品構成侵權,由于AI學習的機制和邏輯不同,作者舉證和維權難度可以預見會遠高于一般侵權訴訟,業界普遍認為應當由AI公司承擔不侵權的注意義務及舉證責任,比如爬圖和學習的畫作僅限于公有領域的作品,如需學習版權保護期內的作品,應當向作者支付分成等。”陳怡然稱。

  針對目前AI畫作版權歸屬不明對行業的影響問題,盧冠男對記者表示,一方面會增加創新的門檻。企業如果想利用這類技術進行商業服務,就要在法務合規等方面做出額外的準備。這對于中小企業創新是一個潛在的隱性成本。另一方面會約束生成式AI的使用方式或場景。受制于To C提供服務時潛在的版權風險,企業可能更傾向于在To B場景中間接使用生成式AI的結果。比如通過其生成的圖像結果輔助設計師構圖,或通過其產出的代碼為軟件工程師提供代碼設計建議,從而做到規避其結果的風險,這也能推動生成式AI的發展。但在To C這一側的發展也許會受阻。

  B端商業化落地難題待解

  作為一項早期技術,AIGC的商業化、大規模擴展,以及倫理與法律等問題,仍是目前行業面臨的限制性因素。

  賈揚清認為,AI普惠有兩個重要支撐——一個是AI的工程化,一個是開源。著名教授RichardS. Sutton曾說過,此前七十年的AI研究,行業所得到的最大經驗和教訓是通過標準化的方式來使用大規模計算與通用算法。而大規模計算無論是通過原生方式還是通過更加高效的分布式計算方式等,都會讓開發到迭代的路徑變得更加簡單。另一個方面就是讓市場變得更大的開源。

  在這樣的趨勢下,賈揚清認為目前行業有幾個明顯的趨勢方向——第一是原始AI工程化平臺,第二是大規模端到端異構計算體系,以及通過算法與體系組合,實現更加智能的、貼近用戶需求的產品,最后通過算法的開源,助力AI在產業垂直化落地。

  至于說規模化之后的商業化問題,以Stable Diffusion和 Midjourney 這兩家代表性公司為例,二者都還未實現盈利。浙商證券研究所分析認為,AI繪畫商業化方面仍處于摸索階段,變現方式較為單一。用戶多為生成數量或者使用時間付費,常見付費方式為訂閱制或按次付費。

  比如Stable Diffusion 目前尚未形成明確的盈利模式,主要收費方式是首次注冊DreamStudio beta 將獲得價值2英鎊的積分,約為200次單張圖免費生成的額度。試用后可按10英鎊的增量購買額外的積分。但 Stability AI CEO認為其未來商業模式將類似紅帽和 MongoDB,將開源版本定位免費,通過商業版本實現盈利。今年10月,Stable Diffusion背后的公司Stability AI宣布獲得1.01億美元融資,估值達10億美元。

  相對而言,Midjourney 采用了訂閱制,新用戶可免費生成25張,之后對于個人用戶或公司年收入少于100萬美元的企業員工用戶,有兩個檔位的訂閱套餐可選。對于大公司客戶,單人一年收費約為600美元,生成的作品可以商用。

  整體而言,對于普通C端用戶來說,應用場景商業化性價較低,付費意愿有待提升。浙商證券研究所認為,行業未來B端變現路徑更為多元、成熟,若B端能挖掘出較為可行的商業模型,付費的可能性和水平相對更高。B端可能的收入方向包括:廣告、設計、營銷定制、動漫、游戲等行業。

  盧冠男也持有相似觀點,他對記者表示,現在行業還很難預測一個成熟的商業模式,暫時仍處于一個探索的過程。目前的行業商業變現探索主要體現在模型服務提供方和模型服務使用方。對于公開數據提供方和模型服務提供方之前是否會產生新的商業模式,仍然不清晰。

  另外對于To C的AI作畫服務,盧冠男認為,AI模型服務供應商需要確認其目前是基于哪些圖片數據庫實現的模型訓練,這些圖片是否能支持其商用范疇。服務商也應考慮設立投訴通道,在糾紛發生初期盡早控制損失;對于To B的AI作畫服務,供應商應考慮如何利用企業客戶自有版權的數據源,進行定制化訓練服務;對于提供公開可訪問的素材平臺,平臺方也要考慮更新線上作品的許可證條款,同時為平臺上的創作者提供建議,比如注明是否接受其作品被用作訓練數據等。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:李桐

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

7X24小時

  • 12-26 信達證券 601059 --
  • 12-26 百利天恒 688506 --
  • 12-21 佰維存儲 688525 13.99
  • 12-21 富樂德 301297 8.48
  • 12-21 佳合科技 872392 8
  • 產品入口: 新浪財經APP-股票-免費問股
    新浪首頁 語音播報 相關新聞 返回頂部