來源:新智元
如果要評選AI圈兒的年度關鍵詞,GPT-3絕對榜上有名。
1750億個參數,比2019年發布的谷歌T5還翻了16倍,解鎖各項技能,和人類對話,無所不能。GPT-3正是AI崛起,突飛猛進的最佳例證。
然而,為了訓練它,Open AI可是花費了460萬美元。如果不是以API的方式開放給普通用戶使用,這個NLP神器可不是大家都能玩的起的。
而且,隨著模型參數和訓練數據越來越大,若算力跟不上,GPT-3根本「跑」不起來。
我們可以用petaflops/s-day這個單位來衡量算力,可以玩「變臉」的生成對抗網絡(GAN)大概需要3petaflop,目前全球第一快的超級計算機日本的富岳Fugaku ,每秒550petaflop;而GPT-3計算需求居然達到了3640petaflop。
算力,也就是數據的處理能力,與數據、算法,并稱為AI三要素。從GPT-3中可以見得,如果沒有強大的處理能力,模型的規模再大、再全面,也是紙上談兵。可以說,算力已經成為制約AI產業化發展的關鍵因素。
12月15日,權威分析機構IDC與浪潮聯合發布《2020-2021中國人工智能計算力發展評估報告》(以下簡稱《報告》)。
報告從AI算力產業發展趨勢、市場規模、區域算力分布和行業AI算力保有程度等多個角度進行全面綜合評估,旨在評估中國人工智能發展的現狀,為產業AI化提供極具價值的參考依據和行動建議。
此報告也是自2018年起連續第三年發布,已經逐漸成為AI領域內許多用戶、企業,甚至地方政府的權威參考。
逆勢強增長:37%持續增長,北京仍居中國AI城市首位
2020年,在數據大爆炸和算力、算法的極大提升下,中國AI資源迎來了爆發式的增長。
《報告》顯示,人工智能是全球IT產業發展最快的新興技術應用之一。
先來看一組數據,2020年,整個中國的人工智能市場規模是63億美元,據IDC預測,到2024年,這個數字將會達到172.2億美元。而且,雖然今年受到疫情影響,但中國AI整體市場仍然保持著37%的增長。
這個增長率有多驚人?
相比之下,2020年美國整個IT的支出同比在下降,整個AI算力等方面的支出基本和去年持平,沒有顯著增長,相對來說,中國增速37%屬于「逆境中生長」。與此同時,中國在全球AI市場的占比將從2020年的12.5%上升到2024年的15.6%。
全球來看,中國人工智能市場正處于穩步上升的狀態,而且會在世界AI市場占有越來越重要的地位。
而在中國AI城市之間,排名較過去兩年有了顯著的變化。
根據《報告》,2020年AI城市TOP5依次為北京、深圳、杭州、上海、重慶。
對比2018年,北京憑借百度,頭條等互聯網公司以及國家對AI的扶植,仍然保持在第一位。值得關注的是,與2019年相比,深圳超過杭州位居第二,而重慶也首次進入第一梯隊,西安超過南京位居第九。
IDC預測,到2021年,各地方政府將會加大對AI產業的投資30%以上。各個城市在自身產業優勢及各種因素推動下,AI應用取得了較大進展。例如東莞的智能制造、武漢的智慧醫療、合肥的智慧農業、重慶的人工智能課程等。
中國人工智能城市正利用自己的差異化優勢,為產業發展樹立標桿。
2020就快句號,未來的AI圈兒怎么走出感嘆號
未來人工智能算力發展的大方向是怎樣的?《報告》給出來了幾點重要趨勢:
首先,技術層面。
人工智能芯片將繼續呈現多樣性的發展,GPU依然是數據中心加速的首選,占有95%以上的市場份額;中國人工智能服務器將在未來五年保持高速增長,是整體服務器市場增長的核心驅動力;
提到算力時候大家常會提到是芯片,而算力的載體服務器也是近些年不得忽視的因素。前些年,深度學習之前發展緩慢,除了算法的原因外,很重要的一個原因是算力的不足,而解決計算力最重要的支撐是AI服務器。
在這里,國內頭部AI服務器廠商浪潮有著清晰的定位。多年來,浪潮一直專攻計算系統,打造了業內最強最全的AI服務器產品陣列。作為系統提供商,浪潮積極推動開放生態建設,AI服務器適配了寒武紀、燧原科技、英特爾等芯片產品,促進AI計算產業的協作共贏。
其次,是架構層面的趨勢。
AloT時代,日益增長的業務實時性需求使邊緣和端側的計算能力變得越來越重要,人工智能算力會逐漸向邊緣滲透,到2023年,將近20%用于處理AI工作負載的服務器將部署在邊緣側。
浪潮信息副總裁、浪潮AI&HPC產品線總經理劉軍表示,「現在的邊緣端大家做了一些部署的嘗試,做一些樣板,場景怎么打通,要更進一步讓邊緣進入批量化,大規模上業務,我們還是要解決額定功耗條件下盡可能去提升算力的核心問題。」
浪潮信息副總裁、浪潮AI&HPC產品線總經理劉軍
另外,AIaaS也會成為人工智能市場發展的重要驅動力,《報告》預測,其2018至2024年的年復合增長率預計將達到93.6%,同時,AI基準測試也會逐步完善,MLperf、SPEC ML、AI-Rank等權威基準測試陸續推出,不僅僅為企業的成本效益提供參考,也對人工智能應用未來可持續發展具有重要意義 。
「未來對AI算力要求以后只會越來越大,五年后,所有計算力都將是AI計算力,所有服務器也都是AI服務器。」
比爾蓋茨曾說過,微軟的使命是讓每個家庭擁有一臺PC;未來,浪潮也許可以讓每個企業像用水用電一樣使用算力。
算力就是生產力,得算力者得「天下」
「讓算力變成生產力,我們是叫數據進去,AI出來。」
疫情期間,AI經濟以前所未有的方式爆發了。
《報告》顯示,2020年,人工智能行業應用滲透度排名TOP5 的行業依次為互聯網、政府、金融、電信和制造。同2019年相比,2020年互聯網行業仍然保持第一,而電信和制造行業的應用場景更加豐富,市場潛力預計將有較大的提升,但在疫情的影響下,醫療行業人工智能的應用滲透度超過教育行業位列第七。
在這樣的成果背后,海量的數據功不可沒,它是大量模型訓練的基礎。據 Open AI 的一份報告顯示,從 2012 到 2019 年,人工智能訓練集增長將近 30 萬倍,每 3.43 個月翻一番,比摩爾定律快 25000 倍。
但是,如果沒有足夠的算力支撐,就會有大把的數據被浪費掉,算法也不能進入到AI產業的生產力階段。
為什么人工智能對算力的需求如此之高?
一方面,隨著AI應用成熟度的提升,從通用場景走向細分,人工智能面臨著識別度不高、準確度不高等關鍵問題。
根據《報告》,除了人工智能投入相對集中的行業之外,在業務需求的推動下,很多碎片化應用也開始被廣泛使用,并輻射到媒體娛樂、現代農業、智能家居、智慧電力等多個不同領域。
另一方面,IDC認為,未來三年,用戶的算力還是集中在兩個方面:訓練和推理,其中,訓練仍然是未來投資的主要方向,并且這個方向已經從純感知的訓練,圖像識別,視頻識別,語音識別,轉向了對語意理解,純感知到感知以后的推理分析。
對于自動駕駛、機器人、內容推薦等綜合場景的算力需求也相對較高,平均算力值將達到146P OPS左右。
這些都對算力提出了更高的要求,而算力也已成為制約AI產業化進一步發展的關鍵。
在2019年4月,浪潮曾提出「智能計算中心」,即「智算中心」。今年4月,以智能計算中心為代表的算力基礎設施首次被國家發改委明確新型基礎設施的范圍。
如果智能計算中心成為全行業的算力提供者,以中國AI市場的規模,類似GPT-3、谷歌T4的超大AI模型的出現將被提上日程,屆時,我們就會真正感受到「算力改變中國,算力驅動未來,算力是生產力」。
而那時,算力時代也將真正到來。
(聲明:本文僅代表作者觀點,不代表新浪網立場。)