歡迎關注“創事記”的微信訂閱號:sinachuangshiji
文/金磊
來源:量子位(ID:QbitAI)
曠視科技,現在是一家創辦10年的公司。
它是最早在中國打響名氣的AI視覺明星,是一個全新ID時代的開啟者,也是同時代獨角獸中最快實現規模化營收的公司。
談到這一波AI浪潮,往往標簽就是谷歌和AlphaGo,而談到中國AI創業,似乎開口就會是曠視和Face++……
但即便如此,對于曠視的不同認知也相差甚遠。
有人依然停留在天才云集、清華姚班、AI獨角獸的通識印象。
也有人看到曠視“AI+IoT”的戰略選擇后,認定這可能不再是一家掌握“魔法”的酷公司。
更少有人能清晰表達曠視一路的“歸去來兮”,理解背后運轉的關鍵邏輯,劃定關乎本質的邊界與核心。
只是現在,10年一夢,連點成線。
宏觀透視當前的曠視,不斷升級打怪和求解的現實挑戰,可以極簡到3個自然數:
1、2,3……就是曠視。
1:一套核心算法
曠視是一家靠算法起家的公司。
更準確來說,可以細分為兩類。
一類是以深度學習(DL)和計算機視覺(CV)為基礎的核心算法。
十年前,深度學習露出了快速發展的苗頭,曠視抓住了這個契機,立即決定將DL和CV進行結合;于是乎,便形成了現在特征鮮明的算法能力,包括面部識別、視頻結構化、圖像分類、物體檢測、語義分割、動作識別等。
這類算法是曠視之始,是曠視算法演進的基礎。
而除了將DL與CV結合之外,曠視在它們各自能力上,也進行了相應拓展,包括更底層的DL模型,以及計算攝影、屏下指紋識別、機器人導航CV能力。
基于核心算法的突破,曠視在全球AI頂級競賽中攬獲40個世界冠軍,創下了前無古人的MS COCO三連冠紀錄,獲譽AI領域的“中國乒乓球隊”。
另一類則是行業算法(或者叫AIoT算法)。
這類算法的最大特點,就是碎片化和個性化,這點非常好理解,畢竟“千行千面”。而曠視的DL+CV,更多的是解決數據的輸入問題,但如若要形成行業數據的閉環,還需要具備數據挖掘和優化的算法能力。
曠視認為,未來十年算法將無處不在,并且成為每個行業“降本增效”最核心的引擎。因此,在明確“AI+IoT”戰略方向后,曠視利用自身能力和優勢,推動了行業算法的創新,以實現價值閉環。
這其中包括在多設備調度優化、數據挖掘和分析等方面,實現了多設備之間的高效協同、數據挖掘分析和形成決策。
例如,曠視推出的河圖智慧物流操作系統,就是通過同構仿真和AI調度優化的能力,實現了項目規劃、仿真、實施、運營等全流程的數字化和智能化。
不過,在曠視的這個1中,算法之強,本質還不在于單個模型,而是曠視規模化、批量化生產算法的能力。
即算法生產引擎Brain++。
形象化理解,如果曠視的算法是蛋,那么Brain++就是背后的雞。
作為一個生產力工具,Brain++的形成有曠視業務需求的內因,也有當時缺乏可用開源平臺的外因。
但內外因綜合之下,最終使得Brain++成為了曠視工程實踐和算法創新的有力支撐。
而且相比于TensorFlow等算法框架,Brain++包含了算法、數據和計算的統一。
成為了曠視數次在全球AI競賽中擊敗谷歌、微軟等巨頭的“秘密武器”,是曠視研發不斷逢山開路的保障。
所以歸結起來,曠視的算法之路,經歷了從核心算法突破,到行業算法落地和創新,再到算法生產平臺的拓展過程。
而所謂道生一,一生二,二生三,三生萬物。
在曠視的定義里,AI是不斷演進的算法能力。AI是曠視的核心能力,其后場景化落地中形成的邊界感,也始終圍繞這個核心。
算法就是曠視的1,有這個1才有后續落地的一切。
2:有“腦”有“軀干”,軟硬結合的路徑
AI浪潮,被視為智能化浪潮,是一場替代簡單重復腦力勞動的革命。
而這種腦力驅動,來自算法。
但產業化落地,光有“腦”不行,必須還要有“軀干”合體。這個軀干,曠視認定是IoT。
在曠視看來,IoT是一種網絡,所具備的特點就是“基于場景空間”、“以人為核心”、“軟硬結合”。它是曠視AI技術落地的載體。
而所謂AI+IoT,就是將AI的能力加進IoT場景中,實現從應用、數據中臺、邊緣設備和終端的全面智能化。
深度學習驅動的AI復興,本質就是對數據的物盡其用。
但在現實生產中,用數據就得先有可用的數據,用石油就得先開采和部署石油管道。
所以物聯網終端執行器、傳感器,最核心的價值就是數據的在線化,部署AI算法后,數據就能發揮第一層作用。
智能手機有了刷臉模組,學習了用戶面部數據,接下來就能展開刷臉解鎖的應用。
但是,在物聯網的執行器、傳感器等組網之后,還需要在這些設備與應用之間增加一個智能的“大腦”,使其具備連接、分析和協同能力,這就是曠視著力打造的“AIoT操作系統”。
此外,AI落地必須要講場景,明確限定區域。
而不同場景有不同的IoT設備,需要配備不同的AI算法,軟硬結合的落地方式,也就成了題中之義。
比如城市公共空間、建筑樓宇,以及面向工業的物流倉儲空間和工廠空間等等,場景不同,需要的AI軟硬件也不同,而且交付的對象也千差萬別……
只有把算法、軟件和硬件的各要素能力,集成固化成終端可交付產品,才能定價交付,才能實現商業化、規模化落地。
所以曠視被外界所熟知的是戰略選擇——AI+IoT,在消費物聯網、城市物聯網和供應鏈物聯網三大場景展開落地,但易于忽略的是,這種戰略選擇,其路徑決定于軟硬結合,以及由此帶來的客戶價值積累。
實際上,軟硬結合也是AI業內的大共識。
特斯拉自研AI算法后進一步自研打造AI硬件,依圖、地平線等進軍芯片也都是基于AI算法和需求的重新定義。
上一個時代的軟硬結合,是基于現有硬件,打造與之匹配的算法和軟件。
而在IoT時代,軟件和硬件是天然結合的,需要協同設計和聯合優化,其本身就是軟硬一體的。
3:三大場景的“邊界”
邊界不是終點,邊界只是意味著技術到商業是否實現了閉環,這是企業階段性有所為有所不為的選擇結果。
而曠視,在算法為核心、AI+IoT的軟硬結合為落地方式之下,現階段選擇了三大場景,也暗合其商業價值增長的短期、中期和長期。
第一大場景,消費物聯網。最典型如智能手機為主的消費電子上的面部識別、屏下指紋及計算攝影相關的解決方案。
AI能力應用的終端(手機)已經非常成熟,規模化起量也很快,毛利率不高但邊際效應明顯,對于AI能力供應商而言,被認為是十億美元市場。
從2012年開始,曠視就開始給OEM手機廠商和App,提供解決方案。
除了最知名的刷臉、屏下指紋模組,還包括在AI降噪、多攝虛化、夜景超畫質以及視頻虛化等方面的計算攝影供應。
除了手機終端的應用之外,曠視還在基于Face++人工智能開放平臺,為互聯網金融、網約車、線上租賃平臺等企業和開發者,提供數十種AI能力及SaaS產品服務。
第二大場景,城市物聯網。
比如面向城市區域內的公共安全、交通管理、城市管理、樓宇園區等場景,提供智慧城市解決方案。作為城市智能化和新興基礎設施的核心組成,這被認為是百億美元的市場。
曠視在該領域于2015年入局,推出過洞靈慧+邊緣盒子、盤古九霄+新型交互設備等AIoT設備。
而2020年來,大眾對于城市物聯網最具感知的,可能莫過于商場、地鐵站和機場等公共場景的AI識別和測溫了。
第三大場景,供應鏈物聯網。
集中體現在物流領域,相比消費和城市兩大場景,曠視在這個場景入局最晚——2017年,但軟硬件一體化能力也展現得最充分。
有AI算法,有軟件——操作系統河圖,還進一步基于AI定義硬件——打造了AMR機器人、SLAM導航智能無人叉車、智能圓盤播種機、人工智能堆垛機……
在供應鏈物流場景中,一方面客戶可以是衣食住行用全領域,另一方面之前的“大小腦”智能化程度不高,可以全方位升級改造。這也是該場景被認為有千億美元潛力的原因。
目前,曠視在供應鏈物聯網領域,據稱已經累計向鞋服、醫藥、智能制造、零售電商等不同行業提供了倉庫、工廠及零售店的升級改造,客戶數已近百位。
所以整體縱覽之后,曠視在這三大場景的發展,有些正處于成熟期,有些尚處于發展期。三大業務板塊市場成熟度、商業前景和規模,都有先后之分。
而萬佛朝宗,雖然場景領域有不同,構建的閉環邊界有不同,但三大業務板塊的AI產業化落地的思路一以貫之:從軟件到軟硬結合,從AI走向AIoT。
而從AI算法→軟件平臺→軟硬結合,也被曠視認為是AI產業落地的最小路徑。
更是曠視十年摸石頭過河探索出的核心經驗。
如何評價?
如今,站在現在來總結梳理,自然可以把曠視以1、2,3來審視。
不過極簡如斯,過程卻可能并非一蹴而就,背后都是曠視從算法到硬件,從代碼空間到現實場景的10年探索和求解。
而從曠視出發,作為中國AI創業的頭雁代表,其發展和演進路徑,也是中國原創AI一派的縮影,是前所未有的技術創新到商業模式落地的縮影。
在AI浪潮之前,中國的創業者都是基于硅谷成熟的技術創新之上的商業模式創新,于是產生規模化商業價值的時間也就更快。
但AI浪潮不同,算法的創新天然需要與行業和數據結合,而行業錯綜復雜,需求高度不確定,這造成AI商業價值的落地的周期相對較長。
曠視用了10年,可能就是最具代表性的說明。
此外,軟硬件一體的AI時代落地趨勢,一次次被強化和證明。
無論是因為自動駕駛能力而自研芯片的特斯拉,還是曠視的算法天才們下工廠、走進倉庫,在物流供應鏈一線打造機器人……都是這個趨勢的明確注腳。
向重而生、落地為王,也在成為AI價值兌現和交付的風向,也只有朝著這個方向,才能構建從技術到商業的價值閉環。
如果說,AI落地是一道擺在所有人面前的時代級應用題。
那曠視解題的過程和答案,就是這份1、2,3…數列。
(聲明:本文僅代表作者觀點,不代表新浪網立場。)