來源:量子位
蕭簫 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
沒想到,現在手機上就能做實時線段檢測了。
速度絲毫不比目標檢測慢,而且檢測效果還非常不錯:
線段是計算機建立視覺認知的基礎元素,利用LSD可以快速檢測圖像中的直線段,從而根據圖像的幾何特征設計算法,快速確定目標區域。
△幾種不同的線段檢測模型效果
雖然之前的線段檢測模型也能做到實時性,但往往只有在計算性能不錯的GPU上才能實現。
隨著機器人用途的多樣化,現在就連移動設備(如手機)和嵌入式設備(機器人)也希望能搭載線段檢測模型,為機器人視覺研究做準備。
為了滿足這些需求,一個名為M-LSD的移動設備實時線段檢測模型出現了。
據作者表示,這是首個能在移動設備上運行的線段檢測模型,目前已開源。
采用單個模塊,手機實時預測線段
此前,線段檢測之所以復雜,是因為它需要用到很多模塊來預測圖片中的線段。
如下圖,藍色部分是之前的主流線段檢測模型,這些模型的計算量和類型太大,結構還都基于大型模型構造,如基于ResNet50構建的FPN網絡、殘差U-Net……
這些模型,往往需要對圖像進行多個模塊的變換,最終才生成線段預測的結果。
然而M-LSD決定只用一個模塊,直接生成center/displacement map,從而一步到位預測圖像中的線段,極大地降低模型大小。
事實上,這個模型也確實非常小:1~11層基于MobileNet改編,12~16層則是一個自頂向下結構。
沒錯,一共也才16層結構,只相當于大型線段檢測模型體積的2.5%。
據論文介紹,相比于其他大型模型(圓圈大小表示模型大小),M-LSD能在線段檢測精度幾乎保持不變的情況下,將模型運行速度提升至原來的2.3倍+。
從圖中可見,作者們推出了M-LSD和M-LSD-tiny兩個模型,都可以在安卓和蘋果機上實時運行。
其中,M-LSD-tiny最快能以56.8FPS和48.6FPS的速度在手機上實時運行。
沒錯,現在AI在手機上給家具直線描邊的速度,可能比你還快。
而且只要是直線物體,它都能快速地將輪廓提取出來,就像是我們快速勾勒草圖一樣。
現在你也可以用手機試一試(項目地址見文末)。
還有網頁版在線demo
為了方便效果展示,作者們還推出了一個網頁版demo,基于Python的flask框架開發。
打開這個在線demo(傳送門見文末)后,就可以在線上傳你想要檢測線段的圖片了。
由于是在網頁上運行的,而且生成模型用的是M-LSD,因此檢測速度無法達到手機上的實時檢測效果(手機版M-LSD檢測速度在12.7~26FPS左右)。
不過,網頁版M-LSD生成一張線段檢測圖片,也只需要2.5秒左右。
我們先上傳一張室內設計的圖片試試。
效果確實不錯,直線結構的部分都被勾勒了出來。
不過,線段檢測的效果也會出現一些小bug。
例如在圖中直線不夠明確的時候,容易出現某些線段“漂移”的情況。
團隊介紹
這項研究來自有“韓國版百度”之稱的韓國最大互聯網服務公司NAVER,主職搜索引擎業務。
一作Geonmo Gu,本科畢業于延世大學的電氣與電子工程學院,碩士畢業于KAIST,研究方向是計算機視覺。
共同一作ByungSoo Ko,本科畢業于韓國忠南大學、加拿大紐芬蘭紀念大學,碩士畢業于KAIST,目前在NAVER就職技術研究工程師。
在線「線段檢測」網頁Demo:
https://gradio.app/g/AK391/mlsd
論文地址:
https://arxiv.org/abs/2106.00186
項目地址:
https://github.com/navervision/mlsd
(聲明:本文僅代表作者觀點,不代表新浪網立場。)