張先軼
澎峰科技是中科院的技術(shù)團(tuán)隊(duì),做過(guò)國(guó)際知名的開源矩陣計(jì)算庫(kù)OpenBLAS,獲得過(guò)中國(guó)計(jì)算機(jī)學(xué)會(huì)科技進(jìn)步二等獎(jiǎng)、中國(guó)科學(xué)院杰出科技成就獎(jiǎng),是國(guó)家高新技術(shù)企業(yè)、中關(guān)村高科技企業(yè)、中關(guān)村金種子企業(yè)。澎峰科技的主要業(yè)務(wù)是嵌入式AI解決方案,包括高性價(jià)比智能硬件、高性能視頻處理、低功耗IoT,為互聯(lián)網(wǎng)客戶、安防客戶、學(xué)校等提供服務(wù)。
什么叫嵌入式人工智能,或者說(shuō)端上智能呢?其實(shí)并不是在嵌入或在設(shè)備端來(lái)訓(xùn)練深度學(xué)習(xí)模型,在部署階段,我們的模型在服務(wù)器內(nèi)訓(xùn)練,但是在實(shí)際使用的過(guò)程中,是在云端做部署,還是在端上設(shè)備做部署,兩者會(huì)有很大的差異。大家見(jiàn)的比較多的是在云端做部署,比如很多API通過(guò)網(wǎng)絡(luò)的方式上傳圖片,在云上計(jì)算并返回結(jié)果。使用嵌入式端部署的話,模型可能傳輸?shù)搅耸謾C(jī)上,在此基礎(chǔ)上可以做圖像識(shí)別和處理功能,另外也可以傳輸?shù)綗o(wú)人機(jī)上或智能攝像頭上。
以抖音為例,里面有個(gè)美顏直播功能,當(dāng)人臉動(dòng)的時(shí)候,美顏的畫像其實(shí)一直跟著人臉動(dòng),同時(shí)也有很多特效,這個(gè)就是嵌入式非常典型的應(yīng)用。那么為什么不是拍好一段視頻上傳到云端,再做美顏呢?因?yàn)槿绻蟼鞯皆贫嗽偬幚恚换バ詴?huì)非常差,無(wú)法讓用戶實(shí)時(shí)看到效果,成本也比較高。因此,所有的效果全部在手機(jī)端完成,交互性會(huì)更好。這里主要用到了三個(gè)算法:一是人臉檢測(cè),先找到人的臉;二是識(shí)別人臉關(guān)鍵點(diǎn),找到人的鼻子在哪兒,眼睛在哪兒;三是做一些貼圖,比如眼鏡或小貓的貼圖,不管人臉怎么動(dòng),甚至是旋轉(zhuǎn),貼圖都可以時(shí)刻貼合人臉。……