郭濤
曙光關注的不是具體的人工智能的應用,而是人工智能的底層支撐技術,通過建立硬件平臺,以及增添介于硬件平臺和應用之間的一層軟件,消除應用與底層技術架構之前的鴻溝,讓用戶更深入地了解人工智能,并付諸應用。
這邊,湖南衛視推出的首檔原創科技類節目《我是未來》最新一期節目剛剛落幕,“聲音博士”與“神眼特工”的比拼讓人感到意猶未盡,觀眾們再次領略了人工智能的神奇;那邊,由中央電視臺與中國科學院共同打造的人工智能電視節目《機智過人》正在緊張的錄制過程中,預計8月底將正式播出。
在這里,記者稍稍劇透一下,最新一期《機智過人》的內容之一,是從全國各地三甲醫院選拔出的15位具有15年以上臨床經驗的影像科專業醫生與一臺醫學影像閱片機器人進行比拼,看哪一方能率先在30張CT片中找出有病灶的10張。你猜猜哪一方會贏?
由于節目還沒有正式播出,在這里不方便透露最終的結果。親自參與了這期節目錄制的醫學影像閱片機器人研制方的專家之一、中國科技大學的安虹教授在接受記者采訪時表示:“科學計算與醫療跨行業學科的碰撞產生了奇妙的火花。以醫學影像閱片機器人為良好開端,人工智能有望在醫療領域得到快速應用和普及,為醫生減負,解決百姓看病難等問題。”
人工智能新突破
從最早IBM超級計算機“深藍”與國際象棋棋王卡斯帕羅夫的對役,到現在谷歌“阿爾法狗”橫掃當今圍棋界的頂尖棋手李世石、柯潔,人類與人工智能之間的比拼一直吸引著眾人的眼球。人們在驚呼人工智能技術神奇的同時,也希望能夠更好地駕馭它、使用它,替代人們完成那些瑣碎的、重復的、機械的工作,在提高效率的同時,也能夠解放人類,讓人們有更多時間和精力從事那些“更上層”的工作。
安虹向記者透露了一組數據:一個影像科的醫生平均每天要看80套片子,而每一套片子中又包含300-600張片子。隨著醫療設備精確度的提高,片子的數量、精度也在同步提高,這也給看片的醫生增加了更多的工作量。
有統計數據顯示,在醫院中,85%-90%的數據都是醫療影像數據。有效處理這些非結構化的數據就成了一個迫切需要解決的問題。在《機智過人》節目中出現的這臺醫學影像閱片機器人,就是一個突破。
據曙光公司智能計算技術總監許濤介紹,在節目錄制前的一個月,他們就將1萬多張CT片錄入到醫學影像閱片機器人中,建立模型,對它進行訓練。在節目錄制現場,醫學影像閱片機器人可以像一位專業的影像科醫生一樣,從給定的CT片中準確地找出有病灶的片子。這只是1萬張CT片子、僅通過一個月自學習所達到的效果。如果訓練的時間更長、機器閱讀的醫學影像資料更多,那么機器人醫學影像閱片的準確率、速度還將進一步提高,機器人會變得越來越智能。如果能夠將醫學影像閱片機器人早日投入到臨床醫療或遠程醫療中,相信將產生經濟效益、社會效益雙豐收的效果。
參與節目錄制的來自貴州一家三甲醫院的資深醫生,從業以來已經看過了20多萬張片子。而一臺只經過一個月訓練的醫學影像閱片機器人就已經可以和這些醫學專家PK。“我們可以把醫學影像閱片機器人比作一個有過目不忘本事的人、一個看病的高手。”許濤表示,“我們去醫院看病都愿意找老醫生,因為他們具有豐富的臨床經驗。而醫學影像閱片機器人的學習過程其實與人無異,只不過它可以在更短的時間內學習更多的知識,并將其固化到設備中。一個經過幾個月訓練的醫學影像閱片機器人就可能達到一個有40年從業經驗的醫生的水平。”
如今,“人工智能+行業”成了一種新的趨勢。人工智能與醫療行業的結合已經有了很多成功的案例。比如,IBM“沃森”腫瘤機器人其實就是IBM“深藍”的后裔,它能用于瘤機診斷是經過了美國一家癌癥研究中心歷時4年半的訓練,“吸收”了300多份醫學期刊、250余種教科書、近1500萬頁文字,以及美國國立綜合癌癥網絡發布的臨床指南的所有內容。如今,IBM“沃森”已進入了中國的醫療領域。
2016 年,Google Research就成功地利用人工智能檢測由糖尿病造成的視網膜病變,如今這項研究成果已率先在印度進行了臨床試驗。
醫學影像閱片機器人的出現再次帶給我們一個驚喜,它可以大大減輕醫生的工作量,提高診斷的準確率。
三方優勢互補
參與《機智過人》節目錄制的醫學影像閱片機器人是中國科技大學、健培科技公司和曙光公司三方合作的智慧結晶。
簡單說,人工智能包括兩個重要因素:一是計算,二是數據。“計算是人工智能的動力,而數據是原材料。”許濤表示,“我們就是為人工智能提供計算能力的。曙光提供的兩個節點的超級計算機平臺,再加上中國科技大學的神經網絡技術,以及健培科技公司提供的醫療影像軟件應用和相關數據,構成了醫學影像閱片機器人。”
曙光是中國高性能計算(HPC)市場的領頭羊,在通用HPC市場占有較高的份額。但是,用于人工智能的高性能計算機與傳統通用的高性能計算機是有明顯差別的。簡單說,人工智能采用的是一種專用的高性能計算機。
傳統的高性能計算機是異構計算的典型,通常采用CPU+GPU的組合,并且以CPU為重,少量的GPU只是用于加速。而在人工智能領域,為了高速處理大量資源,以GPU為代表的各種加速器受到熱烈歡迎,CPU的比重減小,主要承擔調度的職責。曙光與英偉達在GPU上有多年合作,將商業的加速芯片用于人工智能專用的高性能計算平臺。另外,像ARM、FPGA等在人工智能領域也有廣闊的應用前景。
談到與曙光的合作,安虹介紹說:“曙光的高性能計算硬件平臺非常適合醫學影像閱片這項應用。我們根據應用的需要,對曙光提出了定制化的需求。曙光對其高性能計算機重新配置了芯片、網絡、存儲等。在此基礎上,我們再次進行了優化。一個高效率、高能效的硬件平臺對于人工智能應用來說是非常必要的,它是高性價比和人工智能平民化的基本保證。”
人工智能的應用分成兩個部分:一是在線的訓練過程,二是在線應用。在線訓練就是將相關數據灌入到機器中,通過建立模型、為數據打標簽,在高性能計算平臺上進行一定時間的訓練,讓機器通過自學習掌握特定的技能。在線應用就是將之前訓練得到的模型固化到一個設備中,可能是一個臺服務器,也可能是一部手機,對外提供服務。為了快速輸出結果,在線應用需要有多個節點同時對外提供服務。
給人工智能一個支點
曙光布局人工智能,其中一個重要策略是在其HPC團隊之下又新建立了一個團隊——智能計算團隊,目前有10幾個人,大多數是從美國知名高校歸來的博士。
“我們的目標是將人工智能與市場相結合,快速產品化。”許濤進一步解釋說,“我們一方面努力推廣可應用于人工智能領域的曙光硬件產品,比如醫學影像閱片機;另一方面,我們也在人工智能的專用芯片方面進行布局和投入,比如曙光已經建立了相關的實驗室。我們要建立一個支持人工智能開發的軟硬件一體化的平臺,讓國內的科研機構、初創企業等在此之上開發自己的人工智能應用。”
阿里、百度等也在建立自己的人工智能開放平臺。不過,這些平臺旨在連接產業鏈上下游廠商,實現生態的整合。而曙光要建立的這個開放平臺則不同,它是一個技術架構,屏蔽了其下復雜的技術和組件,允許用戶在這個平臺之上使用各類人工智能軟件,創建企業自己的人工智能生態圈。從某種程度上說,醫療影像閱片機器人就是曙光這個開放平臺的一個縮影。
“我們關注的不是具體的人工智能的應用,而是人工智能的底層支撐技術,通過建立硬件平臺,以及添加介于硬件平臺和應用之間的一層軟件,消除應用與技術架構之間的鴻溝,讓用戶更深入地了解人工智能,并付諸應用。”許濤表示。