“浙江大學視覺感知教育部-微軟重點實驗室”是微軟亞洲研究院與國內高校成立的第一所聯合實驗室,實驗室中不僅有潘云鶴院士等知名的學者,也有青年一代的學者,劉利剛教授就是其中之一,他畢業于浙江大學,后加盟微軟亞洲研究院,而最終他又回到母校開始了教學和科研工作,在這里我們通過他的特殊背景,了解他們如何——
1視覺感知教育部-微軟重點實驗室
“視覺感知教育部-微軟重點實驗室”(Key Laboratory of Visual Perception (Zhejiang University), Ministry of Education and Microsoft)的前身是1999年11月19日成立的“浙江大學-微軟視覺感知聯合實驗室”(Microsoft Visual Perception Laboratory of Zhejiang University),于2004年納入教育部重點實驗室管理體系。
“浙江大學-微軟視覺感知聯合實驗室”是微軟亞洲研究院初建時,在中國設立的第一個聯合實驗室。“視覺感知教育部-微軟重點實驗室”的研究領域涉及視頻運動對象跟蹤與識別、真實感建模與繪制和視覺內容感知理解等方面。
該實驗室的指導教授由浙江大學和微軟亞洲研究院雙方共同組成。微軟方面有沈向洋博士(微軟亞洲研究院現任院長,浙江大學兼職教授)、郭百寧博士(微軟亞洲研究院副院長)等。浙江大學方面有潘云鶴教授(院士)、陳純教授(計算機學院常務副院長)、石教英教授(CADCG國家重點實驗室前任主任)、莊越挺教授(計算機學院副院長)、劉新國研究員(CADCG國家重點實驗室)、劉利剛副教授(浙江大學數學系)。
實驗室的研究主要集中在圖像、視頻和圖形學等可視媒體的分析、理解與交互方面。在前3年內發表研究論文50余篇,申請有相關技術原型設計和專利等20余項。每年都有多名學生獲微軟亞洲研究院頒發的“微軟學者”獎學金。
2我一生中最緊張的一段讀書生活
我1992年考入浙江大學應用數學系。在浙江大學求學的日子,是我一生中最值得回憶的時光。進入大學后,能與不同地區、不同年齡的同學交往,能學習到廣泛的知識,能接受到許許多多老師的教誨,在大學校園里的所見所聞,開闊了我的視野。在本科階段,我已開始體會到數學的廣闊應用前景,數學只有應用到解決實際問題中,才體現出它的美。1996年,我以優異的成績免試到本校應用數學系做研究生。我那時就已選擇了自己未來的研究方向,開始向更高的目標邁進。在研究生階段時,我選擇了從事計算機輔助幾何設計與圖形學方向的研究工作,并選擇了此方向作為自己的博士研究方向。五年之后,我于2001年獲得博士學位,論文被評為校優秀博士論文。
如果有人問我,在我一生中最緊張的一段讀書生活是在哪里度過的?我會毫不猶豫地回答:在浙大。浙大九年的讀書生活,為我打下了一生從事應用數學、計算機圖形學研究工作的堅實基礎。在那里,我一方面受益于各位知識淵博的老師和師長,一方面也得益于浙大良好的學習和研究條件。
在浙江大學的學習生活,不但使我順利地完成學業,更重要的是養成了嚴謹的學風和求實的科研態度,今日回想起來不能不倍感苦中之甜。
3加盟微軟亞洲研究院
博士即將畢業時,我開始對自己的未來進行思考。對于未知世界的好奇和對研究的熱愛使我毅然選擇將科學研究作為自己的未來職業。經過激烈的競爭和面試,我加盟了微軟亞洲研究院網絡圖形組從事計算機圖形學的研究。
微軟是一個非常卓越的公司。在微軟亞洲研究院工作期間,我與眾多高水平的研究人員一起工作,相互學習,我的學術視野和科研水平得到大幅度的提高。我在微軟學到了很多東西,受益匪淺,主要體現在以下幾個方面:
(1)技術和研究方法。除了專注于軟件技術和軟件產品研發,微軟亞洲研究院的研究人員更專注于新的研究領域和可轉化為實際技術的研究課題。
(2)領導和管理藝術。領導決策者擁有卓越的才識、明確的分工和高效的合作。
(3)對人才的重視。多渠道發現和挖掘人才,有效的人才篩選和聘用機制,對人才的持續性培養。
4對母校的熱愛和回報
在微軟亞洲研究院工作三年后,出于對母校的熱愛和回報,我回到了浙江大學,希望為學科建設作出自己的貢獻。回到浙大的兩年多時間中,申請并主持了1項國家自然科學基金,1項浙江省自然科學基金,1項國防科工委項目,另外還有1項與微軟亞洲研究院的合作研究項目。現在我在多個領域,包括網格曲面編輯與變形、參數化、光順、分割及流形學習等方面已做出了許多重要的創新結果和算法。最近的研究工作包括:在網格曲面光順和優化方面,創新地提出了一種新的全局非迭代線性光順算法,并且能保持物體的外形特征,克服了以往局部迭代光順算法的操作復雜和物體光順后會收縮的缺點;在網格曲面參數化方面,首次提出了流形參數化的線性新方法,將一個網格曲面的拓撲連接信息直接映射到另一個網格曲面上;針對Laplace編輯方法不能做大幅度物體變形的缺點,將Laplace向量分解成參數信息和幾何信息分別處理,并結合對偶網格物體的優點,提出了一個迭代線性的快速算法,大大改進了網格編輯的結果;針對物體分割是跟人的視覺認知相關的,提出了一個基于線畫草圖的操作界面來輔助用戶分割物體成不同的具有認知意義的部分,用戶界面簡單直觀,算法快速,效果非常好。上述的有些工作已經得到國際同行的認可,部分工作得到高度評價。我也將與我的學生一起在計算機動畫、網格編輯、圖像分割等方面繼續開拓一些研究領域,朝著更高的目標努力。
除了自己的科研和教學以外,我們非常重視梯隊的建設和人才的培養。除了培養學生的基本能力和素質外,更注重培養他們積極進取的精神,主要表現在以下幾個方面:
(1) 對科學研究的激情。培養學生對從事科研工作具有極大的熱情,把科研工作當作一件快樂的事情來做。作研究要不為名利,做自己喜歡做的事情。而每天都在做自己喜歡的事情,就有自由的感覺,就會享受工作給你帶來的快樂和自信。
(2) 正確的做事方法。對一個學生來說,正確的方法意味著成功。鼓勵學生通過相互交流,多向高手學習,特別是跟世界頂尖級的學者專家交流和學習,就能學到很多做事情的正確的方法。
(3) 具有高的目標。鼓勵學生要有遠大的目標,也要根據所取得的成果不斷地調整目標。一件事情要么不做,要做就要做得最好,做得完美。不能為自己取得一點點成績而沾沾自喜,要謙虛謹慎,戒驕戒躁。要做好的科研工作,更要做有用的,有影響力的科研工作。目標低了,是不可能成為一個成功的科技工作者。
(4) 持之以恒的毅力。作研究要有耐心,如果沒有耐心,即使找到了正確的方向,也會因為自己的浮躁而前功盡棄。從事科研工作要能耐得住寂寞,要有堅忍不拔的精神。
在學術上,衡量一個學者的創新能力是看其發表的論文和申請的專利等情況,但更重要的還在于是否有高質量的、在國際上有影響力的科研成果。我一直以追求卓越的創新精神來指引未來的研究方向。不僅要嚴格要求自己,而且還要嚴格要求自己的學生,使他們也一樣具有高目標的創新能力,使其樹立寬廣的學術視野;只有勇于競爭,才能取得學科建設成就。同時要加強學術交流,走向國際學科前沿和學術前沿。
5實驗室階段性科研成果
實驗室的項目研究主要集中在圖像、視頻和圖形學等可視媒體的分析、理解與交互方面。
(1)在圖形學領域,主要研究幾何建模中的有效變形方法和計算機動畫中的變形模擬問題。所取得的成果主要有:a)提出了子空間幾何變形方法;b) 提出了一套從二維卡通到三維動畫的遷移方法; c)提出了域分解的方法和一種新的勢能表達對幾何變形實時模擬。上述成果發表于Siggraph等學術會議。
(2)在捕獲數據分析與處理方面,提出使用運動索引樹和彈性算子對捕獲的3D運動數據進行檢索,并且對檢索得到的運動數據高效重用的運動規劃方法。這種方法解決了運動數據維數高、人體運動如何理解和3D時序數據相似匹配等三個難題。上述成果分別發表于《Computer Vision and Image Understanding》、《Computer Animation and Virtual Worlds》、《計算機輔助設計與圖形學學報》、《計算機研究與發展》等學術期刊。
(3)在視覺感知和理解領域,提出了通過自回歸動力學方程和貝葉斯網絡對非剛性人臉表情運動數據進行表達分析和以表情幻想為手段的表情數據重用方法。本領域的研究結果分別發表于《Pattern Recognition》、《電子學報(英文版)》、International Conference on Automatic Face and Gesture Recognition (FG2004)以及《計算機輔助設計與圖形學學報》等國際國內學術刊物和會議上。
(4)在智能人機交互方面,著力分析人類感知方法、研究開發基于視覺感知(Visual Perception)的人機交互方法(HCI, Human Computer Interaction)。不同于鍵盤、鼠標等傳統交互設備,該交互界面能夠使用戶用自然的表情、手勢以及身體同機器交互,而機器可以理解用戶的行為。在此基礎上,結合語音等交互方式,構建多態的人機交互(Multimodal interaction)方案。
(5) 視頻編解碼技術。主要包括面向嵌入式設備的視頻編碼技術、視頻編解碼優化算法、面向移動環境的視頻容錯技術、視頻轉碼技術。創新點為復雜度可分級的視頻編碼算法、面向H.264的自適應模式決策方法、基于敏感區域的視頻容錯編碼方法、基于多描述視頻的自適應差錯恢復機制
(6) 在計算機圖形學和計算機動畫方面,針對Laplace編輯方法不能做大幅度物體變形的缺點,將Laplace向量分解成參數信息和幾何信息分別處理,并結合對偶網格物體的優點,提出了一個迭代線性的快速算法,大大改進了網格編輯的結果,對曲面變形領域具有較大的貢獻,此工作發表在今年的IEEE Transactions on Visualization and Computer Graphics期刊上;針對物體分割是跟人的視覺認知相關的,提出了一個基于畫線的交互操作來輔助用戶分割物體成不同的具有認知意義的部分,用戶界面簡單直觀,算法快速,效果非常好,此工作已發表在今年的Eurographics國際學術會議上;提出了流形參數化的嶄新概念,是指將曲面直接映射到另一張流形曲面上,當目標流形曲面為平面或者球面時,流形參數化即為傳統的平面參數化或球面參數化。流形參數化的概念和方法將以往的參數化統一起來,給出了統一的框架,對數字幾何處理領域的參數化理論和方法的發展將具有突破性的意義。
作者簡介:劉利剛,男,1975年3月出生,分別于1996年6月和2001年6月于浙江大學數學系獲學士和博士學位。2001年7月至2004年7月在微軟亞洲研究院網絡圖形組任副研究員,2004年8月起在浙江大學數學系任教,聘任為副教授,獲碩士生導師資格。2005年12月任浙江大學數學系計算機圖像圖形研究所副所長。2006年獲教育部和微軟亞洲研究院共同頒發的“微軟青年教授獎”。目前主要從事幾何造型、數字幾何處理、紋理圖像分析與處理、流形學習和結構生物信息學等領域的研究工作。近五年來發表研究論文30余篇,申請發明專利1項,軟件技術專利2項。部分論文發表在重要國際刊物IEEE Transactions on Visualization and Computer Graphics、Computer Aided Geometric Design、Computer-Aided Design和重要國際會議SIGGRAPH, Eurographics, Pacific Graphics,部分研究成果受到國內外同行好評。2005年獲得國家自然科學基金和浙江省自然科學基金資助。擔任多種國內外學術期刊審稿專家,擔任多個國際會議程序委員會委員。