記者/韓東起
時間記錄了夢想的足跡,探索鐫刻了奮斗的崢嶸。在逐夢的道路上,無論是急風驟雨,還是孤夜寂寥,科研人總是披荊斬棘,埋首前行。在軟件工程國際頂級會議ASE 2021中斬獲最有影響力論文獎的謝濤,對此深有感觸。
有人說,選擇了,就是一輩子。所以,謝濤前沿的研究想法和獨立的思考模式都圍繞著軟件工程徐徐展開。他相信,唯有厚積薄發(fā),才能找到“真相”。
為了開拓軟件工程科研探索的思路,謝濤選擇走出舒適區(qū),去美國學習深造。“埋首探索,是科研的日常,無論走到哪里,這一點都不會改變。”尋找課題,反復實驗,獲取反饋,主動調整,在這樣的厚積薄發(fā)中,謝濤找到了科研探索的正確路徑,同時,也積累了豐富的探索經驗,“在未知中前行,需要可以依靠的工具,而知識和經驗,就是這樣的工具。”
2005 年,謝濤提出用機器學習提高軟件質量的方法和工具,并成為最早開展智能化軟件工程研究的學者之一,十余年匆匆而過,謝濤也已經在軟件自動化領域取得了不斐的成績。
作為科研人,謝濤是謙虛且低調的。自認為天賦并非出類拔萃的他,把勤奮,動腦,上進心視為不停進步的主要因素。通過不停的知識積累,不停的科研探索,不停的主動思考,再加之不斷地追求卓越,各種因素的集合,成就了今天的謝濤。而其影響力主要體現在對學術和產業(yè)兩個方面。
一篇論文,能夠廣泛影響、啟發(fā)到學界業(yè)界同行的研究想法,那么,這篇論文就是一篇極具有學術影響力的論文。而謝濤第一時間想到的就是他在ASE 2007國際軟件工程頂會上發(fā)表的一篇論文《PARSEWeb: A Programmer Assistant for Reusing Open Source Code on the Web》,即,前面提到的獲得了ASE 2021 最有影響力論文獎的論文。

謝濤
提起這篇論文,謝濤的眼中是滿滿的驕傲與自豪。他清楚的記得,論文的工作起源于2006年初。那時的他,開始意識到把互聯網上的大規(guī)模開源代碼充分利用起來,能夠更好的完成工作。當時“大數據”、“大代碼”等詞匯還沒有受到大眾的關注,人工智能、機器學習在軟件工程領域的應用也很少,但作為軟件工程領域的前沿探索者,謝濤有著極為超前的敏感度。那篇論文就是一次很早期的引領性探索,創(chuàng)新總是格外備受關注,謝濤也因這篇論文及其后續(xù)工作,受到了學界的高度認可。
眾所周知,科研是在探索中前行的,謝濤對軟件工程的研究也是連續(xù)性的。謝濤更早一點的相關成果是在MSR 2006 論文《MAPO: Mining API Usages from Open Source Repositories》中提出的MAPO 工具,并且后續(xù)與北大團隊合作將它完善并發(fā)表在ECOOP 2009 國際會議上,其主要內容是怎么用數據挖掘的方式來挖掘海量的開源代碼,這兩篇MAPO論文的引用率也較高。
與學術相比,產業(yè)影響,更令謝濤關注。“實戰(zhàn),通常才是軟件工程科研工作中最終的檢驗方式。”謝濤在產業(yè)影響上,主要有兩個代表性科研成果。
2007 年起,謝濤和微軟雷德蒙德研究院(位于西雅圖)的兩位工程師合作研發(fā)的自動化測試工具Pex,經過深度研究和完善,2015 年,Pex 工具被微軟命名為IntelliTest(意指智能化測試)來進行商用發(fā)布,成為微軟Visual Studio企業(yè)版的主要賣點之一。
成績屬于過去,探索才是未來。因此,謝濤的探索從未停歇。2011年,他與張冬梅博士(現微軟亞洲研究院常務副院長)領導的研究組合作開展的軟件解析學(Software Analytics)研究,合作產出了一系列有高產業(yè)影響力的軟件解析學成果,并應用到微軟內部以及廣大軟件產業(yè)的實踐。值得關注的是,在2011年他們合作發(fā)表的《Software Analytics as a Learning Case in Practice: Approaches and Experiences》論文中,首次闡述了軟件解析學的定義,并用具體成果系統來示例如何開展高影響力的軟件解析學研究。在國際上,他們的成果引起了極大的反響,目前,許多科研工作者都在該領域進行探索。謝濤和張冬梅也因此獲得了2022年度軟件倉庫挖掘奠基性貢獻獎。
在延續(xù)的基礎上,創(chuàng)新。這就是現代科研的探索之路。在美國成績斐然的謝濤,一直關注著中國計算機的發(fā)展,“我要參與到祖國計算機的發(fā)展大潮中。”于是,在2019年,謝濤載譽歸國。

回國后的他,還是延續(xù)之前的兩大方向,即軟件測試與軟件解析學。但他深知,科研要與社會發(fā)展相結合,與時代需求相結合。智能化軟件工程的研究,應運而生。
在探索過程中,謝濤十分注重推動一些長遠、有較大挑戰(zhàn)的問題,比如軟件自動化,即自動生成滿足給定軟件需求的代碼。而“面向智構件的軟件開發(fā)”就是他在朝著最終軟件自動化目標行進途中推動的創(chuàng)新研發(fā)方向。謝濤稱這個開發(fā)過程為“搭積木”,即,用復用、組裝、集成“積木”(即軟件構件)來進一步提高軟件開發(fā)效率。只是,很大一部分“積木”是由軟件自動化去創(chuàng)建,不需要投入人力。但如何人機協作去做好“搭積木”,則需要謝濤團隊進一步深耕探索。
與此同時,可信軟件工程是謝濤團隊的另一個研究課題。比如,基礎軟件包括操作系統、編譯器、數據庫等在軟件系統里是極其關鍵的,如何保障它們的可信度?當人機物融合的新型計算環(huán)境和應用場景中包含有AI賦能系統,如自動駕駛、無人機等,怎么去保障系統整體的可信性?要解決這些問題,不僅需要軟件測試,還需要形式化驗證等技術,而這些在大規(guī)模軟件上還未被突破的技術,都需要謝濤團隊深入研究后給出答案。
這就是謝濤,一位高瞻遠矚的科研人。未來的他,將繼續(xù)埋首計算機領域,開拓前行;將用更多的科研成果,為計算機科學的發(fā)展,添磚加瓦,貢獻力量。