999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

世界最大的自然語言處理和語音技術實驗室

2007-12-31 00:00:00趙鐵軍朱聰慧
計算機教育 2007年11期

哈爾濱工業大學語言語音教育部-微軟重點實驗室,以哈工大計算機學院語言技術研究中心為主要依托,由機器智能與翻譯實驗室、智能技術與自然語言處理實驗室、信息檢索實驗室和語音處理實驗室聯合組成,由教育部和微軟亞洲研究院聯合支持并資助。到目前為止,先后有200多名教師和學生加入實驗室進行研究工作,是目前世界上規模最大的自然語言處理和語音技術實驗室。

1發展歷程

在微軟亞洲研究院的成立之初,微軟就與哈爾濱工業大學計算機學院開展了密切的合作,為如今深入廣泛的合作打下了深厚的基礎。

首先,早在2000年6月,哈工大80周年校慶之際,時任微軟亞洲研究院院長的李開復博士和任哈工大黨委書記的李生教授就對具體合作事宜達成了一致意見。“哈工大-微軟機器翻譯技術聯合實驗室”在哈工大校慶期間揭牌,開辟了雙方合作之路。合作之初,哈工大方面的合作主體是機器智能翻譯研究室,當時約有師生40人。這是微軟在中國設立的唯一的機器翻譯聯合實驗室,隨后的4年中,雙方探討并嘗試了多種合作方式,并將其中成功的合作經驗,延續至今。例如:雙方首先共同確定培養計劃,然后哈工大派遣研究生到微軟亞洲研究院實習,由微軟亞洲研究院幫助培養;雙方互相派遣學者訪問,增進了解,互通有無;共同邀請國內外專家學者,舉辦研討會,決定研究規劃和研究策略;研究院將部分基礎性研究,委托聯合實驗室進行;研究院資助聯合實驗室一定的相關軟硬件等。在這一階段的探討中,不僅積累了寶貴的合作經驗,而且獲得了豐碩的研究成果,具體包括雙語(英漢)語料庫詞匯對齊工具研究、雙語(英漢)語料庫加工、雙語(英漢)語料庫自動對齊算法研究、翻譯知識自動獲取技術研究、便攜式實例翻譯系統、中英文統計句法分析器等研究課題和項目。而且還培養了一批優秀的研究人員,這是雙方合作的第一個高潮。

在2004年6月,基于“哈工大-微軟機器翻譯技術聯合實驗室”所做出的成績以及哈工大在語言語音處理研究方面的研究成果,將已有實驗室進一步擴大成為必然。2004年6月4日至6日,時值“哈工大-微軟機器翻譯聯合實驗室”成立4周年之際,微軟亞洲研究院院長沈向洋博士等一行7人訪問哈工大。鑒于過去四年聯合實驗室取得的成績,雙方一致同意把合作范圍從原來單純的機器翻譯進一步擴展到自然語言和語音技術的研究,“哈工大-微軟機器翻譯聯合實驗室”的名稱也相應地改為“哈工大-微軟自然語言處理及語音技術聯合實驗室”。這是雙方合作進一步深入和廣泛的明顯標志。哈工大的合作主體,也由原來單獨的機器智能與翻譯研究室擴展到了智能技術與自然語言處理研究室、信息檢索研究室和語音處理研究室,這不但豐富了雙方合作所涉及的范圍,而且也加強了聯合實驗室整體研究的能力,這種合作框架一直保留至今。同年11月份,經教育部批準,聯合實驗室被批準為教育部重點實驗室,這是我們與微軟亞洲研究院合作歷史上的里程碑,也是對我們之前合作的極大肯定,聯合實驗室的合作被提到了新的高度,從此雙方合作更加正式規范,重點實驗室正式誕生,雙方的合作進入了第二個高潮。

在2006年7月,“教育部-微軟語言語音重點實驗室”深圳分部成立,雙方開始共同探討深入研究的新策略,這是雙方合作過程中的一個重大嘗試和突破,雙方合作日益成熟。

2人員構成與組織結構

“哈工大語言語音教育部-微軟重點實驗室”現由李生教授(哈工大)、周明博士(微軟)總體上負責和規劃,并分別擔任各方的主任;由王曉龍教授、趙鐵軍教授、韓紀慶教授和劉挺教授分別主持負責相關研究室的具體工作,擔任副主任。為了加強重點實驗室的學術研究實力和研究氛圍,我們還為此成立了學術委員會,包括微軟亞洲研究院洪小文副院長在內的海內外多名知名專家擔任委員,極大加強了重點實驗室的整體研究實力。

重點實驗室現有教師21人(其中教授7人,博導6人),在校博士研究生51人,本部碩士研究生95人,深圳分部40余人以及部分本科生,構成了一個完善的立體的研究體系,重點實驗室下設四個研究室和一個分部,分別是:機器智能與翻譯研究室、智能技術與自然語言處理研究室、信息檢索研究室、語音處理研究室和深圳分部(哈工大深圳研究生院)。其中前四個研究室位于哈工大本部,主要致力于相關方向的科學研究,注重培養研究型人才;而深圳分部,主要側重于將研究室的研究成果轉化為實際應用,偏重培養工程型人才。

3研究內容

重點實驗室研究領域廣泛,主要集中在語言和語音兩個重點上。語言處理方向上的具體研究集中在智能中文信息處理平臺設計與搭建,語句級中文輸入法模型研究,機器翻譯技術、資源、評價的研究,面向互聯網的信息檢索,問答系統、信息抽取與文本挖掘,自動文摘,詞法、句法和語義分析,自然語言生成等,基本上涵蓋了自然語言處理研究的各個方面;語音處理的具體研究圍繞在頑健語音識別與聲控技術,基于語音的信息安全技術和音頻信息檢索技術等方面。在這些研究領域,重點實驗室都投入了大量人力和物力進行相關研究。

其中“短語翻譯對評價”由已經畢業的一位博士負責,在其攻讀博士學位期間,曾在微軟亞洲研究院實習。短語翻譯對是指互為翻譯的源語言與目標語短語對,通常是從雙語句對中獲取的。在抽取過程中,僅對源語言句子進行句法分析,以詞對齊結果為依據獲取源語言短語的譯文。由于在抽取過程要受到詞對齊工具和漢語句法分析器精度的影響,因而在獲取的等價對中會存在著大量的噪聲。必須對其進行評價以消除其中的噪聲。在抽出的等價對中,其左部是一個包含句法信息的漢語短語,右部是一個英語短語。在過濾中,僅考慮源語言與目標語短語。例如,在判斷‘VO[靠/vg 窗戶/ng]->near the window’是否為一個正確的短語翻譯對時,僅考慮‘靠窗戶->near the window’。在對短語翻譯對進行評分時,使用了短語譯文直譯率L(Phc,Phe)、短語對齊概率P(Phc|Phe)和短語長度差異L1,L2,L3,L4為消歧特征對短語翻譯對進行評價。同時以這六種消歧特征為基礎,使用多種機器學習方法以提高評價的性能,最后通過深入研究,我們取得了比較好的實驗結果,完全達到了任務確立之初的要求。

4相關成果

在雙方的緊密合作下,重點實驗室的研究能力得到了飛速發展,自2000年以來,重點實驗室先后承擔國家及部委科研項目近40項,其中國家863計劃5項,國家自然科學基金重點項目1項,國家自然科學基金面上項目16項,部委項目15項,并且獲得省部級科技進步二等獎6項,三等獎5項。特別是在2005年,重點實驗室承擔的微軟基金項目“復述技術研究”,經過加工提煉,獲得國家自然科學基金的資助。重點實驗室和微軟聯合申請的基金“語音檢索”的國家自然科學基金項目,也得到了微軟的資助。近2年內,重點實驗室發表論文160余篇,其中在IEEE Transactions on Systems, Man and Cybernetics,Bioinformatics等國際期刊上發表5篇論文;在國際人工智能大會IJCAI’2007上發表2篇論文,在國際計算語言學大會Coling/ACL’2006上發表3篇論文,在國際計算語言學大會ACL’2007上發表1篇論文;在國內重要期刊《中國科學》上發表1篇論文。在這些發表的論文中,英文論文達到總量的40%。重點實驗室與研究院合作,在SIGIR、IJCAI和ACL等高水平國際會議上聯合發表論10余篇。在TREC 問答系統評測中,通過與全球30家參評單位,71個參評系統的角逐,取得了factoid問題評測中排名第五(國內參評單位中排名第一),list問題評測中排名第七(國內參評單位中排名第一)的好成績。在歷年的國家863評測中都取得了驕人的成果,具體包括:2003年文本分類系統獲第1名和自動文摘評測第1名;2004年,文本分類系統再次獲第1名;2005年,信息檢索評測綜合指標領先和詞對齊第1名。在2005國際SIGHAN漢語分詞評測中,由重點實驗室提供的ICSU詞法分析系統獲得微軟語料開放測試第一名。2006年9月,重點實驗室開始向學術界免費開發共享語言技術平臺LTP(Language Technology Platform),該平臺是基于XML的文本機內表示LTML(Language Technology Markup Language),目前已經提供了9項自然語言處理關鍵技術模塊,包括分詞、詞性標注、命名實體識別、詞義消歧、句法分析、語義角色標注、指代消解、自動文摘、自動分類等,已有國內外70余家學術機構簽署協議,共享了這個平臺。這些成績的獲得是我們研究能力不斷提高的證明,也是雙方成功合作的體現。

我們和微軟亞洲研究院不但在研究項目上開展了廣泛的合作,在學術交流上更是卓有成效。2000年7月,加拿大蒙特利爾大學聶建云博士和微軟亞洲研究院高劍峰博士來聯合實驗室講學,并就如何撰寫學術論文為研究生進行了實例點評。2002年8月,聯合實驗室部分師生參加微軟亞洲研究院在北京舉行的自然語言處理培訓班。2002年12月,微軟亞洲研究院自然語言計算組主任研究員周明博士訪問哈工大,并為聯合實驗室師生作學術報告。在重點實驗室成立后,微軟亞洲研究院先后為重點實驗室作了10余次高水平的技術報告,特別是在微軟亞洲研究院的支持下,重點實驗室成功承辦了2005和2006微軟暑期自然語言處理技術方面的專題研討班。研討班邀請了國際頂級學者,向全國的同行、學生開放,介紹國際自然語言處理技術的最新進展。2005年6月1日到3日在哈爾濱工業大學舉辦了微軟亞洲研究院信息抽取暑期研討班。來自全國20所大學的研究生和博士生以及教師參加了這次研討班。研討班有四位主講老師,他們是微軟亞洲研究院自然語言組研究員牛成博士,新加坡國立大學教授黃偉道博士(黃偉道博士也是當年ACL大會的程序委員會的主席)、微軟亞洲研究院語音組的研究員Frank Seide博士,以及美國南加州大學的林欽佑博士。牛成博士主講了信息抽取的基本技術、基本理論和應用。黃偉道博士主講了信息抽取中的從無結構和半結構的文本中抽取信息的技術和語義角色標注,Frank Seide博士主講了語音信息的抽取和檢索。林欽佑博士主講了信息抽取在自動文摘技術的應用。在6月1日的開幕式中,哈工大的李生教授、哈工大計算機學院副院長王亞東教授致詞,周明主任研究員代表微軟亞洲研究院致詞,參加會議的還有微軟亞洲研究院的大學關系部門的馬昕經理。大會的最后一天就研討班講授的內容組織了練習,全部同學被分成10組。每一組可以選擇六道題中的一道題。經過一個半小時的討論之后,每一組選出一位代表上臺作報告。然后選出了兩個表現優勝的組,頒發了獎品。另外對所有發言的同學,也都給予了獎勵,這期研討班為國內相關研究領域培養了一大批生力軍,取得了圓滿成功,也為下一期研討班的舉行奠定了基礎。2006年7月10日到11日在重點實驗室的深圳分部舉行了微軟新一代互聯網信息處理技術暑期研討班,在研討班舉行期間,微軟亞洲研究院副院長、著名語音專家、微軟搜索技術中心主任洪小文博士;著名語音專家、香港中文大學 Helen Meng教授;著名移動計算專家、微軟移動(深圳)研發中心研發總監劉希輝女士;著名在線廣告和搜索技術研究專家、微軟亞洲研究院研究員陳正博士;著名信息檢索專家、加拿大蒙特利爾大學聶建云教授;著名自然語言處理專家、微軟亞洲研究院研究員林欽佑博士;著名計算機圖形學、數字游戲專家、微軟亞洲研究院研究員周昆博士等10余名專家,都就自己所擅長的研究方法,為參加人員作了的精彩報告。使參加研討班的全國120多位教師和學生了解了相關領域最前沿的研究狀況,開拓了眼界,為今后進一步深入研究打下了堅實基礎。

5人才培養

在靈活的合作機制下,重點實驗室已經陸續派遣了來自下設4個研究室的40多位研究生,訪問了微軟研究院自然語言計算組和其他研究組。通過在微軟亞洲研究院,這個世界頂級的研究機構的鍛煉,極大提高了這些訪問學生的科研能力,為重點實驗室培養了寶貴人才,例如呂雅娟獲得2000年微軟學者獎學金,車萬翔獲得2005年微軟學者獎學金。

重點實驗室也為相關研究領域輸送了大量優秀人才,為整個研究領域的發展作出了不可磨滅的貢獻。作為微軟亞洲研究院自然語言計算組主任研究員的周明博士,就畢業于重點實驗室。此外工作在新加坡信息通訊技術研究院的張民博士、工作在美國Amazon的劉小虎博士、工作在日本NICT的曹海龍博士、現任東芝中國研發中心,副所長的王海峰博士、現任北京富士通研究開發中心,信息技術研究部部長代理的于浩博士也都出自重點實驗室。我們還為國內高校及研究所的研究和教育,輸送了一批優秀人才,例如工作于北京語言文化大學的荀恩東博士,工作于中科院計算所的呂雅娟博士,工作于蘇州大學的姚建民博士等。這些人在自己的崗位上繼續深化研究,帶動了相關領域的進一步發展。

“教育部-微軟語言語音重點實驗室”在哈工大計算機學院和微軟亞洲研究院長期穩定的合作的支持下,以優勢互補,友好協商,共同發展為合作原則,到目前為止,實驗室已完成或正在實施的重要科研項目已接近40項,包括國家自然科學基金(重點)項目、863計劃(重點)項目、省部級攻關項目、國際合作項目等;已發表論文400多篇。目前實驗室研究人員包括博士導師6人、具有博士學位的副教授8人、在職教師21人,博士研究生50余人、碩士研究生140余人,為相關研究領域輸送了大量人才。我們會再接再厲,不斷探索開拓合作方式,在更廣泛的領域開展更深入細致的合作,為相關研究領域的整體進步,貢獻自己的力量。

主站蜘蛛池模板: 欧美日韩专区| 成人福利在线看| 美女被操91视频| 欧美成人午夜在线全部免费| 中文字幕欧美日韩高清| 国产亚洲欧美在线视频| 国产免费久久精品99re不卡| 欧美中文字幕在线二区| 在线观看视频99| 茄子视频毛片免费观看| 午夜小视频在线| 久久五月视频| 不卡无码网| 国产91蝌蚪窝| 72种姿势欧美久久久久大黄蕉| 国产成人精品2021欧美日韩| 91精品综合| 中日无码在线观看| 另类综合视频| 日本久久免费| 激情综合婷婷丁香五月尤物| 久久国产精品嫖妓| 波多野结衣无码AV在线| 中文国产成人精品久久| 国产丝袜一区二区三区视频免下载 | 国产在线一区视频| 欧美成人午夜影院| 男人的天堂久久精品激情| 亚洲天堂.com| 中文字幕无线码一区| 天堂成人在线视频| 亚洲AV电影不卡在线观看| 欧美成人国产| 色偷偷一区二区三区| 久久香蕉国产线看观看精品蕉| 国产三级毛片| 亚洲成年网站在线观看| 亚洲国产亚洲综合在线尤物| 国产中文在线亚洲精品官网| 日韩无码真实干出血视频| 国产91线观看| 天天色天天操综合网| 58av国产精品| 欧美性天天| 无码粉嫩虎白一线天在线观看| 久久精品欧美一区二区| 一本无码在线观看| igao国产精品| 国产成人1024精品下载| 成人一区专区在线观看| 99国产在线视频| 免费大黄网站在线观看| 久久综合干| 欧美在线导航| 91福利片| 久久青草精品一区二区三区| 在线观看免费人成视频色快速| 国产精品私拍在线爆乳| 成人福利视频网| 三级国产在线观看| 国产成人精品亚洲77美色| 成人免费网站久久久| 99久久国产精品无码| 天天爽免费视频| 热这里只有精品国产热门精品| 欧美亚洲综合免费精品高清在线观看| 国产丝袜第一页| 中文字幕无线码一区| 四虎永久在线| lhav亚洲精品| 亚洲av片在线免费观看| 欧洲精品视频在线观看| 毛片网站观看| 国模极品一区二区三区| 国产成人午夜福利免费无码r| 亚洲欧美日韩精品专区| 乱系列中文字幕在线视频| 亚洲中文在线看视频一区| 美女免费黄网站| 精品第一国产综合精品Aⅴ| 国产成人精品视频一区二区电影 | 日韩无码精品人妻|