999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

張全:給網絡裝上“電子眼”

2009-05-31 09:47:38
發明與創新·大科技 2009年5期

姜 靖

今年1月底,正當全國上下開展整治互聯網低俗之風專項行動之際,中科院聲學所研發出一種具有語義理解特點的“網絡不良信息檢測系統”,能幫助監管部門和網站管理者監控色情和低俗等不良信息。張全正是該項目的負責人,本來就很忙的他,一下子又讓新聞界給“包圍”了。

“我沒有故事,就是一個普通人?!睆埲辉購娬{。然而,隨著采訪的深入,記者仿佛從這個“普通人”身上看到千千萬萬科研工作者的身影,他們的喜憂苦樂是那樣的真實,可愛。

三個月研發出系統

“你用‘三點造個句,如何?”一開始,記者本想請張全簡單介紹一下這套“網絡不良信息檢測系統”,孰料他先給記者出了一道考題。

“三點確定一個平面。我三點有個采訪……”記者隨口答。

“你的造句發到網上,很有可能被當成不良信息被屏蔽掉?!睆埲⑿Φ卣f。

記者愕然。這時,他不慌不忙地打開電腦,調出一個程序,輸入了一個網址。不一會兒,屏幕開始提示有幾十個“不良信息”。然而,打開這些所謂的“不良信息”一看,其實就是幾則再正常不過的反邪教信息。

張全解釋說,傳統的網絡監測系統,一般是基于關鍵詞對網絡信息進行機械的識別和過濾,只要文本里含有設定的關鍵詞,不管這個詞是什么意思,甚至如“小三點了一杯咖啡”里“三點”都不是一個詞,也會被屏蔽掉。

與傳統的網絡監測系統不同,他們的這套系統主要根據語句的意義來判斷哪些網頁信息需要過濾。用戶只要輸入目標網站的網址,系統便會自動打開該網站的所有網頁,同時模擬人瀏覽網頁的方式來審查是否還有不良信息,對于不能做出判斷的內容系統還能提出警告,供人工判別。

張全說,這就好比為網絡裝上了“電子眼”,能幫助監管部門和網站管理者從源頭上“遏制不良信息傳播,凈化網絡環境?!?/p>

為了提供檢測標準,他們課題組針對網絡上出現的色情、反動、低俗等不良信息進行了搜集,對其語言特征和語意特點進行了提取,建立了一個龐大的不良信息知識庫,為軟件搜索不良信息提供了文字基礎。

目前,他們對該系統進行的語料測試已超過3萬篇,測試成功率達85%以上,“完全達到了商品化的要求”。通過更換知識庫,該系統就可廣泛應用在熱點信息跟蹤、輿情分析等領域。

出人意料的是,這套系統的研發時間并不長,“去年下半年才開始做,滿打滿算也就3個月的時間?!睂τ谶@點,張全很是自豪。

好技術竟然賣不出去

張全告訴記者,“網絡不良信息檢測系統”是自然語言理解處理技術與先進的網絡技術結合的產物。從20世紀80年代末,中科院聲學所黃曾陽研究員就開始探索模擬人腦語言智能的自然語言理解處理模式,創立了“概念層次網絡(HierarchicalNetworkof Concepts,簡稱HNC)理論”,并發展形成了HNC自然語言理解處理技術。HNC的最大特點是能夠進入語義深層處理自然語言的內容,而不是僅僅利用語言的表層信息進行處理。通過多年的科研攻關,HNC團隊已經取得了多項成果,形成了自主知識產權的自然語言理解處理技術,為形成滿足信息時代要求的各種特定的信息處理技術奠定了堅實的基礎。

然而,張全從事自然語言理解處理研究卻是在讀博士以后。1993年,從西北工業大學碩士畢業的他面臨人生的一次重大抉擇。“我本科、研究生學的都是信號處理,研究生畢業的時候,希望自己的研究方向有所改變?!币粋€偶然的機會,他認識了黃曾陽老師。與黃老師的幾次深談,堅定了他轉行的決心。

然而,這次轉行并沒有想象的那么輕松,而是“痛苦的像是重新生了一回?!睆埲f,自然語言處理是語言學與計算機技術的交叉學科,對語言學和計算機的要求都非常高,單單寫幾千行的程序這一項就讓他“吃不消”。

不過,與技術上的困難相比,張全面臨最大的挑戰是如何將技術產業化。張全說:“一項再完美的技術,只有在市場中才能體現出其應用的價值,停留在實驗室無異于死路一條?!睆埲f。1996年博士畢業后,他的工作重心就轉向技術轉化上來。當時,盡管國內做自然語言處理的不止他們一家,然而如何將自然語言處理技術進行技術轉化,是大家都在探索的問題,沒有現成的模式可循,同時,自己單位又沒有產業化的平臺,致使產業化一度陷入困境。2000年年底,他們嘗試利用BNC理論的無形資產與外面公司聯合成立了按企業模式獨立運營的研究院,計劃將其打造成產業化基地,因種種原因,這一目標還在努力之中。

去年下半年,國內凈化網絡環境的呼聲日益高漲,張全他們在短時間內研發出“網絡信息不良信息監測系統”,希望搭乘國家整治不良信息的快車,打開市場。

也曾遭遇“無米下鍋”

身為自然處理項目負責人,張全不得不花時間精力去談項目,找經費?!拔腋憧蒲谐錾恚郧翱傁胫龊醚芯烤托辛恕薄H欢F在他坐在這個位置上,就不可能對這些事完全置身事外,如果有一個好項目,覺得機會好,他也會花時間來談。

張全說,雖然聲學所做自然語言處理已有45年的歷史,但是至今在很多人眼里,做語言處理應該不是聲學所的事,聲學所來做就難以形成品牌效應,每次拿出去跟人家談都要解釋一番,項目更不會主動找上門來。很長一段時間,課題組“吃了上頓沒下頓。”

張全回憶說,1996年到1998年間,課題組基本上申請不到課題,沒有課題就沒有經費,當時中科院系統已開始全成本核算,所里給予了一定的幫助但非常有限,課題組成員的收入很難和其他課題組相比,一些研究人員選擇了離開。課題組只剩下幾個人。因為在外面找不到住處,張全只好在博士生宿舍“賴”了一年多。有個細節張全印象特別深,那時有很多同學在外面混的特別好,每次同學聚會,他只管去吃,同學從來不忍心讓他付錢。

“也不覺得苦,當時也沒小孩,物價水平也不高,生活還是沒有太大問題?!睆埲⑿Φ卣f。

一直到1998年底,課題組申請到新的課題,一切才漸漸恢復正常。1999年年底,聲學所被批準進入中科院創新基地后,所領導給予了課題組很大的經費、人員和機制的支持,使得課題組人員一度達到20多人。那段時間,課題組科研進展很快,成果出得也多。

張全說,隨著信息時代的發展,對自然語言處理技術的需求將愈來愈多,計算機的功能必將由以簡單的數值計算為主逐步過渡到以信息知識處理為主。那時,他們的自然語言理解處理技術將大有可為。

然而,在培育產業環境的同時,他們最為迫切的任務是完善專業知識庫,但是因為經費不足,這項工作進展一直不太順利。

主站蜘蛛池模板: 无套av在线| 日韩高清一区 | 国产成人精品一区二区三区| 久久久久人妻一区精品色奶水| 国产情精品嫩草影院88av| 精品国产香蕉伊思人在线| 欧美69视频在线| 女人毛片a级大学毛片免费| 99精品视频播放| 鲁鲁鲁爽爽爽在线视频观看| 欧美成人亚洲综合精品欧美激情| 5388国产亚洲欧美在线观看| 国产午夜精品鲁丝片| 亚洲一区免费看| 91精品伊人久久大香线蕉| 久久久久久尹人网香蕉| 婷婷色狠狠干| aa级毛片毛片免费观看久| 国产91视频观看| 婷婷色中文网| 热这里只有精品国产热门精品| 91无码网站| 成年A级毛片| 国产福利免费观看| 一区二区三区精品视频在线观看| 中文字幕无线码一区| 91麻豆久久久| 九九久久99精品| 91精品aⅴ无码中文字字幕蜜桃| 欧美午夜小视频| 精品国产一区91在线| 中文字幕佐山爱一区二区免费| 久久国产拍爱| 日韩在线欧美在线| 国产精品永久在线| 免费观看精品视频999| 一级毛片免费播放视频| 毛片网站观看| 黄色一及毛片| 欧美激情伊人| 免费国产在线精品一区| 无码视频国产精品一区二区 | 亚洲自拍另类| 女人18一级毛片免费观看| 亚洲va在线∨a天堂va欧美va| 国产乱子伦精品视频| 97一区二区在线播放| 国产第一色| 国产在线麻豆波多野结衣| 亚洲婷婷丁香| 精品国产成人高清在线| 婷婷色婷婷| 97色婷婷成人综合在线观看| 少妇极品熟妇人妻专区视频| 国产精品欧美日本韩免费一区二区三区不卡 | 精品国产黑色丝袜高跟鞋| 国产精品免费p区| 青青青伊人色综合久久| 亚洲无码视频一区二区三区 | 亚洲综合色吧| 97精品久久久大香线焦| 无码一区18禁| 亚洲第一页在线观看| 亚洲日韩高清在线亚洲专区| 婷婷综合缴情亚洲五月伊| 99视频精品全国免费品| 国产毛片久久国产| 精品综合久久久久久97| 欧美日韩资源| 999精品视频在线| 久久精品嫩草研究院| jijzzizz老师出水喷水喷出| 中文天堂在线视频| 福利视频久久| 91美女视频在线| 欧美日韩一区二区在线免费观看| 亚洲综合久久一本伊一区| 国产乱肥老妇精品视频| 91免费国产在线观看尤物| 欧美在线观看不卡| 日韩小视频网站hq| 激情网址在线观看|