999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

音頻搜索新紀元

2008-12-31 00:00:00黃婷婷
互聯網周刊 2008年13期

小琦在收音機里偶然聽到一首動人的歌曲,但是主持人并沒有報出這首歌的名字,于是他馬上抄筆記下歌詞,希望通過網絡搜索獲得這首歌的信息,在百度的歌詞搜索里輸入這句歌詞后,他很快得到了想要的結果。

關于通過音頻內容文字來搜索音頻的概念,我們很快會聯想到如小琦一樣的搜索經驗,似乎將音頻與文字掛鉤的技術早已不算是什么新鮮玩意,那么為什么日本產業技術綜合研究所日前發布的一個音頻搜索網站會得到業界如此廣泛的關注呢?

不僅僅是歌曲

同樣是小琦,這次當他想通過在節目里聽到的字句來搜索一段相聲的時候卻出了問題,搜索答案五花八門,卻找不到他想要的。

通常,我們使用最多的音頻搜索都是針對于某一首歌曲的搜索,而它的歌詞與歌曲的發布往往是同步的,整合這些數據并不需要多大的技術支持,因為這些內容都已經是現成的。然而除了歌曲,官方的一些朗誦、彩鈴、評書、對白等作品,以及隨著web2.0時代的到來,網絡上涌現的大量草根族作品,如一段用錄音筆隨手錄下的講話、自我娛樂的博客音頻等等,各種以聲音為載體的信息也都通過網絡這種渠道傳播開來。如何在這樣浩繁的數據庫里查找所需的片斷,成為困擾互聯網搜索的難題。我們會通過其他的渠道如電視、廣播等獲得相關的信息,當我們被某一個信息吸引的時候,我們就有了獲得它本身甚至更多邊緣信息的需要。如果我們手里只掌握這個音頻本身內容中的若干字句,沒有它的名字、作者,乃至更多的信息,怎么搜到我們想要的?于是我們發現,尋常意義上的簡單音頻搜索已很難滿足我們的需求了。

除了那些本身已有歌詞文字可考的歌曲文件,更多的聲音文件需要有一個后臺將他們的內容轉化為文字,方便用戶的搜索操作。于是日本的這個名為Podcastle的網站經過多年探索,終于在6月上線,真正實現了通過內容文字進行音頻搜索。這項服務采用聲音識別技術,將聲音數據全部自動轉換成文字,收集到數據庫中,使人們方便地進行音頻檢索。比如在網站搜索欄中輸入日文“桉”,就能搜索到出現“桉”這個字的音頻資料。

前人的腳印

其實早在一年前,波士頓初創公司EveryZing便推出了一款與前者設計原理異曲同工的視頻和音頻搜索引擎一一PodZinger,這是一款播客搜索引擎,它采用了BBN技術公司開發的一種語言系統,可將音頻內容轉換成文本,而且準確率在80%以上,足以體現音頻的主要內容,能指導用戶迅速在文件中找到某個搜索目標詞出現的地方,并總結出音頻內容的核心意思。

之前《互聯網視頻革命的第一槍》這篇文章曾對PodZinger的強大功能作過闡述,Podzinger可以在網絡上抓取視頻、音頻文件,利用語音識別技術深入分析其文件內容,根據用戶搜索需求提交相應結果。它有一種軟件能夠“聽”視頻文件中的語音,并轉換成可供搜索引擎使用的文本。搜索結果中的每個詞語都可以點開并載入音頻剪輯,在指定的詞匯點上開始播放。這無疑是一種革命性的突破。Podzinger的文本記錄對于搜索者而言遠比傳統搜索引擎根據“元數據(Metadata)”搜索結果所顯示的音頻和視頻剪輯更具有相關性。

EveryZing公司首席執行官Tom Wilde當年也曾如此驕傲地介紹這款產品:這么高的準確度可以帶來許多新搜索功能,比如提供視頻和音頻的完整文本,以及直接跳到話語中某個詞或者詞組被說出的位置。這項技術還可以讓公司提供與特定內容有關的有針對性廣告,就好像Google推出的基于網頁中文本的廣告一樣。

語音識別的難題

語音識別這個概念,我們并不陌生,從孤立詞到大詞匯量連續語音的識別(LVCSR),再到語音庫檢索,語音識別技術一直在向前發展,只是語音識別似乎離我們還有些遙遠。“今后5年內,互聯網搜索將更多地通過語音來完成。”今年的2月23日,比爾·蓋茨在美國卡內基·梅隆大學發表演講說道,這已數不清是他第幾次在公開場合提及語音識別了。

對于中文而言,語音識別技術的實現較之英語面臨著更多的困難。當南方人把“牛奶”念成“留來”的時候,究竟是機器識別錯了,還是人錯了?微軟中國研發集團下屬微軟亞洲研究院語音識別組組長宋言哥平提出過這樣一個問題。而不僅僅是南北口音的偏差,每個人都有獨有的發音習慣。這就造成了語音輸入很難規范的問題。其次,噪聲也是一種不可抗的難題。“這很好理解,機器無法像人那樣分辨出人聲和噪聲。”宋言哥平解釋道,“同時,不同場景有不同噪聲,訓練的情況也不能匹配真實環境,這使語音識別在噪聲中比在安靜的環境下難得多。”

克服這些難題尚需時日,這也是為何中文音頻搜索進展緩慢的一個關鍵原因。如今日本的音頻搜索網站已經上線,中國的用戶也期待著可以更快享受到這種先進搜索技術帶來的更多便捷。

告別簡單搜索時代

在信息瘋狂膨脹的年代,對于浩瀚信息中的有效資源搜索毫無疑問是相當重要的。如今娛樂化風潮的涌起,使信息的需求早已不是以往單純的純文本而已,而是更大規模地擴展到音頻、視頻領域。以往單純通過音頻、視頻文件的文本標簽來搜索音頻、視頻文件已經不足以滿足用戶的需求。

于是出現了這種通過將音視頻內容轉換成文字的搜索方式。

然而在簡單搜索之外,還不僅僅是這種運用語音識別系統完成的搜索服務技術正在流行。當文字搜索已經發展到幾乎沒有上升空間的時候,微軟、Google這些技術巨頭也開始瞄準未來的新一代搜索市場。今年的4月份,在北京舉行的國際萬維網大會上,兩位Google的工程師展示了下一代的圖片搜索。新的圖片搜索不再只是由圖片相關的文字來判斷圖片的內容。Google將使用計算機分析圖片中的內容,并關聯關鍵字的排名。實際上,這就相當于圖片搜索中PageRank。

在早些時候,《互聯網周刊》上也報道過這樣的消息:新一代圖片搜索技術已經可以像人一樣,“看”到一幅圖片的興趣中心,判別它是人物肖像照或是風景照、攝于室內還是戶外。甚至,在人的協助下,計算機還能夠在許多張合影中找尋到同一張人臉。這些聽起來不可思議的事情,已經在微軟的實驗室里變成了現實,甚至有些技術已應用到部分產品當中。

搜索技術已經迎來了一個新的時代,在各種新型搜索服務的幫助下,我們的各種需求都將慢慢得到滿足。科技,正在向著更加人性化的一面發展,一切,都在為人類生活得更好而努力著。

主站蜘蛛池模板: 国产精品午夜福利麻豆| 欧美成人精品欧美一级乱黄| AV色爱天堂网| 精品无码日韩国产不卡av| 精品国产自在在线在线观看| 视频在线观看一区二区| 全午夜免费一级毛片| 欧美成人亚洲综合精品欧美激情| 无码精品国产VA在线观看DVD| 亚洲性日韩精品一区二区| 亚洲国产清纯| 热思思久久免费视频| 国产香蕉在线| 久久精品国产精品一区二区| 五月婷婷精品| 99精品久久精品| 69综合网| 亚洲综合18p| 69视频国产| 高潮爽到爆的喷水女主播视频| 在线视频亚洲色图| 日本精品视频一区二区| 国产激爽爽爽大片在线观看| 久久精品人人做人人| 国产日本一线在线观看免费| 成人久久18免费网站| 国产精品无码AV中文| 一级全免费视频播放| 波多野结衣国产精品| 久久综合激情网| 久久香蕉国产线看精品| 国产91色在线| 精品无码国产一区二区三区AV| 青青操视频在线| 大乳丰满人妻中文字幕日本| 91破解版在线亚洲| 欧美性久久久久| 无码区日韩专区免费系列| 国产精品页| 久久性视频| 国产欧美高清| 亚洲精品你懂的| 青青国产成人免费精品视频| 激情无码字幕综合| 国产剧情一区二区| 国产欧美专区在线观看| 999国内精品视频免费| 真人免费一级毛片一区二区| 国产91高清视频| 亚洲天堂视频在线播放| 国产99免费视频| 久久成人18免费| 成人国产精品2021| 国产国产人在线成免费视频狼人色| 久久国产精品影院| 波多野结衣亚洲一区| 一级一级一片免费| 在线免费a视频| 无码中文字幕精品推荐| 毛片a级毛片免费观看免下载| 久久久久青草大香线综合精品| 999在线免费视频| 久无码久无码av无码| 91久久偷偷做嫩草影院电| 欧美在线综合视频| 九色视频最新网址| 成人免费黄色小视频| 欧美伊人色综合久久天天| 成人精品视频一区二区在线 | 在线观看91香蕉国产免费| 成人免费黄色小视频| 国产欧美日韩视频怡春院| 亚洲成人手机在线| 精品久久久久成人码免费动漫| 久久毛片网| 欧美精品一区二区三区中文字幕| 国产精品页| 凹凸国产熟女精品视频| 亚洲精品不卡午夜精品| 亚洲男人的天堂久久精品| 精品91自产拍在线| 被公侵犯人妻少妇一区二区三区|