999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

微型內容:微格式的解決思路

2011-01-01 00:00:00謝明穎顧小清
現代教育技術 2011年3期

【摘要】基于微型內容的發展現狀,文章分析了微格式的意義和作用,認為微格式體現和拓展了對信息內容分割、結構分塊的思考和嘗試。詳細探討了微格式的信息分割處理功能,指出微格式在微型內容的識別和提取過程中所處的地位,展望其應用于微型學習的發展前景。

【關鍵詞】微格內容;微格式;信息識別;信息分割;信息提取

【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2011)03—0095—05

網絡環境中微型的、片段化的內容,以其更易發布、更易流傳、相對更高語義密度等特征,吸引了新一代網民的積極關注。如社會化網站和應用中的“狀態欄”服務,專門推送短小內容的Twitter、微博等網絡服務等,在短時間內就受到了熱烈的追捧。僅微博一項,早在2010年9月,新浪發布《中國微博元年市場白皮書》引用DCCI網絡調研數據預計:到2010年底,中國互聯網微博累計活躍注冊賬戶數將突破6500萬,2011年中將突破1億,2013年底這一數字有望突破4.6億[1]。

為了更輕松更快捷地獲得微型內容,除了提升終端設備的硬件性能外,微型內容獲取和處理過程也越來越引起關注。在向用戶推送微型化的內容之前,必須面對幾個問題:如何便捷地進行信息分割?如何自動地從宏內容抽取微型內容?如何提高微型內容的語義密度?本文將簡單介紹微格式這一概念,以及微格式在面對以上問題時的解決思路。

一 微型內容與宏內容

1998年Nielsen提出微型內容的概念時,將其定義為用來概括宏大內容的短小精要的東西[2]。一篇新聞的標題、網頁的標題介紹、E-mail的主題等都可被看作是微型內容。在Web2.0的新媒介環境下,微型內容被認為是“小片段、松散連接、一直處于動態重組中”的信息單元,也稱作微內容[3]。只要能夠滿足實用目標的某個自包含的知識組塊即可看做是微內容,首先,這些知識組塊可以來自任何一種信息,一則新聞、一段解釋、一個小游戲,甚至一組微型測試題。其次,微型內容不限定信息呈現形式,可以是一小段文本、一個圖片或圖像、一小段音頻或視頻片段或者就是一個鏈接。微型內容的生產和傳播過程表現出“自媒體”的特征,主要依靠用戶自己創建發布。服務提供商是直接面對和處理用戶產生的微型內容,而不是從非微型內容(即宏內容Macrocontent)中抽取微型內容。內容的微型化實際上由用戶或者專門發布者完成,網絡服務只負責微型化后的推送傳播。宏內容和微內容之間的轉化溝通過程依靠的是人類智能。如圖1(a)所示。

微內容的提取最初是為了快速預覽,在搜索引擎等信息檢索領域得到發展。盡管新浪發布的《中國微薄元年白皮書》宣稱以微博為代表的微內容服務呈現欣欣向榮的趨勢,但宏內容的信息畢竟在積累上更深厚,從信息“重用(reuse)”的角度來看,“對宏內容進行分解或抽取”也值得為之努力[4]。像搜索引擎的優化趨勢一樣,微型內容的生成必然會越來越多地依靠機器智能從宏內容中自動生成,如圖1(b)所示。

微內容興盛于宏內容之后,兩者的發展存在時間差距和結構差別。微內容向宏內容中整合似乎更易實現,反之則不然。目前宏內容信息向微內容站點嵌入采用引用鏈接跳轉的方式,這種方式技術門檻低,但沒經過信息識別和提取,只是全盤引址。要想通過機器讀取方式從宏內容中獲取微內容,并進一步進行移動終端的推送服務,需要解決一個最核心的問題:如何讓機器讀懂宏內容中不同類型不同結構的信息。

二 微格式及其解決思路

微格式(Microformats),簡單地說是一種元數據,它是用來分割、標注信息內容的數據格式。微格式官網上對其的解釋為“秉持著人類優先、機器次之的設計概念、建立在現有的且被廣泛采用的標準之上的一系列簡單、開放的數據格式。”[5]實際上,微格式是注入到Web頁面中的小段信息,通過語義相關讓信息塊內容人機可讀。微格式不是新的標記語言,它是在標準 XHTML代碼中嵌入結構化數據[6]的一種新方法,其實質還是XML語言。微格式的技術體系如圖2所示。

雖然將微格式看作是跨入語義網(Semantic Web)時代的標志還過于樂觀,但其在語義結構化方面帶來的極大影響是不可忽視的。微格式在分割信息和網頁結構化方面存在巨大潛力,這正是抽取微型內容的立足點。

1 微格式對信息的分割標注

微格式是一種網頁信息標記語言,對于瀏覽網站頁面的用戶來說是完全“透明的”,它的價值在于構建Web站點時,完成了對小片段信息的分類整理工作。用戶并不能從網頁上看到編寫者在哪里運用了微格式,但當信息在網站的各個功能模塊之間流通時,統一的、合理的微格式設計就能夠更有針對性更高效地引導信息。

從普遍意義上來看,所有的網站都有“item lists”,即將人、物、事等信息以列表的形式列出,這種方式一目了然方便查看。比如:

某位聯系人的姓名、職務信息、email地址等聯系信息;

某次聚會的主題、地點、時間、注意事項等事件信息;

某個群體內部各個成員之間的關系等關系信息;

……

如果是將數據讀出顯示在頁面上,這種列表很容易完成,但外部的應用程序要從某一頁面上將這些信息讀出來時則會有機器無法識別的問題。對于機器來說,讀到一串數字對它沒有任何附帶的實際意義:它無法分辨當前讀到的數字是一個門牌號碼、電話號碼,還是物品價格等等。我們可以設想每個應用程序都配置一整套識別方案,但如此做工作量浩大。微格式的使用和處理使得數據項目可被列表、查找、保存和對照,進而也可以實現重復使用和組合使用[7]。

在標注網頁信息時,根據具體數據類型不同(如上文所列出的聯系方式、事件、關系等),應選用不同的微格式子集。目前已開放的較穩定版本的微格式子集如下表所示。

其中,hCalendar和hCard下文將會詳細介紹。除了表中所列,還有更多的其他微格式子類型,大多處于不斷更新的草稿狀態。如用于標注地址信息的adr、用于標注地理位置經緯度的geo、用于同步標注博客等內容更新信息的hAtom……

通過微格式技術體系 ,可以定義和標記任何可以在網上發布的數據類型,或多數據類型組成的信息集合[8],實現第三方工具的抽取、轉換。微格式提供了“一種簡單可行、易于操作的語義之路”[9],提供了參照性的編碼格式和標注語言。

2 微格式分割信息的好處

(1) 標注和分割頁面信息

以最常用到的hCalendar為例來看。早在微格式概念被提出的2005年年底,Yahoo就已經收購了一個采用了微格式的網絡服務Upcoming(http://upcoming.yahoo.com),該網站就大量使用了hCalendar(甚至是rel-tag)來規范和結構化成千上百條事件(event)的信息,使得用戶能夠搜尋和跟蹤這些信息并且可以以事件為核心構建網絡虛擬社區。我們可以從Upcoming了解一下微格式具體是怎么分割信息并實現數據的結構化的。先來簡單了解一下hCalendar。它是microformats.org基于已被廣泛使用的iCalendar標準(RFC2445)發布的一個標準格式。主要使用的類(class)名有:根類名vcalendar和事件類名vevent。為了編碼便捷,允許沒有vcalendar類的時候將vevent作為根類名進行解碼。hCalendar常用屬性有很多,開始時間dtstart、摘要summary、地點location、鏈接地址url、結束時間dtend、持續時間duration等等不一而足,其中前兩項為必備屬性,其余可選。來看個簡單的,按照某個特定標簽(tag)或者是地點來列出事件信息的頁面。圖3展示的是Upcoming網站的一頁截圖,根據用戶要求的標簽(Mobile)以及地點(All Places)給出的訂閱事件列表。這個列表盡管簡單,但每一條事件記錄都采用了hCalendar來進行數據標注。

抽取其中一條記錄背后的代碼(有刪減)來看,我們可以了解hCalendar是如何分割開每條記錄的。

Oct 27+

Webit Expo Conferences 2010

Sofija

0

4

從以上代碼中我們可以看到每條記錄都使用了hCalendar中的vevent類來進行包裝和區分,使用了必備的dstart和summary,以及可選的location屬性。設想一下,如果需要設計一個應用來讀取該頁面上的事件列表,如何告訴程序待讀取的記錄從哪里開始?該代碼中當然是以vevent作為標志,該標志讓程序編寫者有了統一格式的識別目標,這就是使用微格式帶來的便捷。微格式的這種解決方案是從站點編寫者的舉手之勞建立起第三方程序開發者的邏輯便捷。拓展到Internet的網站網頁海洋,其聚集起來的省力效果是可觀的。

再看一個詳細介紹某條記錄的頁面,見圖4。這是一個叫做Social Media Masters Class的在線課程event,該頁面包括了事件標題、時間、所在地、詳細介紹等等。這是一個依托于普通社會站點的在線課程例子,從它看來,我們完全能夠使用微格式來發布常規的娛樂、會議、商務、教育活動、講座等等信息。

(2)瀏覽器的信息提取導出服務

基于微格式的信息提取和推送已經有不少應用。舉例來講,火狐的擴展中就有不少地址查詢、網址分析和微格式信息匯總導出等服務。在其附加組件中查找microformats能夠找到它們,如圖5所示。其中的Operator應用擴展,能夠識別、提取、導出當前瀏覽頁面中的微格式信息,支持聯系人(vCard)、事件(hCalendar)、地理位置(geo)等多種微格式子集,見圖6。

(3)跨平臺和服務的信息處理在Emerging Technology Conference(ETech)上,微軟推出了其Windows Live系列產品新秀Live Clipboard[10]。顧名思義,該產品提供的是在線剪貼板服務功能,但又與普通概念的復制粘貼不同。Live Clipboard可以跨越不同站點平臺、不同瀏覽器,以及本地PC應用程序之間,提供結構性信息的流通服務。這里的結構性信息,正是借助了微格式分割并結構化后的“信息塊”。舉例來說:Hotmail、Yahoo以及本地電腦的Outlook都提供Calendar服務,以方便用戶安排工作日程和團隊工作,通過Live Clipboard,用戶可以在這三者之間任意進行日程安排信息的交換,與普通復制粘貼不同的是,用戶得到的結果將按照目的程序的條目結構直接寫入目的日程表中。在Live Clipboard的網站(http://www.liveclipboard.org),我們可以找到其開放的程序源代碼和頁面顯示代碼。其示例頁面上能夠看到Live Clipboard至少支持微格式的hCard 和hCalendar子集,其樣例和部分頁面代碼如圖7所示。

三 總結和展望

運用微格式可以更快速準確地將數據分類傳輸,迎合微型內容的松散組合要求。圖8總結并展示了微格式在信息處理過程中的位置和作用。

微格式并不是一個專注于技術挖掘的高深概念,理解并不難,使用也越來越容易。部分微格式子集(hCalendar、hCard和XFN)已經有了專用的代碼生成工具,稱為Creator,用戶只需將關鍵信息填入表單,就可得到符合微格式的代碼。

微格式不僅在網站建設、瀏覽器擴展、跨平臺服務方面具有優勢,在與移動情境融合方面也存在廣闊的應用前景。雖然移動終端服務方面起步較晚,但隨著各類移動應用的發展,用于用戶個人信息、通訊錄、備忘錄等結構化信息交換越來越頻繁,可以將微格式標注的統一格式信息發送到手機等移動終端的技術(如諾基亞開發的移動Widgets等)也已經相當成熟,可以實現將網站中用戶訂閱的event自動對應寫入手機中的日歷備忘欄中等等。

在微型學習領域,由于使用移動終端學習要求學習內容短小精悍,微型學習在很大程度上基于微型內容,我們不妨將應用于微型學習的微型內容稱為微型學習內容。從設計的角度來看,微型學習內容,在內容層面剛好可以容納一個小的實用性學習主題;而在技術層面上,則可以由機器識別和提取,并推送至某種移動設備上清晰呈現[11]。當涉及到小屏幕、小容量、低速率的微型移動學習終端時,微格式所致力的微型內容識別和提取技術成為微型內容與微型學習發展的關鍵技術之一。我們不妨設想,使用微格式定義和標記微型學習的有關信息,如課程對象、教師信息、資源分類等等,能夠更加優化學習資源的索引和調用,并允許第三方應用程序將讀出的結構化信息進行簡單的整理,推送到移動終端,帶來更令人滿意的學習和交互體驗。

參考文獻

[1] 蔡偉.新浪發布中國微博市場首份白皮書——微博成熟還需再等三年[N].南方日報,2010-9-10(A17).

[2] Jakob Nielsen. Microcontent: How to Write Headlines,Page Titles, and Subject Lines[EB/OL].

[3]What is microlearning[EB/OL].

[4] Arnaud Leene. The MicroWeb-using microcontent in theory and practice[DB/OL].

[5] What are microformats[EB/OL].

[6] Jack D. Herrington.Separate Data and Formatting with Microformats:Create Simple, Pragmatic Formats for the Semantic Web[EB/OL].

[7] Microformat-Wikipedia[EB/OL].

[8] 李書寧.基于微格式的信息組織與處理框架[J].圖書情報工作, 2007,(8) :35-37,112.

[9] Danny A. The short path to the future web[J]. IEEE InternetComputing, 2006, (11-12) : 77-79.

[10] Nat Torkington. ETech: Ray Ozzie[DB/OL].

[11] 顧小清,顧鳳佳.微型學習策略 :設計移動學習[J].中國電化教育.2008,(3) :17-21.

MicroContent: Microformats' Solution

XIE Ming-ying GU Xiao-qing

(School of Education Science, East China Normal University, Shanghai 200062,China)

Abstract: Base on the development of microcontent, this article analyzed the meaning and role of microformats, took microformats as an approach that can embody and expand people's thinking and trying in information division and structure. It investigated what can microformats do in identifying, dividing, and extracting information, and then summarized the important role of miroformats and their potential in the heated new microlearning area.

Keywords: microcontent; microformats; information identification; information division; information extraction

主站蜘蛛池模板: 成人字幕网视频在线观看| 手机精品福利在线观看| 亚洲天堂视频在线观看| 亚洲综合日韩精品| 四虎永久在线精品国产免费| 国产18页| 久久精品人妻中文系列| 91成人试看福利体验区| 亚洲va欧美va国产综合下载| 狠狠色噜噜狠狠狠狠色综合久 | 亚洲精品天堂在线观看| 精品国产网站| 伊人色综合久久天天| 精品第一国产综合精品Aⅴ| 老汉色老汉首页a亚洲| 真实国产乱子伦高清| 国产簧片免费在线播放| 国产网站免费| 亚洲经典在线中文字幕| 99热精品久久| 中文字幕亚洲综久久2021| 国内精自视频品线一二区| 国产欧美精品一区aⅴ影院| 国产在线自在拍91精品黑人| 国产免费福利网站| 亚洲一区免费看| 日韩精品中文字幕一区三区| 国产在线视频福利资源站| 91视频区| 日韩精品欧美国产在线| 白浆视频在线观看| 亚洲欧洲日韩国产综合在线二区| 色综合久久88| 一级做a爰片久久毛片毛片| 在线播放真实国产乱子伦| 无码AV高清毛片中国一级毛片| 亚洲—日韩aV在线| 99人妻碰碰碰久久久久禁片| 国产精品福利一区二区久久| 激情無極限的亚洲一区免费| 久久国产成人精品国产成人亚洲| 极品国产一区二区三区| 国产成人91精品| 久久久久亚洲AV成人人电影软件| 欧美日韩一区二区三区在线视频| 免费欧美一级| 伊人久久综在合线亚洲2019| 国产色图在线观看| 亚洲V日韩V无码一区二区| 日本a∨在线观看| 伊人久久久久久久| 在线观看无码a∨| 日韩福利在线观看| 亚洲a免费| 2020久久国产综合精品swag| 成人欧美日韩| 亚洲精品无码日韩国产不卡| 九九热视频精品在线| 亚洲第一黄色网址| 亚洲欧美激情小说另类| 26uuu国产精品视频| 精品91在线| 国产玖玖视频| 欧美成人免费一区在线播放| 亚洲大尺码专区影院| 亚洲av中文无码乱人伦在线r| 欧美一区二区三区香蕉视| 欧美国产成人在线| 超碰91免费人妻| 国产一区二区色淫影院| 在线精品欧美日韩| 亚洲国产在一区二区三区| 精品三级在线| 日本在线视频免费| 亚洲欧美在线精品一区二区| 黑色丝袜高跟国产在线91| 久久久久久尹人网香蕉| 久久精品无码国产一区二区三区 | 亚洲Av激情网五月天| 91麻豆精品国产高清在线| 国内精自线i品一区202| 啪啪啪亚洲无码|