摘要:針對現有搜索技術在支持產品創新設計知識獲取方面存在的不足,研究了面向產品創新設計領域的信息搜索方法,建立了類似于內部語義網的產品設計語義庫#65377;借助語義網絡擴展關鍵詞的語義內涵,實現對用戶檢索意圖的理解;以此為基礎建立了面向特定設計領域的網絡信息檢索方法和流程,使得搜索獲得的信息內容更加全面,主題更加鮮明#65377;最后以手機產品創新設計信息搜集為例予以驗證#65377;
關鍵詞:創新設計; 語義網絡; 信息獲取
中圖分類號:TP391文獻標志碼:A
文章編號:10013695(2007)04011703
0引言
隨著新產品上市的周期越來越短,產品開發周期也越來越短#65377;設計師需要從各個方面迅速獲取產品設計方面的信息,如用戶需求#65380;用戶偏好#65380;產品的流行趨勢以及其他公司同類產品的設計信息等#65377;設計師只有對包括市場等設計信息進行細致的調查研究后,才能為產品的設計與開發提供及時#65380;準確的情報,從而避免盲目性#65380;增強自覺性,并有利于預測未來市場的需求和發展趨勢#65377;然而,面對瞬息萬變的市場需求和急劇增加的設計任務,設計師個人在市場知識獲取#65380;分析和思維創新等方面的能力是有限的,甚至存在創新源枯竭之虞#65377;
本文針對產品設計過程中對產品設計創新信息的需求特點,通過分析現有搜索技術在支持產品設計方面存在的不足,研究了面向產品創新設計領域的信息及素材搜索方法,在建立了產品設計領域的概念語義網絡的基礎上,提出針對產品外觀設計創新的網絡知識檢索#65380;產品設計信息過濾技術及其實現方法#65377;
1現有網絡搜索技術的不足
Internet正成為一個無所不包#65380;結構龐雜的巨型知識庫,已成為產品創新設計信息的重要來源#65377;如何有效地利用網絡上的信息資源為產品創新設計服務已經成為產品創新設計發展面臨的難題,然而現有搜索技術在支持產品設計知識獲取方面存在很大的不足[1]#65377;
(1)目前的互聯網搜索站點是一種通用的信息搜索引擎,不能以產品性能特征為搜索目標,因而無法滿足產品創新設計對信息搜索的要求,不符合現代產品創新設計信息需求的特點#65377;
(2)現有的網絡信息檢索是以關鍵詞為核心的詞對詞匹配方式進行的#65377;在針對產品設計創新領域的信息檢索中,其在信息準確度和檢索效率等方面都不能使人滿意#65377;
(3)由于搜索到的信息主要以非格式化的HTML頁面存在,計算機很難進行統計#65380;篩選等處理,只能由人來瀏覽#65377;無法實現面向產品設計創新信息的自動過濾與整理#65377;
(4)以關鍵詞匹配為核心的全文檢索技術雖然較好地解決了網頁細節的檢索問題,然而對細節的重視又引發了其致命缺陷——返回的信息太多#65377;在網頁爆炸性增長的今天,沒有一個用戶有時間和精力來一一瀏覽搜索引擎查到的每一個網頁#65377;
(5)返回網頁太多只是全文檢索技術存在問題的外在表現,其背后是以關鍵詞匹配為核心的信息檢索技術所面臨的三個深層次問題,即忠實表達#65380;表達差異和詞匯孤島[2]#65377;這三個問題都與以詞對詞匹配過程緊密相關#65377;
通過上面的分析可以看出,當前搜索引擎所使用的技術難以解決找信息難的問題#65377;造成這種困難的原因的實質在于搜索引擎缺乏知識處理能力和理解能力,對要檢索的信息僅僅采用機械的關鍵詞匹配來實現#65377;詞的內在信息負載太小,把它作為信息檢索的唯一入口,必將帶來包括返回信息過多在內的種種問題#65377;
將信息檢索從目前基于關鍵詞層面提高到基于知識(或概念)的層面是解決問題的根本和關鍵#65377;為此,文獻[3]提出了以網對網的搜索引擎設計思路,即使用內部語義網來實現對Internet信息的檢索,從Internet到內部語義網的映射(Mapping)包括概念映射和概念關系映射,是一個知識獲取的過程#65377;該思想能夠使搜索引擎從基于關鍵詞的匹配檢索提高到基于知識的檢索#65377;與傳統的基于關鍵詞的檢索手段相比,它有著顯著的優勢#65377;然而,因為人的知識,特別是常識性知識具有數量上的浩瀚無際,在質量上又有高度的不確定性和模糊性,要建立這樣一個知識網絡是困難的#65377;
理論上完備的內部語義網雖然難以實現,但是可以通過降低求解目標的方法實現#65377;針對產品創新設計領域對具體的搜索引擎需求,建立相應的產品設計知識庫(或語義庫),這里的知識庫是對內部語義網的一種近似#65380;一種局部實現#65377;針對產品設計某一領域所反映的知識來構造一個局部的小知識庫是相對容易實現的#65377;它的知識在數量和質量上雖然不能與理想的內部語義網相比,對具體搜索任務卻是實用的#65377;本文以語義詞匯庫為基礎,借助語義網絡來實現對用戶檢索意圖的理解,以擴展關鍵詞的語義內涵#65377;
2面向產品設計的內部語義網絡的建立
2.1產品設計概念詞典的建立
董振東先生1999年提出的研究成果——知網(HowNet),為自然語言理解提供了一個新的研究資源#65377;《知網》提供了一個概念詞典的原型,但是它是一個通用的詞典,沒有考慮到產品設計領域的特點,必須對它進行擴展#65377;例如紅色象征著熱情和活力,紫色代表浪漫,黃色代表濃艷等,反映產品設計領域所特有的概念及含義必須被加到對概念的定義中去#65377;此外,對于設計而言,必須加上與產品相關的一些屬性,作為對其概念的細化#65377;例如,結構#65380;功能#65380;形態(色彩#65380;形狀)#65380;原理#65380;材料等,都是一個產品設計過程中必須考慮的要素#65377;
在對概念的擴展中,本文嚴格按照《知網》所定義的關系進行,以便能做到更好的兼容性#65377;在概念詞典中,概念與概念以及概念與特征之間的關系主要體現在每個記錄的概念定義項(DEF項)中#65377;而在各個特征文件中,這些關系則體現在特征的層次組織樹#65380;必要角色框架和共性特征描述項中#65377;所有這些,都通過知網提供的知識詞典描述語言(KDML)來實現#65377;
2.2產品設計概念詞典中關系的提取
首先根據產品創新設計領域的特點,建立一個初始語義網絡;然后根據這個初始網絡,將概念詞典中與此相關的隱含的各種語義關系提取出來,形成關系表;并以此為中心建立概念與概念之間的內在聯系,形成一個比較完善的網狀信息表示結構,即語義網絡#65377;在這個語義網絡中,通過任何一個信息入口都可以很方便地訪問到與此相關的各個概念#65377;具體來說,就是通過設計概念表#65380;關系表和同義詞表,將概念語義網絡隱含在表1~3中#65377;
關系表中的每個記錄描述了這樣一種關系:<關系左項><關系右項><關系名稱>#65377;其中<關系左項>和<關系右項>分別是一個概念的編號,通過指針指向概念表的相應記錄位置#65377;概念表的每條記錄代表一個概念,描述了概念的基本信息,并通過指針分別指向以這個概念為關系右項或關系左項的關系表記錄#65377;同義詞表中列出了同義詞信息,它也通過指針指向概念表中相應的記錄位置#65377;這樣,通過各個表中的指針就將這三張表組成一個網狀結構#65377;
產品設計領域概念詞典中包含了豐富的語義信息,為了便于計算機處理,筆者以結構化的形式將包含在概念詞典中的各種關系提取出來,存入關系表中#65377;在概念詞典中包含的關系有顯式關系#65380;隱式關系和組合關系#65377;產品設計領域概念詞典是建立在知網詞典的基礎上的,因此,它當中包含的顯式關系是一致的,只需簡單提取即可;對于隱式關系,首先定義了一些特殊的關系符,然后通過對概念詞典的特殊處理,把它們提取出來;對于組合關系,《知網》中提供了一些組合符號,來表達兩種以上關系的組合含義#65377;
2.3基于產品設計概念詞典語義網絡的建立
語義網絡是一種采用網絡形式表示人類知識的方法,它由概念#65380;關系和屬性組成#65377;語義網絡的節點是概念;連接節點的有向弧表示關系;負載于節點上的特征值表示屬性#65377;
圖1為概念語義網絡的基本流程圖#65377;對于給定的初始語義網絡,從概念詞典中提取出相關概念(詞語義項)的基本信息加入概念表中;從各個概念的定義項(DEF)中提取出概念與特征#65380;概念與概念之間的關系及其組合關系,加入詞典關系表中#65377;然后通過概念屬性特征分析,建立反映概念之間的上下層關系的概念分類樹作為語義網絡的骨干#65377;最后,在分類樹的基礎上添加橫向關系,把整個樹聯系起來形成一個語義網絡圖#65377;
產品設計概念語義網絡的生成以提取詞典中的關系為核心內容#65377;考慮到詞典文件的不斷完善和擴充,提取關系模塊采用了開放式的設計方法,可以方便地修改#65380;更新已生成的網狀數據結構#65377;根據出品設計創新所需信息的實際特點,建立了個性化的產品設計語義網絡,由呈樹狀結構的概念節點相互連接構成#65377;概念節點是語義網絡的基本元素,節點之間的連接關系表達了概念之間不同的語義關聯(實線)#65377;其描述格式如下:
class ConceptNode{
String Name[]; //概念節點的名稱
String Definition[]; //概念節點的知網描述
int Number[]; //概念節點的編號
int FatherNode[]; //父節點的代號,即父概念的代號}
每一個概念節點都由這四項所構成,形成了對分類樹的完整描述#65377;在相關關系表中存儲了各種相關映射#65377;表中的每一項代表在語義網絡圖中的一條虛線,其表示為Relationship Descriptor(para1,para2)
其中,Relationship Descriptor是關系描述;para1#65380;para2分別代表關系所涉及的兩個對象,其值是該對象的概念編號#65377;在此基礎上定義了一系列語義網絡操作函數,用于實現對各屬性項的初始化#65380;讀取和運算#65377;
由于概念詞典中包含了豐富的產品設計領域知識概念及其關系,為了實現個性化的信息搜索,需要構建一個面向特定主題的初始語義網絡#65377;在這個初始網絡的基礎上,通過對用戶輸入的關鍵詞——名義關鍵詞進行初步擴展,得到語義進一步細化的目標關鍵詞,進行網頁信息的搜索#65377;在此基礎上,對得到的網頁信息進行預處理及語義相關判斷,對于滿足條件的信息予以保留,并將其特征概念詞匯加入到語義網絡中,以豐富其語義內涵,強化個性特征#65377;按照這個搜索流程,經過多次循環作業即可實現語義網絡知識的自豐富和自擴展,搜索過程的個性化特征也會逐漸突顯出來#65377;圖
2為設計知識個性化搜索過程的基本流程圖#65377;
3基于Web的產品設計信息倉庫的構建
經過檢索之后獲得了關于查詢主題的返回頁面,但這里返回頁面只是包含了一些URL,沒有頁面的具體內容#65377;為了完成設計素材的原始積累,必須將與URL對應的網頁下載#65377;為了使信息倉庫中的內容做到既不遺漏,又不重復,就必須正確地識別返回頁面上的超鏈接,并對各種超長頁面#65380;空頁面#65380;死鏈接#65380;重復鏈接等均能作出正確處理#65377;通過初步的處理可獲取一些有效的頁面信息,將其按主題保存在信息倉庫中,并在數據庫中建立相應的索引#65377;通過這些處理,可實現對網絡環境下產品設計相關素材的原始積累,即完成信息倉庫的初步構建#65377;圖3為信息倉庫的結構示意圖#65377;
4實例及結果分析
本研究通過在Windows 2000服務器上應用JBuilder 8和SQL Server 2000開發了一個面向產品創新設計的知識獲取原型系統#65377;實例中,以手機產品的外觀設計為主題,設定的名義關鍵詞為“手機”,通過語義擴展后產生的目標關鍵詞包括“大哥大”“移動電話”“架子”“造型”“結構”“機理”“功能”“色彩”“鈴聲”等#65377;用擴展后的目標關鍵詞進行信息檢索并構建如圖4所示的網頁信息倉庫;圖5為手機設計信息倉庫中關于手機結構的信息搜索結果#65377;
顯然其搜索獲得的內容更全面,主題更顯明#65377;該系統在網絡環境下工作,能夠在一定程度上幫助設計師從眾多的網絡信息素材中獲取有用的信息,為設計師的設計活動提供一定的指導作用#65377;
5結束語
本文通過研究面向Internet的設計知識#65380;信息和素材的自動獲取,探尋知識的及時更新和自我豐富機制,以求在產品設計智能化方面取得在知識獲取問題上的突破,為設計師獲取產品設計知識提供一條便捷的途徑,并為面向領域的知識自動獲取技術的研究提供一定的借鑒意義#65377;但本研究在獲得主題鮮明,結果高效的網頁素材的同時,仍然存在返回網頁太多,產品設計知識和設計素材#65380;設計信息等有待進一步整理等問題#65377;在進一步的研究中,筆者將通過文本過濾等技術,對產品創新設計知識#65380;素材和信息進行進一步的整理與挖掘#65377;
本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。