倪子健,李文強(qiáng),唐 忠
(1.四川大學(xué)機(jī)械工程學(xué)院,四川成都 610065;2.四川大學(xué)創(chuàng)新方法與創(chuàng)新設(shè)計(jì)四川省重點(diǎn)實(shí)驗(yàn)室,四川成都 610065)
產(chǎn)品設(shè)計(jì)的目標(biāo)是使產(chǎn)品具備相應(yīng)功能,即功能是產(chǎn)品存在意義的體現(xiàn)[1]。對(duì)產(chǎn)品功能進(jìn)行定義并建立相應(yīng)的功能模型是產(chǎn)品概念設(shè)計(jì)的重要組成部分[2]。Gero[3]提出了可用于描述產(chǎn)品概念設(shè)計(jì)過程的FBS(function-behavior-structure,功能-行為-結(jié)構(gòu))模型,即將概念設(shè)計(jì)過程看作由功能層到行為層再到結(jié)構(gòu)層的求解過程;殷習(xí)等[4]基于FBS模型研究了功能變更再設(shè)計(jì)的相關(guān)理論;為實(shí)現(xiàn)對(duì)產(chǎn)品功能的規(guī)范化描述,Stone等[5]建立了描述產(chǎn)品功能的語言——功能基,功能基為“作用方式+作用對(duì)象”的詞匯組合,如吸收能量、檢測(cè)信號(hào)等。
在產(chǎn)品概念設(shè)計(jì)階段,為實(shí)現(xiàn)產(chǎn)品的功能,設(shè)計(jì)人員須通過查閱大量已有的設(shè)計(jì)資料(如專利、書刊和網(wǎng)頁等)來獲取設(shè)計(jì)知識(shí)和設(shè)計(jì)靈感,其中跨領(lǐng)域的相關(guān)知識(shí)是激勵(lì)產(chǎn)品創(chuàng)新設(shè)計(jì)的關(guān)鍵。在知識(shí)的檢索與獲取過程中,本體是語義擴(kuò)展的常用知識(shí)庫之一[6]。本體位于語義網(wǎng)的語義層,可描述客觀世界概念以及概念之間的關(guān)系[7],在語義網(wǎng)中具有重要地位。本體所提供的概念和概念間關(guān)系的形式化描述可為語義檢索提供有用的工具[8-11]。與關(guān)鍵詞檢索相比,基于本體的語義檢索可提供語義關(guān)聯(lián)的檢索結(jié)果。因此,利用本體進(jìn)行語義檢索能夠跨越語義鴻溝,檢索到與檢索詞語義相關(guān)的資料。在產(chǎn)品設(shè)計(jì)領(lǐng)域,已有許多學(xué)者將本體用于語義檢索,以輔助產(chǎn)品的創(chuàng)新設(shè)計(jì)。例如:Zhang等[12]利用語義網(wǎng)和本體理論,提出了基于語義相似度的產(chǎn)品設(shè)計(jì)知識(shí)檢索聚類模型;Qin等[13]利用基于本體的語義檢索方法,構(gòu)建了特征模型本體并進(jìn)行本體推理,以輔助異構(gòu)CAD(computer aided design,計(jì)算機(jī)輔助設(shè)計(jì))模型的設(shè)計(jì);Fang等[14]構(gòu)造了領(lǐng)域本體,并利用Lucene本體推理機(jī)制進(jìn)行了關(guān)鍵詞語義擴(kuò)展,實(shí)現(xiàn)了工程文檔的檢索;Phan等[15]將本體運(yùn)用于專利的檢索,通過挖掘?qū)@麅?nèi)容與其分類的語義關(guān)系來提高檢索準(zhǔn)確率;Mabkhot等[16]構(gòu)建了基于本體的決策支持系統(tǒng),通過自動(dòng)推理和相似度檢索來實(shí)現(xiàn)產(chǎn)品特征和制造工藝案例的選擇。
目前,基于本體的語義檢索方式大致分為2種:一種是根據(jù)本體中確定的語義關(guān)系,對(duì)輸入的檢索關(guān)鍵詞直接進(jìn)行語義延伸,獲取與檢索關(guān)鍵詞語義相關(guān)的詞匯后基于語義距離進(jìn)行語義相似度計(jì)算,并根據(jù)相似度排序得到檢索結(jié)果[6,12];另一種是根據(jù)本體中確定的語義關(guān)系,對(duì)輸入的檢索關(guān)鍵詞進(jìn)行語義推理,得到滿足推理?xiàng)l件的檢索結(jié)果[13-16]。然而,無論是哪種檢索方式,檢索結(jié)果均取決于本體中確定的語義關(guān)系,這是因?yàn)樯鲜稣Z義檢索過程只能按照本體中確定的語義關(guān)系開展,而無法有效利用本體中隱含的語義關(guān)系。
在解決實(shí)際工程問題時(shí),設(shè)計(jì)人員往往會(huì)運(yùn)用具體的自然語言來描述產(chǎn)品的功能需求,這與高度抽象的功能基之間存在語義鴻溝。同時(shí),各領(lǐng)域的設(shè)計(jì)知識(shí)與功能基之間也缺乏有效的對(duì)應(yīng)關(guān)系。因此,如何從功能角度規(guī)范設(shè)計(jì)人員的自然描述語言并通過相應(yīng)功能檢索到跨領(lǐng)域的設(shè)計(jì)知識(shí),是有效支持產(chǎn)品創(chuàng)新設(shè)計(jì)的關(guān)鍵問題。基于此,筆者通過挖掘本體概念之間隱含的語義關(guān)系來提高對(duì)跨領(lǐng)域設(shè)計(jì)資料的檢索能力,旨在為設(shè)計(jì)人員提供更多的跨領(lǐng)域設(shè)計(jì)知識(shí),以激發(fā)其設(shè)計(jì)靈感。
為實(shí)現(xiàn)對(duì)本體隱含語義關(guān)系的挖掘,須針對(duì)產(chǎn)品功能建立合適的語義本體,其構(gòu)建流程如圖1所示。首先,對(duì)語義資源中的概念實(shí)體進(jìn)行提取,本文選用WordNet、HowNet以及《現(xiàn)代漢語詞典》語料庫作為語料資源,對(duì)其中描述功能的詞匯進(jìn)行整合。然后,通過定義2種關(guān)系(基本關(guān)系和復(fù)雜關(guān)系)來構(gòu)建語義本體,其中,基本關(guān)系初步?jīng)Q定了概念實(shí)體之間的語義親疏,如“上位、下位”等,通過定義基本關(guān)系得到樹狀結(jié)構(gòu)的語義關(guān)系;復(fù)雜關(guān)系用于概念實(shí)體之間的動(dòng)態(tài)關(guān)聯(lián),如“作用對(duì)象”“用于”“作用領(lǐng)域”等,通過定義復(fù)雜關(guān)系得到網(wǎng)狀結(jié)構(gòu)的語義關(guān)系。基于這種方式構(gòu)建的語義本體在邏輯上包含了一定范圍內(nèi)的功能語義,如機(jī)床-用于-制造、機(jī)床-作用對(duì)象-零件等。基于此所挖掘得到的本體隱含語義關(guān)系將會(huì)繼承這種功能語義,保證了概念實(shí)體之間是基于功能語義的關(guān)系,同時(shí)保證了各概念的連通性,避免了孤立概念群的存在以及其給網(wǎng)絡(luò)表示學(xué)習(xí)方法帶來的干擾。

圖1 語義本體構(gòu)建流程Fig.1 Construction process of semantic ontology
網(wǎng)絡(luò)表示學(xué)習(xí)方法是將復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)的數(shù)據(jù)節(jié)點(diǎn)表示成低維空間中連續(xù)、稠密的向量,從而方便計(jì)算機(jī)更好地處理網(wǎng)絡(luò)信息。目前,常用的網(wǎng)絡(luò)表示學(xué)習(xí)方法有 DeepWalk[17]、LINE(large-scale information network embedding,大規(guī)模信息網(wǎng)絡(luò)嵌入)[18]和struc2vec[19]。其中,DeepWalk 通過隨機(jī)游走的方式來獲取節(jié)點(diǎn)序列,該游走路徑即為節(jié)點(diǎn)之間的關(guān)系,這使得參與訓(xùn)練的節(jié)點(diǎn)在邏輯上具有一定的關(guān)聯(lián)。該方法的核心思想是利用節(jié)點(diǎn)序列中的已知節(jié)點(diǎn)預(yù)測(cè)缺失節(jié)點(diǎn)[20]。因此,本文選擇DeepWalk對(duì)本體語義關(guān)系進(jìn)行挖掘,以獲得隱含的語義關(guān)系。
語義本體可被看作是一個(gè)復(fù)雜的網(wǎng)狀結(jié)構(gòu)數(shù)據(jù)集合,可表示為G=(V,E)。其中:V={v1,v2,…,vn},代表語義本體網(wǎng)絡(luò)的節(jié)點(diǎn);E={e1,e2,…,em},代表語義本體網(wǎng)絡(luò)節(jié)點(diǎn)之間特定的語義關(guān)系。選取節(jié)點(diǎn)vi作為游走起點(diǎn),沿著語義本體網(wǎng)絡(luò)中的邊隨機(jī)游走,可得到關(guān)于節(jié)點(diǎn)vi的步長(zhǎng)為s的隨機(jī)游走序列。利用節(jié)點(diǎn)的隨機(jī)游走可得到大量游走序列,這些序列反映了語義本體網(wǎng)絡(luò)中的語義信息。
假設(shè)在語義本體網(wǎng)絡(luò)中得到的隨機(jī)游走序列為{v1,v2,…,v}i,則節(jié)點(diǎn)vi出現(xiàn)的概率可表示為P(vi|v1,v2,…,vi-1)。
引入映射關(guān)系φ(V)∈R(d維度為d)將節(jié)點(diǎn)映射到維度為d的向量空間中,則節(jié)點(diǎn)vi出現(xiàn)的概率可表示為P[vi|φ(v1),φ(v2),…,φ(vi-1)]。
隨著語義本體網(wǎng)絡(luò)復(fù)雜程度的提升以及隨機(jī)游走序列的增加,節(jié)點(diǎn)出現(xiàn)概率的計(jì)算會(huì)變得逐漸復(fù)雜。為避免這種問題出現(xiàn),采用skip-gram模型將基于已知序列預(yù)測(cè)缺失節(jié)點(diǎn)轉(zhuǎn)變?yōu)榛谛蛄兄行墓?jié)點(diǎn)預(yù)測(cè)周圍節(jié)點(diǎn),即用一個(gè)窗口截取游走序列的一部分來限定所需預(yù)測(cè)的周圍節(jié)點(diǎn)的個(gè)數(shù)。若用一個(gè)長(zhǎng)度為2w+1的窗口來截取游走序列,即用[vi-w,vi-w+1,…,vi-1,vi,vi+1,…,vi+w]來表示給定中心節(jié)點(diǎn)vi,則其左右兩側(cè)的2w個(gè)節(jié)點(diǎn)出現(xiàn)的概率為P[vi-w,…,vi-1,vi+1,…,vi+w|φ(vi)]。
根據(jù)網(wǎng)絡(luò)表示學(xué)習(xí)方法的原理,最終得到的結(jié)果應(yīng)使中心節(jié)點(diǎn)周圍的2w個(gè)節(jié)點(diǎn)出現(xiàn)的概率最大,即min{- logP[vi-w,…,vi-1,vi+1,…,vi+w|φ(vi) ]}。
利用深度學(xué)習(xí)方法來訓(xùn)練語義本體網(wǎng)絡(luò),并采用隨機(jī)梯度下降方法來求取目標(biāo)概率的極值,以得到最終期望的映射關(guān)系φ(V)。φ(V)是上述訓(xùn)練網(wǎng)絡(luò)的隱含參數(shù),它是一個(gè)n×d維的矩陣。
圖2所示為語義本體網(wǎng)絡(luò)中的一個(gè)隨機(jī)游走序列,虛線橢圓框?yàn)榧僭O(shè)的一個(gè)窗口截取游走序列的一部分。以節(jié)點(diǎn)v3為中心節(jié)點(diǎn),基于節(jié)點(diǎn)v3預(yù)測(cè)其周圍節(jié)點(diǎn)(節(jié)點(diǎn)v1、v2、v4和v5)出現(xiàn)的概率并使概率最大,其本質(zhì)上可以看作是以確定的語義關(guān)系為橋梁建立未連接節(jié)點(diǎn)之間隱含的語義關(guān)系,即對(duì)語義本體中確定的語義關(guān)系進(jìn)行擴(kuò)充。

圖2 隨機(jī)游走序列與隱含語義關(guān)系挖掘Fig.2 Random walk sequence and implicit semantic relationship mining
由此可知,在本文方法中,語義本體中的詞向量是通過確定的語義關(guān)系訓(xùn)練而來的。與現(xiàn)有的基于大規(guī)模語料庫的詞向量訓(xùn)練方法相比,語義本體網(wǎng)絡(luò)的節(jié)點(diǎn)之間具有更強(qiáng)的邏輯關(guān)系,而大規(guī)模語料庫依賴于文本中特征詞匯出現(xiàn)的頻率[21-23],計(jì)算量龐大且容易受到噪聲的干擾。因此,基于語義本體中確定的功能語義關(guān)系擴(kuò)充得到的詞向量間的相似度能夠更好地量化與比較語義關(guān)系[24]。
基于所構(gòu)建的語義本體以及通過訓(xùn)練得到的語義關(guān)系,提出面向產(chǎn)品功能的語義檢索方法。以功能基為紐帶,通過功能語義匹配和設(shè)計(jì)資料檢索兩個(gè)過程,實(shí)現(xiàn)設(shè)計(jì)人員根據(jù)自然語言描述語句獲取跨領(lǐng)域設(shè)計(jì)資料的目的。在利用語義本體中確定語義關(guān)系擴(kuò)充后得到的語義向量空間中,用對(duì)應(yīng)的詞向量來表示功能的自然語言描述語句、跨領(lǐng)域知識(shí)和功能基,通過詞向量之間的運(yùn)算得到對(duì)應(yīng)的功能語義向量,以實(shí)現(xiàn)功能語義檢索任務(wù)。
與功能基的描述一致,采用“作用方式+作用對(duì)象”的詞匯組合來表達(dá)功能,其中“作用方式”為動(dòng)詞,“作用對(duì)象”為名詞。為了計(jì)算隱含的功能語義關(guān)系向量,運(yùn)用基于語義類比的向量運(yùn)算進(jìn)行計(jì)算。例如:詞語“King”和“Male”之間的關(guān)系與詞語“Queen”和“Female”之間的關(guān)系是類似的,基于語義的向量運(yùn)算可表示為:c(King)-c(Male)+c(Female)≈c(Queen),即c(King)-c(Male)≈c(Queen)-c(Female)。 其 中c(word)表示該詞語所對(duì)應(yīng)的詞向量。從向量相減的幾何意義可知,如果將詞向量看作是語義向量空間中的點(diǎn),那么詞向量相減所得到的新向量即為連接這2個(gè)點(diǎn)的有向線段。而在語義向量空間中,連接2個(gè)點(diǎn)的有向線段為二者之間的語義關(guān)系。因此,隱含的功能語義關(guān)系向量c(F)可表示為:

基于語義類比的向量相減運(yùn)算可迅速建立詞匯之間潛在的功能語義關(guān)系,這種方式能夠靈活地反映語義本體網(wǎng)絡(luò)中沒有連接的節(jié)點(diǎn)(尤其是距離很遠(yuǎn)的節(jié)點(diǎn))之間的語義關(guān)系。通過動(dòng)詞和名詞向量相減運(yùn)算得到的隱含的功能語義關(guān)系向量,從功能角度量化了語義關(guān)系,從而建立了設(shè)計(jì)人員需求描述自然語言、功能基以及多領(lǐng)域設(shè)計(jì)資料之間的統(tǒng)一表達(dá)形式,并以功能為共同橋梁跨越語義檢索過程中的語義鴻溝,可更好地實(shí)現(xiàn)有關(guān)功能語義的多領(lǐng)域知識(shí)檢索。
功能語義匹配與設(shè)計(jì)資料檢索是功能語義檢索的最終環(huán)節(jié)。產(chǎn)品功能語義匹配是將用戶對(duì)產(chǎn)品功能的自然語言描述語句轉(zhuǎn)換為規(guī)范化的功能基的過程,即完成從功能的自然語言描述語句到功能基的語義匹配,如圖3所示。

圖3 功能語義匹配流程Fig.3 Process of functional semantic match
由圖3可知,從功能的自然語言描述語句到功能基的語義匹配過程是根據(jù)詞匯之間的語義相似性來實(shí)現(xiàn)的。首先,將設(shè)計(jì)人員對(duì)產(chǎn)品功能的自然語言描述語句進(jìn)行文本預(yù)處理,提取其中的檢索關(guān)鍵詞(包括關(guān)鍵動(dòng)詞和關(guān)鍵名詞)。檢索關(guān)鍵詞提取過程的偽代碼(算法1)如下:


然后,在語義向量空間中,找到所提取的關(guān)鍵動(dòng)詞和關(guān)鍵名詞對(duì)應(yīng)的檢索關(guān)鍵詞向量。若一個(gè)功能的自然語言描述語句中含有多個(gè)動(dòng)詞或名詞,則在將其全部提取后按照“動(dòng)詞+名詞”的方式進(jìn)行組合,并根據(jù)就近原則以及相應(yīng)的語料資源,選取其中使用頻率較高的詞匯組合,以剔除干擾并減少計(jì)算量。完成篩選后,由詞匯組合中的詞向量構(gòu)成檢索關(guān)鍵名詞和關(guān)鍵動(dòng)詞矩陣,并通過向量運(yùn)算得到對(duì)應(yīng)的隱含語義關(guān)系向量,稱為功能描述向量,由功能描述向量構(gòu)成功能描述矩陣。同時(shí),對(duì)用向量表示的功能基進(jìn)行向量運(yùn)算,得到相應(yīng)的功能基向量,由功能基向量構(gòu)成功能基矩陣。最后,通過計(jì)算功能描述矩陣與功能基矩陣中對(duì)應(yīng)詞向量之間的語義相似度,完成產(chǎn)品的功能語義匹配,將設(shè)計(jì)人員的設(shè)計(jì)需求匹配到相應(yīng)的功能基。功能語義匹配過程的偽代碼(算法2)如下:



設(shè)計(jì)資料檢索流程如圖4所示。同樣地,先對(duì)跨領(lǐng)域的設(shè)計(jì)資料進(jìn)行文本處理,得到設(shè)計(jì)關(guān)鍵詞(關(guān)鍵動(dòng)詞和關(guān)鍵名詞),將其映射到語義向量空間中并通過向量運(yùn)算得到隱含語義關(guān)系向量,稱為設(shè)計(jì)知識(shí)向量,由設(shè)計(jì)知識(shí)向量構(gòu)成設(shè)計(jì)知識(shí)矩陣。由于與上文中處理自然語言描述語句的方式相同,采用算法1提取設(shè)計(jì)關(guān)鍵詞。然后,以功能基為索引,計(jì)算功能基矩陣與設(shè)計(jì)知識(shí)矩陣中對(duì)應(yīng)詞向量之間的語義相似度,擴(kuò)展得到對(duì)應(yīng)功能的設(shè)計(jì)知識(shí),完成相應(yīng)功能語義的設(shè)計(jì)知識(shí)檢索任務(wù)。

圖4 設(shè)計(jì)資料檢索流程Fig.4 Process of design material retrieval
以“如何快速高效地采摘水果并且保護(hù)果實(shí)不受損傷”作為設(shè)計(jì)人員對(duì)產(chǎn)品功能需求的描述語句,利用本文方法進(jìn)行多領(lǐng)域?qū)@麢z索,以從不同領(lǐng)域的專利中獲得靈感來輔助水果采摘裝置的創(chuàng)新設(shè)計(jì)。
步驟1:語義本體構(gòu)建。
建立小型的語義本體是語義關(guān)系挖掘的基礎(chǔ)。運(yùn)用本體構(gòu)建工具Neo4j構(gòu)建針對(duì)水果采摘裝置的語義本體,其對(duì)應(yīng)網(wǎng)絡(luò)的具體參數(shù)如表1所示。

表1 語義本體網(wǎng)絡(luò)參數(shù)Table 1 Semantic ontology network parameters
將構(gòu)建完成的語義本體網(wǎng)絡(luò)以鄰接表或鄰接矩陣的方式存儲(chǔ),該本體網(wǎng)絡(luò)共有958個(gè)節(jié)點(diǎn),則要構(gòu)建一個(gè)958×958維的鄰接矩陣,如圖5所示。矩陣中的“1”表示對(duì)應(yīng)行和對(duì)應(yīng)列所在位置的節(jié)點(diǎn)相互連接,即存在確定語義關(guān)系;“0”表示沒有節(jié)點(diǎn)連接,即未定義語義關(guān)系。

圖5 語義本體網(wǎng)絡(luò)對(duì)應(yīng)的鄰接矩陣Fig.5 Adjacency matrix corresponding to semantic ontology network
步驟2:隱含的語義關(guān)系挖掘。
運(yùn)用DeepWalk對(duì)所構(gòu)建的語義本體網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練參數(shù)如表2所示。利用訓(xùn)練得到的節(jié)點(diǎn)向量間接反映語義關(guān)系擴(kuò)展后的語義本體,并基于此構(gòu)建相應(yīng)的語義向量空間。通過訓(xùn)練得到的語義本體網(wǎng)絡(luò)的部分節(jié)點(diǎn)向量如圖6所示。

表2 DeepWalk的訓(xùn)練參數(shù)Table 2 Training parameters of DeepWalk

圖6 語義本體網(wǎng)絡(luò)的部分節(jié)點(diǎn)向量Fig.6 Partial node vectors of semantic ontology network
通過訓(xùn)練得到的節(jié)點(diǎn)向量的元素都反映了隱含語義關(guān)系挖掘后的擴(kuò)充語義。基于所構(gòu)建的語義本體網(wǎng)絡(luò)參數(shù),共獲得958×50個(gè)語義關(guān)系,這與原有稀疏的鄰接矩陣所表示的1 493個(gè)確定的語義關(guān)系相比,本體概念之間的語義聯(lián)系更為豐富。通過本體語義關(guān)系擴(kuò)充所得到的語義本體網(wǎng)絡(luò)節(jié)點(diǎn)向量能夠在2個(gè)方面支持功能語義檢索:1)概念之間可以通過基于語義類比的向量運(yùn)算建立隱含的功能語義關(guān)系;2)可以通過向量的相似度計(jì)算來比較概念之間的語義接近程度。
步驟3:文本預(yù)處理與檢索關(guān)鍵詞提取。
語義本體中的概念實(shí)體是以作用方式(動(dòng)詞)和作用對(duì)象(名詞)的形式呈現(xiàn),因此須對(duì)自然語言描述語句文本進(jìn)行預(yù)處理并提取其中與功能相關(guān)的檢索關(guān)鍵詞(動(dòng)詞和名詞)。采用哈爾濱工業(yè)大學(xué)語言技術(shù)平臺(tái)(language technology platform,LTP)對(duì)設(shè)計(jì)人員的功能需求自然語言描述語句以及多領(lǐng)域?qū)@谋菊M(jìn)行分詞和詞性標(biāo)注,以便提取檢索關(guān)鍵詞。
對(duì)于本例中輸入的自然語言描述語句,根據(jù)分詞和詞性標(biāo)注得到的結(jié)果為:如何(pronoun)、快速(adverb)、高效(noun-modifier)、地(auxiliary)、采摘(verb)、水果(noun)、并且(conjunction)、保護(hù)(verb)、果實(shí)(noun)、不(adverb)、受損傷(verb)。對(duì)其中的檢索關(guān)鍵詞進(jìn)行提取后得到:采摘、保護(hù)、受損傷(關(guān)鍵動(dòng)詞);水果、果實(shí)(關(guān)鍵名詞)。需要注意的是,關(guān)鍵動(dòng)詞“受損傷”的前面有否定副詞“不”修飾,而在描述功能時(shí)應(yīng)盡量避免由否定副詞修飾的動(dòng)詞出現(xiàn),根據(jù)算法1,在提取檢索關(guān)鍵詞時(shí)去掉否定副詞后面的動(dòng)詞。根據(jù)就近原則以及漢語語言使用規(guī)律,得到出現(xiàn)頻率最高的功能語義描述組合為“采摘水果”和“保護(hù)果實(shí)”。將得到的關(guān)鍵名詞和動(dòng)詞按照相應(yīng)的組合關(guān)系構(gòu)成相應(yīng)的檢索關(guān)鍵詞矩陣,例如[水果,果實(shí)]和[采摘,保護(hù)]。本次實(shí)驗(yàn)隨機(jī)選取800個(gè)覆蓋51個(gè)功能基的發(fā)明專利文本摘要作為檢索樣本庫(部分專利包含多個(gè)功能),按照同樣的處理方式對(duì)專利文本的摘要進(jìn)行分詞、詞性標(biāo)注、關(guān)鍵詞提取以及篩選正確的功能語義描述組合,得到相應(yīng)的設(shè)計(jì)知識(shí)矩陣。
步驟4:功能語義匹配與設(shè)計(jì)資料檢索。
在語義本體網(wǎng)絡(luò)中找到功能描述矩陣、功能基矩陣和設(shè)計(jì)知識(shí)矩陣中的詞匯,并將每個(gè)詞匯替換為基于DeepWalk得到的節(jié)點(diǎn)向量。通過算法2的計(jì)算得到功能語義匹配結(jié)果,如表3所示。結(jié)果表明,與設(shè)計(jì)人員對(duì)水果采摘裝置功能需求的自然語言描述語句最為接近的功能基為“分離物質(zhì)”和“吸收能量”。

表3 基于語義相似度的水果采摘裝置功能語義匹配結(jié)果(部分)Table 3 Functional semantic matching results of fruit picking device based on semantic similarity(partial)
設(shè)計(jì)資料檢索過程與功能語義匹配過程類似。在檢索時(shí),設(shè)計(jì)人員以基于語義匹配得到的功能基為索引,通過檢索獲得具有相關(guān)功能語義的設(shè)計(jì)資料。在本例中,通過語義匹配得到的功能基為“分離物質(zhì)”和“吸收能量”,其中基于“分離物質(zhì)”檢索得到的部分專利文本如表4所示。

表4 基于語義相似度的水果采摘裝置設(shè)計(jì)資料檢索結(jié)果(部分)Table 4 Design data retrieval results of fruit picking device based on semantic similarity(partial)
基于功能基“分離物質(zhì)”,在預(yù)先準(zhǔn)備的800個(gè)發(fā)明專利中檢索得到22個(gè)與水果采摘裝置高度關(guān)聯(lián)的發(fā)明專利(語義相似度大于0.5),其中包含機(jī)械、建筑等多領(lǐng)域的專利。由此說明,通過功能語義檢索,設(shè)計(jì)者人員能夠以功能基為紐帶,基于對(duì)功能需求的自然語言描述語句獲取相應(yīng)的跨領(lǐng)域設(shè)計(jì)資料。
步驟5:初步設(shè)計(jì)方案確定。
在本例中,根據(jù)設(shè)計(jì)人員對(duì)功能需求的自然語言描述語句中的“采摘水果”得到功能基“分離物質(zhì)”,進(jìn)而檢索得到一系列關(guān)于“分離物質(zhì)”的發(fā)明專利。根據(jù)功能語義相似度排序,選取前4個(gè)發(fā)明專利(對(duì)應(yīng)裝置的結(jié)構(gòu)如圖7所示)作為設(shè)計(jì)資料,對(duì)水果采摘裝置的創(chuàng)新設(shè)計(jì)方案進(jìn)行初步確定。

圖7 4種物質(zhì)分離裝置的結(jié)構(gòu)示意Fig.7 Schematic diagram of structure of four kinds of substance separation device
根據(jù)發(fā)明專利的文本描述和對(duì)應(yīng)裝置的結(jié)構(gòu)示意圖可知,圖7(a)所示裝置采用電機(jī)帶動(dòng)葉片旋轉(zhuǎn)擠壓棉花并利用離心力實(shí)現(xiàn)棉絮與棉殼的分離;圖7(b)所示裝置將多種拆裝機(jī)構(gòu)結(jié)合為一體,適用于多種場(chǎng)合的機(jī)械零部件拆裝;圖7(c)所示裝置為常見的水果采摘裝置,利用電機(jī)驅(qū)動(dòng)剪枝刀實(shí)現(xiàn)水果采摘;圖7(d)所示裝置通過搖柄控制刀架移動(dòng),實(shí)現(xiàn)復(fù)雜曲線的瓷磚切割。
本文水果采摘裝置的設(shè)計(jì)方案可以從圖7(c)所示的采摘裝置出發(fā),進(jìn)行相應(yīng)的改進(jìn)。圖7(c)所示裝置采用剪切的方式來分離水果和枝干,可能會(huì)存在因剪力不足而無法切斷的情況。受到圖7(d)所示瓷磚切割器的啟發(fā),利用旋轉(zhuǎn)刀具來切割樹枝,實(shí)現(xiàn)分離功能,旋轉(zhuǎn)刀具的運(yùn)動(dòng)方式可參考圖7(a)所示的棉花分離裝置中電機(jī)帶動(dòng)刀具旋轉(zhuǎn)的形式,并結(jié)合圖7(b)所示多功能拆裝器的組合思想,將旋轉(zhuǎn)切割刀具與圖7(c)所示水果采摘裝置的其他結(jié)構(gòu)組合,由此初步形成一個(gè)水果采摘裝置的創(chuàng)新設(shè)計(jì)方案,其結(jié)構(gòu)原理如圖8所示。

圖8 2種水果采摘裝置的結(jié)構(gòu)原理對(duì)比Fig.8 Comparison of structural principles of two kinds of fruit picking devices
水果采摘裝置的新設(shè)計(jì)方案參考了4種專利的設(shè)計(jì)思想,體現(xiàn)了不同領(lǐng)域的設(shè)計(jì)資料對(duì)設(shè)計(jì)靈感的激勵(lì)和設(shè)計(jì)過程的支持。
本文針對(duì)現(xiàn)有的基于本體的語義檢索對(duì)本體概念之間的隱含語義關(guān)系缺乏有效利用的問題,提出了一種基于網(wǎng)絡(luò)表示學(xué)習(xí)的本體語義關(guān)系挖掘方法。在本體語義關(guān)系挖掘的基礎(chǔ)上,建立了面向產(chǎn)品功能的跨領(lǐng)域設(shè)計(jì)知識(shí)檢索方法:利用基于語義類比的向量運(yùn)算建立了隱含的功能語義關(guān)系,并通過語義相似度計(jì)算實(shí)現(xiàn)了基于隱含語義關(guān)系的產(chǎn)品功能語義的匹配和跨領(lǐng)域設(shè)計(jì)資料的檢索。水果采摘裝置創(chuàng)新設(shè)計(jì)示例結(jié)果表明,設(shè)計(jì)人員可以利用本文提出的方法檢索得到與產(chǎn)品功能需求有關(guān)的多領(lǐng)域設(shè)計(jì)資料,有助于激發(fā)設(shè)計(jì)靈感和產(chǎn)生創(chuàng)新設(shè)計(jì)方案。