崔靖華 朱學芳
產品創新是企業發展的動力,能否開發出符合市場需求的新產品,是一個企業發展的根本。企業科研人員在進行產品創新時需要用到科技論文,科技論文是國家科技競爭力的重要體現,因此有效使用科技論文對于進行產品創新的企業科研人員來說十分重要。然而,目前由于科技論文語義知識紛繁復雜,企業科研創新人員在獲取相關知識要點、技術創新知識及研究發展前沿熱點方面需要手動檢索、搜集、閱讀,其過程繁瑣,耗費了許多時間和精力。若是能夠針對企業科研人員的創新方向,對相關科技論文進行語義知識組織,并形成語義知識庫,使企業科研人員可直接查閱知識庫中的相關產品知識,則能有效提高對科技論文知識的利用率,進而提高產品創新效率,為企業創新發展做出貢獻。
為了方便企業科研人員更加快速、全面地獲取關于創新產品的相關科技論文中的相關知識,本研究以智能機器人產品為例,選取該產品國內核心科技論文,構建了面向企業產品創新的科技論文語義知識本體,對其進行可視化,并利用情景分析法探討企業科研人員如何利用可視化結果進行產品創新,希望能夠提高企業科研人員對科技論文語義知識的利用率,進一步提升企業的產品創新效率。
目前,國內外關于科技論文研究的側重點在于對科技論文的用詞、詞頻、語義特征等方面進行分析,以構建完善的檢索體系,為科研人員提供科技論文檢索、個性化推薦等服務。馬慧芳等[1]考慮到研究人員難以定位到感興趣的科技論文,就此提出了一種融合作者與文獻影響力的科技論文推薦方法;路永和等[2]基于段落層級結構,分別在詞級和句級使用雙向GRU對寫作需求和參考文獻進行語義建模;王宇[3]完成了面向科技文本的預處理,主要包括短文本化、去除文本噪聲、分詞、去停用詞等,為后續的科技文本分類工作提供數據質量的保證和文本數據的形式化支持;宋東桓等[4]采用文本挖掘方法對選取的英文科技論文中的單詞、動詞、三詞詞塊、四詞詞塊等進行詞頻、TFIDF值等多個指標的定量統計分析,構建能夠進行結構要素識別的語義特征詞典。國外有Boger等[5]學者在Cite ULike數據集上通過實驗表明基于用戶的協同過濾算法能取得更好的效果;Y.K.Meena等[6]利用科技論文句子特征構建了不同類型的要素識別模型;Chen等[7]使用CNN來提取科技論文文本特征,并使用RNN來產生標簽序列;另外還有國際上一些非常成熟的常用詞表等[8-10]。但目前尚沒有關于企業產品創新的科技論文語義知識本體構建研究。若能有效地整合企業科研人員進行產品創新時所需的科技論文語義知識資源,那么對科研人員自身創新水平的提高、對企業創新競爭能力的提升將產生巨大影響。
產品在設計過程中的知識可分為需求、功能、作用原理、結構等具體方面。需求反映了產品在市場中的一種現有狀況;功能來源于用戶的主觀意愿,體現設計任務和要求,是產品最終的目的;作用原理則是對功能、結構中沖突現象的解決進行詳細說明;結構描述產品的結構組件、結構組件的屬性,以及它們之間的連接[11]。為了描述科研人員在具體設計產品過程中所表現出的這種空間知識結構,悉尼大學Gero[11]提出了關于產品設計的“功能—行為—結構”FBS模型,在后來學者的不斷完善下,最終形成FBS模型“需求—功能—作用原理—結構”關系[11]。本研究為能很好地使科研人員進行產品創新時檢索到所需的科技論文知識,根據FBS模型中的相對應模塊含義來映射科技論文的語義知識結構,以求在檢索中形成科技知識關聯本體。
本文以“智能機器人”為主題的國內核心科技論文為例,對其題目和摘要進行分詞,再根據人工校對分詞后的結果進行研究主題提取,共總結出“智能機器人”產品領域的主要研究內容,包括設計研究(與FBS模型中的結構知識趨同)、技術研究、應用研究、綜述與趨勢研究、法律問題研究。同時,根據FBS模型的相對應模塊來映射“智能機器人”產品領域科技論文的語義知識結構,如圖1所示。

圖1 科技論文語義知識結構
本文從企業科研人員需要創新的產品的核心概念出發,根據科技論文語義知識結構,確定產品的“類別”“需求”“功能”“作用原理”“結構”“技術”“應用”“綜述”“法律”共9個頂層概念。定義這9個頂層概念及其等級體系,形成科技論文語義知識本體[12]的類別及其等級體系,如表1所示。

表1 科技論文語義知識本體的類別及其等級體系
根據上述科技論文語義知識本體的類別及其等級體系,企業科研人員就可在一個產品的開發設計上系統地了解創新產品的核心知識,并對產品的結構、技術、應用、進展、法律等相關知識有一個全面而深刻的認識。通過產品需求,可及時了解學術需求,并考慮是否可以轉化為市場需求,以進行新產品研發。企業科研人員還可以進一步地根據產品功能了解作者要實現的功能意圖,可以通過產品的作用原理加深對實現產品功能所應用的相關知識的了解。繼而企業科研人員可以依次分別了解關于產品的結構、技術、應用、進展、法律等方面知識。具體來說有:(1)可根據產品結構知識了解產品是如何制備的,智能機器人是由哪些機械零件、硬件、軟件等構造而成;(2)可根據產品技術知識,了解目前智能機器人關鍵技術的研究情況,從而可以在目前研究不足的地方進行創新;(3)可根據科技論文作者對產品應用領域、應用效果的研究,看是否能夠對該領域的產品結構、技術等進行優化,以達到創新;(4)可通過產品綜述與趨勢知識了解智能機器人的現有研究情況,以及未來可能的發展方向、待解決的問題、改進建議,以進一步推動創新發展;(5)可通過產品法律知識了解目前智能機器人所存在的一些法律問題,進而避開雷區。
科技論文語義知識較現有的市場產品技術具有一定的超前性,這將激發企業科研人員產生更多的創新想法。根據上述分析,形成語義類型之間的語義關系集,具體如表2所示。

表2 科技論文語義知識本體語義關系集
本文選取以“智能機器人”產品為主題的國內核心科技論文,根據中國知網上的核心期刊、博碩士論文、會議文獻等數據進行檢索,并將檢索到的論文進行前文的相關處理,構建科技論文語義知識類別及類別之間的語義關系,而后利用本體構建工具Protégé[13],分別在Protégé的OWL Classes和Object Properties中編輯科技論文語義知識類別及其語義關系,并根據編輯好的類別及其等級體系、屬性及其關系,利用Onto Graf形成可視化本體圖,如圖2所示。

圖2 “智能機器人”產品的國內核心科技論文可視化本體圖
當企業科研人員想要進行有關圖書館智能機器人方面的創新設計時,可根據圖2所示進行創新活動。具體的創新流程可用情景演繹法來進行演繹[14]。以企業科研人員想要改善圖書館智能機器人的產品結構作為情景演繹的創新目的,具體演繹流程如下。
(1)明確本產品是應用于圖書館體驗區的智能機器人。
(2)通過可視化本體圖了解目前人工智能在各個領域的滲透情況,知道目前機器人已開始具有自主學習的智能交互能力,并且智能機器人在圖書館已經有所應用,如沈陽市圖書館智能機器人“伴讀”、上海圖書館前臺咨詢機器人“圖小靈”。
(3)研究智能機器人在圖書館體驗區的應用功能,主要包括書籍檢索、導航指引、讀者信息查詢、智能迎賓及問答,以此為智能機器人在圖書館中的應用研究提供參考。
(4)了解智能機器人所用到的作用原理,包括圖像處理原理、傳感器原理、信號采集原理、語音識別原理、機器視覺原理及其他原理。
(5)關于應用于圖書館體驗區的智能機器人的結構設計方面,要清楚了解智能機器人的系統電控設計,包括本地化的智能云平臺、機器人客戶端等;在硬件的具體設計上要清楚了解傳感器、核心控制板等;在軟件設計上要知道包含感知處理模塊、系統報表模塊、外部查詢模塊等。
在上述逐步引導下,可幫助企業科研人員更快、更高效地了解圖書館智能機器人的相關知識,有助于企業科研人員全面系統的掌握相關知識,進而啟發企業科研人員的創新想法。其相關設計研究的具體創新流程路徑如圖3所示。

圖3 圖書館智能機器人的設計研究
為了給構建企業產品科技論文語義知識庫做鋪墊,本文以當前的熱點項目——智能機器人為例,構建了面向企業產品創新的科技論文語義知識本體。通過實例,我們知道一篇產品科技論文中大多有描述需求知識的研究背景、研究現狀,描述功能知識的研究目的、意義、結論,描述原理知識的一些相關原理,描述結構知識的產品的具體設計。為此,需要根據不同領域產品的科技論文的主要研究內容來構建語義模型,形成該領域產品的科技論文語義知識本體。進一步來講,我們將在后續研究中與相關企業合作,讓企業科研人員在具體開發新產品的過程中,通過利用相關產品科技論文語義知識本體,構建起關系型知識數據庫,并基于關系型數據庫的查詢,結合Web檢索、本體推理等技術構建企業產品科技論文語義知識庫,為企業科研人員提供知識資源,并在企業科研人員的不斷反饋下修正該知識庫。