999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于技術關聯關系的企業研發潛在合作伙伴識別方法研究綜述

2023-10-07 12:09:58趙展一鐘永恒
現代情報 2023年10期
關鍵詞:關聯語義文本

趙展一 鐘永恒 王 輝 劉 佳

(1.中國科學院武漢文獻情報中心,湖北 武漢 430071;2.中國科學院大學經濟管理學院信息資源管理系,北京 100190;3.科技大數據湖北省重點實驗室,湖北 武漢 430071)

研發合作(R&D Cooperation),是指多個創新主體通過共享獨有技術來加速創新過程所采取的聯合行動,常用于產業界[1]。企業研發合作則是指企業作為需求主體,與同行、上下游供應商、科研院校、客戶等主體共同研究與開發新技術、新產品的行動,其本質是一種共同的知識創造過程。目前,技術創新過程越來越復雜,研發難度大,學科交叉性強,產品更新快,風險和不確定性高,為降低研發風險,增強競爭優勢,企業已將研發合作視為生存發展與技術創新的重要手段之一。

現有研究對研發合作的影響因素及其之間的關系進行了探索,發現創新主體之間的戰略契合程度、需求匹配程度、合作偏好程度、信任水平程度以及政府支持力度、中介代理水平等[2-5]外部因素均會對研發合作產生影響,為了解研發合作行為的機理奠定了基礎。關于研發合作伙伴的評價指標體系也不斷完善,在候選合作伙伴已知的情況下,通常從研發能力、市場能力、合作能力等維度考慮選擇最佳合作伙伴[6]。但如何在候選合作伙伴未知的情況下,從眾多創新主體中識別具有合作潛力的伙伴,預先掌握合作伙伴情況,降低研發合作風險,仍是研究難點。

梳理文獻發現,潛在研發合作識別方法主要包括兩類:基于實體鏈接關系的方法和基于技術關聯關系的方法。基于實體鏈接關系的方法,是指以實體之間已經真實存在的鏈接為依據,如專利合作申請關系、專利轉讓許可關系等,利用復雜網絡、鏈路預測、深度學習等方法推斷實體之間未來進行研發合作的概率。這類方法考慮了實體之間的合作偏好程度,但受限于現有網絡,無法擴展到新增節點去發現新的合作關系,也未深入到技術內容層面去分析實體之間合作的合理性,不夠有說服力。基于技術關聯關系的方法,是指實體擁有的技術存在某種關聯關系,如共同關注某一個技術領域、擁有同一技術問題的不同解決方案等,依據這種內在的技術關聯關系去識別潛在合作伙伴。這類方法考慮了研發合作的本質動因,即創新主體希望獲取異質技術知識來提高自身競爭力,只有在分析技術知識的基礎上去識別研發合作伙伴,得出的結果才是科學可靠的。因此,有必要系統梳理基于技術關聯關系的企業研發潛在合作伙伴識別方法,了解現有方法和識別效果,揭示其中存在的問題,總結未來的發展方向,為完善面向企業研發潛在合作伙伴識別的情報分析方法體系提供借鑒,助力企業尋找對口伙伴,制定合作戰略,提升研發效率。

1 技術關聯關系

技術是為實現某一特定目標所采用的特定方法,是制造某種產品所需要的系統知識、工藝或服務[7],因具有系統性和隱含性的特征,技術以縱向或橫向的方式不斷擴散、交融,并重新組合為新的技術,形成龐大的技術關聯網絡。通常,某一項技術發生變化時,也會引起與之關聯的多項技術的變化,如智能手機技術直接影響了通信、傳媒、教育等技術,還催生了電子商務等新技術。由此可見,技術不是孤立的,而是存在著復雜的關聯關系,深入分析創新主體之間的技術關聯關系有利于細粒度地、準確地分析其合作潛力與合作方向。

技術關聯關系的定義與類型尚未統一。黃斌等[8]依據專利是否共類將技術關聯劃分為直接關聯和間接關聯。馮秀珍等[9]依據技術是否具有共同用途將技術關聯劃分為直接關聯、間接關聯、關鍵關聯,并提出技術關聯鏈、環、網、群、子群等概念。Vaez-Alaeim M等[10]將企業間的技術關聯關系劃分為相似性技術、互補性技術、無關性技術。徐珍珍等[11]依據研究問題與技術方案的對應關系將技術關聯劃分為直接競爭關系、間接競爭關系、合作關系、包含關系,并提出了基于問題—技術矩陣的技術關聯自動發現方法。王莎莎等[12]將技術關聯關系劃分為基于技術知識結構與內容的等價性關聯關系和基于技術知識溢出與流動情況的非等價性技術關聯關系。現有研究對技術關聯關系的分類大多較為粗糙,僅劃分為強、弱或直接、間接,少有研究關注技術關聯關系的具體類型。

楊冬敏[13]比較全面地考慮了時間、空間等因素的影響,從技術沿革、技術應用、技術體系結構、技術知識單元4個維度將技術關聯關系細分為取代、發展、完善、補充、競爭、互補、包含、平行、交叉、繼承、兄弟、交融關系。借鑒該分類方式,并結合技術關聯關系在企業研發潛在合作伙伴識別領域的應用,本文將技術關聯關系劃分為技術承繼、共現、結構、應用關系以及復合技術關系。

如圖1所示,技術承繼關系,是指隨著時間推移技術之間相互借鑒、創新、完善、融合的關系,T1、T2、T3、T4、T5、T6為典型的承繼關系;技術共現關系,是指技術之間共同出現或通過第三方共現的關系,T1與T9、T10為直接共現關系,T1與T11通過T10形成間接共現關系;技術結構關系,是指從技術體系結構和知識單元的角度理解技術關聯關系,技術體系結構是指根技術與其分支技術構成的技術系統,具有層次性、整體性,t1、t2為T6的分支技術,屬于同一技術體系結構。技術知識單元是指某一技術及其同級技術構建的技術模塊,具有并行性、協同性,T6、T7、T8為并列技術,t1、t2也為并列技術,屬于同一技術知識單元,技術知識單元是技術體系結構的一部分;技術應用關系,是指依據是否用于解決同一問題將技術關聯關系劃分為直接競爭關系、合作關系、間接競爭關系,T2、T3可用于解決Q1,形成直接競爭關系,T3、T4可分別用于解決Q2、Q3,也可通過組合用于解決Q4,形成合作關系,相互補充,還可與T5組合用于解決Q4,此時T3、T4與T5形成間接競爭關系。現實中的技術關聯關系往往是多維且復雜的,本文將涉及兩種及兩種以上類型的技術關聯關系定義為復合技術關系。

圖1 技術關聯關系的類型

2 基于技術關聯關系的企業研發潛在合作伙伴識別方法

為全面把握基于技術關聯關系的企業研發潛在競合目標識別方法及其效果,檢索并梳理國際國內相關研究進展。國內研究以“CNKI”為數據源,以“R&D合作”“研發合作”“產學研合作”“合作識別”“伙伴選擇”“技術關系”“技術關聯”為主題詞進行檢索,國際研究以“Google Scholar”為數據源,以“R&D Cooperation”“R&D Partner”“Technology Cooperation”“University and Industrial Cooperation”“Cooperation Identification”“Cooperation Selection”“Technology Relation”“Technology Association”為主題詞進行檢索,篩選出136篇重點文獻。基于此,將企業研發潛在合作伙伴識別方法按照基于技術承繼、共現、結構、應用關系以及復合技術關系5個維度來梳理,如圖2所示,歸納各類方法的優缺點,總結當前研究存在的問題和未來研究方向。

圖2 基于技術關聯關系的企業研發潛在合作伙伴識別方法分類

2.1 基于技術承繼關系的識別方法

作為技術成果的重要載體,專利文獻已成為技術情報的關鍵來源,專利引用本身就體現了技術流動和演進的過程,現有研究基于技術承繼關系的識別方法主要通過專利引用分析實現。

專利引用是申請人和審查員共同的行為,包括直引、共引和共被引。直引是指多件專利直接相互引用的關系,通常與分類號、關鍵詞等信息結合使用,如表1所示。例如,李睿等[14]建立兩國專利權人的直引關系,通過關聯強度篩選候選合作組對,再通過引用跨越度分析競合技術。共引和共被引分析應用較多,分別指多件專利引用同一件專利或被同一件專利引用,通常認為共引或共被引次數越多,技術關聯越強,研發合作概率越大。例如,李睿等[15]基于專利共引關系建立兩國專利權人—技術領域二模網絡,通過不同技術領域之間的專利共引強度定位兩國共同關注的技術領域,揭示國家(地區)間的研發合作機會。許海云等[16]以論文—專利的共引與共被引關系表示科學—技術的關聯關系,根據被專利引用的論文比例、被論文引用的專利比例確定科學—技術關聯特征,提出了不同關聯特征下的新興主題產學研合作模式,完善了產學研合作識別的方法體系。

表1 引用分析方法對比

引用關系可以反映雙方是否具有共同關注的技術領域,并且具有成熟的理論、方法和工具支持,但其局限性在于:①動機不明,無法區分積極引用和消極引用;②具有時滯性,無法反映最新文獻的引用關系;③未深入技術文本層面,無法進一步揭示合作潛力。

2.2 基于技術共現關系的識別方法

基于技術共現關系的方法是指通過分析技術特征項共同出現的現象揭示創新主體之間的關聯,包括共類分析、共詞分析等,如表2所示。專利分類號能夠體現技術的應用領域和主要功能,易獲取和量化,應用最多,例如,溫芳芳[17]通過專利權人的共類數量、共類頻次分析企業潛在合作關系,認為共類數量越多,共類頻次越高,專利權人技術相似性越強,合作潛力越大。專利文獻沒有關鍵詞,現有研究通過TF-IDF等方法抽取特征詞作為共詞分析的依據,以進一步分析機構之間的合作方向。例如,Li S等[18]基于機構共同分類、引用耦合、主題共現關系建立機構相似性矩陣,識別核心專利組合和技術轉讓合作伙伴。基于多重共現關系的綜合分析結果更加可靠,例如,Fritsch M等[19]建立基于合作項目、專利、論文的多模異構網絡,發現結合3種數據捕獲的合作關系更全面。

表2 共現分析方法對比

共現分析通過技術特征項的共現現象揭示隱含的技術關聯,可以為識別潛在合作提供參考。但其局限性在于:①共現分析無法提供潛在合作概率;②共類分析、共詞分析都無法深入地揭示文本語義關系;③共現分析大多通過共現數量、共現頻次體現合作潛力,信息量較少。

2.3 基于技術結構關系的識別方法

基于技術結構關系的識別方法是指從技術文本中抽取符合規則的語義特征,形成技術體系結構或知識單元,通常以技術樹或知識圖譜的方式呈現,如表3所示。

表3 語義特征抽取分析方法對比

技術樹是指用于表示某一技術領域中技術特征及其關系的樹形結構圖,包含技術、功能、產品等要素,可以輔助決策者梳理技術體系,把握技術架構和創新主體在技術發展過程中的位置,選擇相匹配的合作目標。例如,翟東升等[20]對專利文獻的標題、摘要進行切分和標注,抽取功能、功能效果、科學效應等語義特征,通過合并同義概念確定樹的基礎模塊,通過語義特征的共現關系實現概念之間的聯接,構建技術樹,與企業提供的結構化需求文檔進行匹配,篩選能夠滿足企業需求的專利權人。伊惠芳等[21]爬取公開信息中的需求文檔,并將技術需求劃分為廣泛、單一、綜合性3類,采用百度語義工具和Python語言技術從技術需求文檔和高校專利文獻中抽取技術領域、功能、功效和技術方案,通過LDA模型聚類,實現各項語義特征之間的聯接,建立高校專利技術樹,與不同類型的技術需求進行模糊、特定、多目標匹配,再根據需求的滿足程度、技術的有用性確定高校專利轉移目標。

知識圖譜可以完整規范地描述實體及其屬性之間的關系,幫助實現實體關聯和語義推理,有利于理解技術主體之間的關聯關系。例如,李家全等[22]利用新能源汽車領域的術語層次關系構建了知識圖譜,根據兩個術語的類型、出現頻次以及在知識圖譜中的層次深度計算實體概念相似度,根據兩個術語的類型、最短距離計算實體距離相似度,利用Word2Vec、Bert模型計算實體語義相似度,利用TextRank提取術語屬性句子中的關鍵詞計算實體屬性相似度,對上述指標進行綜合賦權得到實體相似度,可用于識別相似實體。Deng W等[23]繪制專利、企業、行業的知識圖譜,將從專利標題和摘要中提取的關鍵詞及其共現關系作為圖的邊權重,再通過融合共同節點、邊權重、總權重的圖編輯距離度量不同圖的相似性,為企業匹配相似策略、互補策略、混合策略下的專利轉讓目標,該方法已成功應用于江西省技術交易平臺。

抽取語義特征并進行匹配分析的方法可以更精準地捕獲文本的語義信息,展示技術結構關系,匹配合作需求。但其局限性在于:①技術樹或知識圖譜的構建過程復雜,人工成本較高,不適合應用于大規模數據集;②通常需要人工標注,標注的準確性與統一性有待考量;③方法不具有通用性,難以重復。

2.4 基于技術應用關系的識別方法

基于技術應用關系的識別方法是指從是否用于解決同一問題的角度分析技術的競合性質,據此識別競爭對手或合作伙伴。競爭性技術是指可用于解決同一問題的技術,具有相似性和取代性,如通信領域的3G與5G技術、低碳領域的藍氫與綠氫技術;合作性技術是指可通過組合用于解決同一問題的技術,具有互補性和協同性,如汽車領域的車窗制造與車門制造技術、3D打印領域的打印機噴頭與打印材料。目前,相似性技術的識別方法更加成熟,語義相似性分析可以細粒度地從文本語義的層面揭示技術的相似性,在潛在合作識別領域應用較為廣泛,主要包括文本聚類分析、依存句法分析、基于預測的詞嵌入分析等,如表4所示。

表4 語義相似性分析方法對比

文本聚類分析是指通過聚類算法從同一類簇中識別潛在合作,主題模型是一種典型的聚類方法,先從技術文本中識別技術主題,再根據相似主題識別合作潛力大的創新主體。例如,Kang J等[24]運用LDA模型識別特定領域的子技術主題,再通過K-means聚類算法確定子技術集群,從子技術集群中根據相似專利密度確定技術轉移伙伴,考慮了企業的多元化研發方向。類似地,崔晶等[25]利用關聯規則分析目標企業的技術同心多元化領域,再通過LDA模型將創新主體劃分到不同的技術主題,根據專業能力和合作能力為企業推薦不同技術主題的研發合作伙伴。周洪等[26]采用t-SNE主題模型對專利中的新穎性和用途部分聚類,建立基于技術—應用主題的二維分析框架,結合目標企業的技術布局,與其他創新主體的技術相似性、應用相似性識別潛在競爭對手。Qi Y等[27]利用LDA模型識別論文與專利的主題,基于論文與專利的主題相似度確定可以合作的技術主題,根據創新能力與開放程度對相關主體進行排序,確定是否有合作的潛力,再建立這些主體基于主題的合作網絡,進行鏈路預測,識別潛在合作機構與合作方向。武川等[28]通過LDA-Gibbs Sampling模型識別專利文本的主題,建立專利權人合作網絡和主題相似網絡,認為網絡的平均加權度越高,專利主題相似性越高,合作潛力越大。

依存句法分析是指通過提取分析主謂賓等語義要素及其關聯關系識別潛在合作。例如,汪雪鋒等[29]通過SAO方法識別染敏太陽能電池領域的研發合作組對,通過Stanford Parser軟件提取專利文本的SAO結構,篩選、歸類后繪制基于時間序列的“材料—技術與組件—目標”SAO結構圖,挖掘具有相似研發目標的機構。Li R等[30]抽取專利標題和摘要中的SAO語義結構,利用專業醫學術語系統識別與目標技術相關的SAO語義結構,判斷SAO語義結構之間的相似性,評價專利權人的技術相似性,再通過TF-IDF獲取關鍵詞重要性作為SAO語義結構的特征權重,構建專利權人向量,評價專利權人的技術互補性,為識別R&D合作提供更精準的參考。Li X等[31]運用SAO語義結構分析抽取論文中的技術問題和專利中的解決方案,計算相似度,進行聚類,分析每個聚類主題下問題與方案的差異,并將論文中檢測出的離群點納入技術機會的識別范圍,再結合專家知識確定合作技術機會。

詞嵌入是將詞語映射為向量的自然語言處理技術,基于預測的嵌入可以較好地解決數據稀疏、詞表膨脹等問題,分辨語義細節,極大地優化了文本表示效果,如Word2Vec、Doc2Vec等,在衡量技術相似性方面得到廣泛應用。例如,向姝璇等[32]以Jaccard算法計算IPC組合相似度定義功能相似性、以Doc2Vec計算獨立權利要求相似度定義技術相似性,構建基于功能—技術的專利整體相似網絡,分析主題簇下的競爭組合。Lee C等[33]基于美國專利商標局數據庫提取3D打印領域專利與產品的對應關系,運用Word2Vec識別具有相似技術的產品,識別目標產品的技術機會,再從技術、企業維度對其價值進行評價,為識別潛在技術機會和合作伙伴提供參考。李冰等[34]建立企業引用專利的二分網絡,采用Sim Rank算法預測潛在競合對象、Text2Vec算法對其專利進行向量化表示,計算專利相似度,衡量技術的差異性,確定競合目標。基于預測的嵌入可以很好地表示詞向量、句子向量,但對整篇文檔向量的表示通常采用加權平均的方式獲取,比較粗糙。以2018年Google AI研究所提出的BERT模型為標志,基于預訓練的嵌入開始受到關注,一些改進的模型如ALBERT、RoBERTa等也取得了比較好的效果,但這類模型在技術關聯關系分析和潛在合作識別領域還未得到廣泛應用。

語義相似性分析方法可以對大規模文本進行處理,深入分析文本語義特征,判斷創新主體之間的技術關系,匹配特定需求,提高識別結果的可靠性。但其局限性在于:①聚類分析易生成高維稀疏向量,需要進行降維處理;②依存句法分析需要高質量的人工標注,成本較高,不太適用于大規模數據;③詞嵌入分析對整篇文檔以及機構之間多篇文檔語義特征的處理方式較為粗糙,有待完善;④大多數研究認為,相似即具有合作潛力,但相似性技術更趨于競爭性質,忽略了企業研發合作的內在動因。

相較來看,互補性技術的識別難度更大,如表5所示,主要基于分類號[35]、技術空白點[36]、產業鏈或創新鏈分析[37-38]以及指標評價[39]方法確定,也有研究深入文本語義層面嘗試測算企業之間的技術互補性,例如,Wang X等[40]采用HLDA模型識別3D打印領域的技術主題,建立主題層次樹,發現主題之間的關聯關系,再通過企業之間的主題補集數量衡量技術互補性。技術互補性的量化方法亟待完善。

表5 技術互補性分析方法對比

識別互補型合作伙伴可以為企業填補技術空白,尋找技術機會提供參考,往往比相似型合作伙伴更能產生重大創新。現有研究的局限性在于:①大多數研究認為“空白”即互補,可以進行研發合作,較少對雙方技術的用途進行細致區分,結果的可靠性有待考量;②定量方法主要基于專利類別實現,未深入技術文本語義層面;③技術互補性的判斷仍以定性方法為主,實施過程復雜且受主觀影響較大。

2.5 基于復合技術關系的識別方法

為了彌補基于單一關系的識別方法的不足,優化識別效果,已有研究綜合利用多種技術關系分析技術關聯情況,識別潛在研發合作,如表6所示。例如,傅俊英等[41]構建基于專利共引、共被引關系和文本相似關系3種元路徑和包括專利權人、發明人、IPC分類號、專利所屬國家等信息的異構網絡,運用PathSelClus算法進行聚類,認為同一聚簇中的機構與聚類種子存在技術相似性,識別中小企業的潛在合作伙伴。吳菲菲等[42]從網絡信息獲取領域市場需求,采用LDA模型識別需求主題,再結合領域專利和目標企業專利確定目標企業的研發需求,查閱科技文獻獲取解決方案,進行檢索,得到與目標企業產業類別不同的候選合作伙伴,從技術能力、合作能力、市場能力3個方面進行評價,確定最佳合作伙伴。劉小玲等[43]分別構建專利共同分類強度向量、共同引文強度向量、專利標題和摘要文本向量,各向量首尾相連,進而得到多屬性融合的專利相似度,優于僅考慮單個屬性的結果,可以為判斷技術相似度提供參考。

表6 多方法綜合分析對比

利用復雜網絡可以將引用、共現、語義等復雜關系刻畫為拓撲結構,形成異構網絡、加權網絡、有向網絡、多分網絡、多層網絡,結合使用鏈路預測、深度學習等技術,利用網絡性質和多類節點的屬性、關系識別潛在合作。例如,Wang Q等[44]建立融合專利交易關系、發明關系、引用關系以及本體、文本信息的異構網絡,運用基于元路徑的相似性測量方法AvgSim識別專利轉讓目標。何喜軍等[45]從專利和組織維度建立影響專利交易的屬性指標體系,構建屬性異構網絡,設計AHNRL-PTR模型進行表示學習,可以為節點推薦具有相似屬性的專利交易目標。此類方法在研發合作領域應用較少,可能與技術創新主體具有很強的競爭性、合作網絡稀疏、有用信息較少、識別結果可用性較差有關。在科研合作領域應用較多,包括融合節點的共同鄰居、研究內容、研究興趣、多模體[46-49]等特征,或在超網絡的基礎上改進傳統的資源分配指標[50],識別潛在科研合作關系。

復合型方法能夠集成多種方法的優勢,充分挖掘引用關系、共現關系、文本語義、復雜網絡中蘊含的有用信息,綜合統計特征和語義特征識別潛在合作伙伴,效果更好,但此類方法實施過程較為復雜,融合多維屬性的難度較大,成熟的實施流程仍有待探索。

3 當前研究存在的主要問題

通過對現有方法的比較,發現每種方法各有優劣,如表7所示,總結當前研究存在的主要問題如下:

表7 基于技術關聯關系的企業研發潛在合作識別方法對比

1)數據源和數據范圍較為受限。除專利文獻以外,產品、商標、標準等文獻以及一些網絡資源也是技術信息的重要載體,現有研究大多以專利文獻為數據源進行技術關聯分析,缺乏對其他類型文獻的考慮,能夠利用的屬性信息有限。另外,基于合作歷史篩選出的候選合作伙伴,本質上沒有從技術關聯視角考慮機構之間的合作潛力,已經將一些可能的潛在伙伴剔除在外,無法發現新增主體和已有鏈路之外的潛在合作關系,影響識別效果。

2)技術文本的語義分析方法存在較多缺陷。現有研究通過文本聚類、依存句法分析、知識圖譜等方法實現了對大規模技術文本的語義挖掘,相比基于分類號的方法蘊含了更豐富的語義信息,優化了識別效果。但在技術關聯分析領域所用到的語義分析方法仍有很多弊端,例如,基于主題詞的方法易生成高維稀疏向量,無法較好地識別細分類目;基于語義特征抽取的方法需要統一的、高質量的人工標注,成本較高;Word2Vec、Doc2Vec等神經網絡方法受不同語境的影響較大,仍未能較好地解決多義性問題。機構層多篇技術文本的語義相似性分析方法仍采用單篇文本相似度加權平均的方式,較為粗糙,容易模糊機構之間的技術關聯特征。技術互補性的測算方法仍以定性判讀為主,缺乏成熟的量化方法,區分互補方向也是一大難點。

3)技術關聯與合作行為的關系尚未梳理清晰。技術關聯是企業進行研發合作的基礎,已存在研發合作關系的主體必定存在著某種技術關聯,現有研究通過獲取技術相似度、合作偏好等參數對潛在合作進行定量推斷,取得了較好效果。但缺乏對技術關聯與合作行為關系的系統分析,例如,共現關系具體反映何種技術關聯,擁有何種共現關系的機構合作潛力大;引用關系受引用動機影響,何種引用特征可以反映機構的合作潛力;技術相似可能會使雙方傾向于競爭而非合作;同一產業鏈的機構不一定合作,反而會在其他產業鏈尋求伙伴等。技術關聯與合作行為的關系不清晰,直接影響到合作潛力測度指標的合理性以及識別結果的準確性和可用性。

4 未來研究方向

針對上述問題,提出基于技術關聯關系的企業研發潛在合作識別方法領域的未來研究方向如下:

1)納入多源數據并保障識別范圍的完整性。利用專利、產品、商標、標準等多種文獻蘊含的技術信息以及企業等機構網站/專業數據庫的市場經營信息[51],獲取豐富的屬性參數,有利于全面客觀地判斷技術關聯關系和研發合作潛力。以產品為例,產品名稱或功能的高相似性往往被用于識別競爭對手,而低相似性不被重視,不以相似度的高低簡單判定競合關系,而應該對相似性進行分層、分級、分情況的討論,面向不同用途的高相似性和面向同一用途的低相似性是有合作可能的。同時,不應該囿于機構之間的合作歷史,而是優先考慮技術關聯關系,判斷雙方進行研發合作的技術匹配程度,例如對方技術與企業現有技術資源加以組合是否有利于提高企業技術創新能力,在此基礎上再考慮合作歷史等因素,判斷合作潛力,提高識別結果的科學性。

2)完善技術文本語義分析與計算的理論方法體系。技術文本語義分析直接影響技術關聯判斷結果的準確性,現有知識組織方式不斷朝著結構化、標準化的方向發展,為文本挖掘提供了較好的基礎,但仍面臨詞語歧義、情感傾向、復雜語境等問題,應模擬現實世界的語義分析環境與習慣,系統性地完善語義分析、計算、推理、應用方面的理論與方法體系,利用復雜網絡、深度學習、知識圖譜、人工智能等技術從大規模數據中自動化、智能化地學習有效特征,優化文本特征表示效果;在機構技術文本語義分析方面,可以采用將多個機構多篇文檔的相似度進行分類來代替多個機構多篇文檔的相似度直接加權平均的方式,既可以利用現有機器學習多分類的成熟方法,也可以更大程度地保留機構技術文本語義的特征,提供有價值的、可解釋的分析結果。在技術互補性的測算方面,考慮互補的出發點是基于雙方技術結構還是技術用途,明確判斷標準和測度指標,借鑒技術相似性的測算方法,深入文本語義層面加以挖掘,同時可以考慮利用復雜網絡等工具展示互補方向。

3)系統梳理技術關聯與研發合作行為的關系,完善測度指標。研發合作是一種復雜的選擇行為,本質上要以研發技術的匹配程度作為選擇合作伙伴的出發點,應系統梳理各類技術關聯關系與研發合作行為的關系,完善測度合作潛力的指標和方法,提升識別結果的客觀性和可靠性。以技術應用關系為例,當雙方技術強相似、弱互補時,表明雙方很可能在研發相似技術或產品,競爭激烈,但在細分領域上也可以嘗試合作;當雙方技術弱相似、強互補時,表明此類機構可能正好擁有企業沒有且需要的技術,未來可能助力企業形成重大技術創新或革命性產品;當雙方強相似、強互補時,表明此類機構可能會幫助企業解決現有研發過程遇到的技術瓶頸,優化企業技術或產品性能,也對激發雙方在共同領域的潛能,實現雙贏有促進作用;當雙方弱相似、弱互補時,企業可考慮將此類機構作為未來技術擴張的備選目標,以提升技術或產品多樣性。厘清技術關聯關系與研發合作之間的組合方式,才能建立起科學的識別依據和識別指標。

猜你喜歡
關聯語義文本
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
語言與語義
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 国产乱子伦视频在线播放| 91精品情国产情侣高潮对白蜜| 亚洲男人天堂网址| 国产91视频免费观看| 2020最新国产精品视频| 热热久久狠狠偷偷色男同| 久久青草精品一区二区三区| 欧美日韩中文国产| 中日韩一区二区三区中文免费视频| 亚洲天堂啪啪| 亚洲精品国偷自产在线91正片| 青青国产在线| 久久夜夜视频| 欧美日韩免费| 中文一级毛片| 在线国产欧美| 午夜爽爽视频| 亚洲色中色| 国产人人射| 国产成人精品综合| 狂欢视频在线观看不卡| 最新国产成人剧情在线播放| 丁香六月综合网| 中国精品自拍| 国产人成午夜免费看| 午夜欧美在线| 国产尤物在线播放| 日韩少妇激情一区二区| 777午夜精品电影免费看| 茄子视频毛片免费观看| 黄片一区二区三区| 日本在线亚洲| 日韩中文精品亚洲第三区| 特级做a爰片毛片免费69| 欧美亚洲国产一区| 国产美女主播一级成人毛片| 国产全黄a一级毛片| 视频二区国产精品职场同事| 永久毛片在线播| 国产精品13页| 网友自拍视频精品区| 巨熟乳波霸若妻中文观看免费| 国产一在线| av大片在线无码免费| 国产精品无码久久久久久| 一级毛片基地| 在线精品视频成人网| 亚洲欧美日韩久久精品| 一级香蕉视频在线观看| 久久亚洲国产最新网站| 国产AV无码专区亚洲精品网站| 污网站在线观看视频| 色哟哟色院91精品网站| 夜夜操国产| 波多野结衣视频网站| 亚洲精品国产日韩无码AV永久免费网| 欧美精品二区| 欧美五月婷婷| 成色7777精品在线| 免费国产一级 片内射老| 国产三级国产精品国产普男人| 久久久精品无码一二三区| 婷婷综合色| 中文字幕乱码中文乱码51精品| 国产免费久久精品99re不卡| 综合色区亚洲熟妇在线| a级毛片在线免费| 99热这里只有精品免费国产| 日韩欧美中文| 亚洲国产成人久久精品软件| 欧美亚洲一区二区三区导航| 狠狠亚洲婷婷综合色香| 日韩在线影院| 亚洲综合二区| P尤物久久99国产综合精品| 免费国产在线精品一区| 女人18毛片一级毛片在线 | 国产原创演绎剧情有字幕的| 亚洲精品成人7777在线观看| 99中文字幕亚洲一区二区| 国产一在线| 午夜丁香婷婷|