陳麗娜
隨著人工智能與大數據技術的蓬勃發展,其已經被應用于各行各業中以解決各類問題,并且相關技術已經逐漸滲透到人類生活的方方面面中。在上述技術應用的過程中,越來越多的技術分支也應運而生,復雜網絡就是目前備受關注的一個分支。
1998 年,由Watts 和Strogatz 首次提出了小世界(WS,Small World)網絡的概念并建立了小世界模型,這標志著復雜網絡研究的開始。復雜網絡與傳統定義中的規則網絡不同,根據百度百科的定義,復雜網絡是指具有自組織、自相似、吸引子、小世界、無標度中部分或全部性質的網絡。與規則網絡相比,復雜網絡在人類生活中有著更為豐富的應用場合,例如,由公交線路與各個公交站構成的公交網絡、由人和人之間的關系組成的社交關系網絡等。在“萬物皆可聯”的時代,隨著社會媒體的快速發展,在線社交網絡已經逐漸成為復雜網絡研究的重要應用場景①李文政.基于粒子競爭的復雜網絡社區發現[D].北京:中國人民公安大學,2021:1-7.,而其中涉及的社區發現算法也成為了研究的技術熱點。
社區(Community),又名群或組(Group)、團或簇(Cluster),其概念最早由 Girvan 和 Newman 提出,目前對其較為準確的一種定義是:社區是指由現實世界中人與人之間構成的團體,并且同一團體成員之間的聯系比不同團體成員之間的聯系要頻繁。在社區網絡的概念中,個人通常被看做為網絡中的每個節點,而人之間的關系則構成網絡的邊,也即,上述節點和邊共同組成社區網絡。在開放式社交網絡(OSN)中,具有相同屬性(如興趣、職業、年齡)的用戶之間的聯系通常較為頻繁,而具有不同屬性的用戶之間的聯系則較為稀疏,所以開放式社交網絡中也存在聚集性,即社區結構。在現實世界中,大部分網絡都具有上述社區結構,而社區發現算法的目的則在于發現此類集合或者集群組成②賀超波,湯庸.在線社交網絡挖掘典型問題研究[M].廣州:中山大學出版社,2017:12-14.。
近年來,越來越多的企業和科研機構都在著手研究社區發現算法,其被用來解決多種社區網絡相關的問題,例如,發掘相同屬性的用戶群體從而進行商品推薦、在社交網絡中為用戶識別潛在社交圈、識別虛假信息和機器人賬號、依據社交信息預測股票及大選等信息、在互聯網金融行業中進行反欺詐預測等??梢姡鐓^發現算法在人工智能領域已經起到了舉足輕重的作用,圍繞該項技術的研究成果提出相關專利申請也成為較多企業和科研機構的一項專利布局策略。
那么,對于社區發現相關發明專利申請,目前的專利申請和保護現狀如何?是否涉及社區發現的算法改進的解決方案都能夠獲得專利保護呢?
本文首先對社區發現算法相關發明專利申請的申請及保護現狀進行梳理,然后以兩個典型案例為例,解析該領域發明專利申請的客體審查思路,最后圍繞社區發現算法相關專利申請的審查規則給出專利申請和撰寫建議。
在全球專利數據庫中針對社區發現算法相關的專利申請展開檢索,選取關鍵詞“社區”、“群”、“組”、“社團”、“簇”、“發現”、“劃分”、“分割”、“社交”、“社會”、“關系”、“復雜”、“網絡”,最終獲得1,825 件專利申請。
以下基于這些專利申請文獻,進行五局專利申請趨勢對比、主要申請人分布、五局主要技術熱點分布方面的分析。其中要說明的是,由于申請之后需要一段時間才能公開,因此,2020 至今的部分專利申請可能由于處于尚未公開的狀態從而無法體現在以下的分析圖表中。
圖1 為五局(中國、美國、歐洲、日本、韓國)從2006 年至今的專利申請量趨勢圖。

圖1 社區發現五局專利申請趨勢圖
從上述趨勢圖可以看出,在2006-2011 年期間,五局的申請量均處于起步階段,雖然美局的申請數量稍多于其他四局,但是各局申請量之間的差異并不太大,可以認為這屬于社區發現技術的發展初期;從2011 年開始,中國專利申請的數量相比較其它四局有了明顯增長,并且這種增長的趨勢一直持續至今,其中2017 年的申請量接近2016 年申請量的2 倍,也就是說,從2011 年之后,中國的社區發現相關技術的研究進入了高速發展期,而與此同時,其他四局的申請量仍然一直處于較為平穩的狀態,部分局例如美局的申請量近幾年來還出現了小幅的下降。
造成上述數據趨勢的主要原因是,中國近十年來非常重視和鼓勵電子商務、大數據、人工智能等技術的發展、應用以及上述技術與其它領域和行業的深度融合,采取了多項多種鼓勵政策及支持手段,并且多次強調加強相關技術的知識產權保護,而美局近年來對客體判斷的標準處于較為震蕩的狀態,從而在一定程度上影響了各創新主體在本領域的專利布局。
圖2 為社區發現領域全球專利數據的主要申請人分布圖。

圖2 社區發現全球主要申請人分布
因為篇幅的原因,這里僅列出申請量排名前12位的申請人。
從主要申請人分布來看,中國申請人占到了多數,這體現出了中國創新主體在本領域具有一定的研發優勢。在這些主要申請人中,企業類型的申請人主要包括騰訊、臉譜(facebook)、華為、國際商業機器(IBM)、阿里巴巴、尼爾森等,從這些企業的研發側重點來看,上述申請人體現出了不同的技術關注點,有社區發現算法的技術研發,也有社區發現算法應用方面的研發,并且均占到了較大比重。
值得注意的是,在中國申請人中,主要涉及的創新主體類型為高?;蚩蒲袡C構,這說明中國創新主體在本領域基礎算法的研究方面投入了較大的研發精力,并且這些高校或科研機構的申請量差異不大,說明各個高?;蚩蒲袡C構的研發水平相當。
圖3 為社區發現相關的主要技術熱點分布圖。

圖3 社區發現主要技術熱點(IPC分類號)分布圖
需要說明的是,IPC 分類號G06F17/30 在2019年1 月版本之后的IPC 分類表中,已經轉入G06F16/00-G06F16/958。
從主要技術熱點分布圖來看,在整體的專利申請數據中,社區發現基礎算法的研究相關的專利申請量占到了較大比重,具體表現為,主要集中在數據結構及存儲結構方面的改進、對數據結構的各種分析處理方面的改進(如基于社交的搜索、可視化、聚類、分類、相關語義工具等)等方面。
除此之外,熱點技術還涉及到了社區發現算法與其他技術的融合(例如神經網絡算法、遺傳算法等),以及社區發現過程中的數據傳輸等相關技術。從上述分析可以看出,在社區發現(關系網絡相關)技術當前發展階段,創新主體大多將研發焦點聚焦在社區發現基礎算法的改進上,并且研發內容從數據結構本身的存儲到數據的過濾再到數據的可視化,各個方面都有一定的研發投入,這也體現出了社區發現算法在創新主體中的受重視程度。
通過上述對社區發現相關的專利申請數據的分析可知,中國在本領域的技術發展已經進入高速發展期,并且在五局中體現出了明顯的技術發展優勢,同時,中國越來越多的創新主體開始重視本領域相關技術的知識產權保護,其中不僅包括企業類型的創新主體,更體現在多個高校及科研機構類型的創新主體。
在本領域的技術熱點方面,中國創新主體將研發精力主要投入在了社區發現算法的數據結構及存儲結構的改進、基于社交的搜索、可視化、聚類、分類、相關語義工具等方面,可以看出,與社區發現基礎算法相關的技術研究是中國創新主體較為重視的熱點技術,也是中國目前相比較于其他國家和地區的研發優勢的體現所在。因此,更好的明確社區發現算法相關專利申請的審查規則,有助于更好地為我國相關技術的研究發展保駕護航。
《專利審查指南》第二部分第九章第6.1.2 節規定:
如果權利要求中涉及算法的各個步驟體現出與所要解決的技術問題密切相關,如算法處理的數據是技術領域中具有確切技術含義的數據,算法的執行能直接體現出利用自然規律解決某一技術問題的過程,并且獲得了技術效果,則通常該權利要求限定的解決方案屬于專利法第2 條第2 款所述的技術方案。
上述規定對于改進僅在于算法特征的申請如何可以構成專利保護的客體進行了規定。對于改進在于算法的解決方案,如果想要構成技術方案,那么方案中算法的各個步驟要體現出與該方案所要解決的技術問題密切相關,并且,權利要求中的算法各步驟要能體現出解決該技術問題的具體過程。
以下以兩個本領域典型案例為切入點,對其涉及的方案是否屬于專利保護客體進行研究探討,以明晰本領域專利保護審查規則。
1.案例1:一種基于多網絡模塊度的社團發現方法
【方案概述】
該申請涉及一種多網絡社團結構以及社團尋找方法。
多網絡科學研究的是相互溝通的個體所組成系統的共同行為,探索復雜網絡之間的共 性和處理他們的普適方法。在多網絡科學中,需要對社團進行定量分析,提出大規模復雜網絡的社團結構的有效挖掘算法。同時,當把一個社團挖掘算法應用于某個具體的實際網絡分析時,就必須考慮具體網絡的特征、社團所對應的實際意義以及位于多個社團重疊處節點的特殊功能等。近年常用的一種衡量社團劃分質量的標準是模塊度,其基本想法是把劃分社團后的網絡與相應的零模型進行比較,以衡量社團劃分的質量。一個網絡的模塊度被定義為該網絡的社團內部邊數與相應的零模型的社團內部邊數之差占整個網路邊數的比例。
上述的模塊度定義只適用于單網絡的社團劃分,而現實世界的網絡關系經常是多維的。在復雜網絡系統分析中,圖常常是這類系統恰當的抽象表示。一般地,個體被表示為頂點,他們的相互關系被表示為連接頂點的邊。網絡科學的最新觀點是把圖中的邊看作包含個體之間的各種類型的關系的集合。例如人與人之間有工作關系、同學關系、家庭關系等。現有的多網絡社團發現算法的一般策略是提取出多網絡的特點并把問題分解成熟知的表現形式。通過解決分解后的子問題推導多網絡下的社團劃分。因此大量多網絡的社團劃分算法依賴于已有的單網絡社團檢測算法。
從社團成員的角度劃分一個社團是行之有效的。因此可以用社團中節點的冗余度作為多網絡下社團劃分結果的度量方式。近年來研究者們提出的根據網絡多維度的特性來劃分社團的方法,基于社團冗余度的多維網絡社團劃分,為多維網絡的社團劃分提供了一種新的方向,但此方法并沒有區分多維關系的維度大小,或者說忽略了節點連接關系的維度大小帶來的信息價值。
該申請為解決上述技術問題,提出了一種多網絡社團結構以及基于該結構的社團發現方法,通過定義多網絡的社團結構,并提出了基于多網絡模塊度最大化的異質網絡社團發現算法,有效地發現了多網絡中的社團結構。
【權利要求】
1.一種基于多網絡模塊度的社團發現方法,其特征在于,包括:
S1、計算多網絡模塊度,具體包括以下分步驟:
S11、采用多個鄰接矩陣表示多網絡,具體為:
MN ={A1,A2,…,Ai,…,AM},i ≤M;
其中,M 表示網絡個數,Ai 表示第i 個網絡的鄰接矩陣;
S12、確定節點冗余度連接關系矩陣,將所有網絡的鄰接矩陣相加得到節點冗余度連接關系矩陣;表達式如下:
其中,W 表示節點冗余度連接關系矩陣,矩陣W 中的每一行或每一列表示與該節點相連的各條邊在網絡中出現的次數,i 表示鄰接矩陣的序號,且i=1,2,…,M;
S13、根據步驟S12 確定的節點冗余度連接關系矩陣,計算節點冗余度;表達式如下:

其中,wjk為多網絡節點冗余連接關系矩陣W 中的元素,表示節點k 與節點j 之間的連接邊數,表示節點k 的m 階冗余度;
S14、根據節點冗余度構建多網絡1 階零模型;
S15、根據步驟S14 構建的多網絡1 階零模型,計算多網絡模塊度;
S2、根據步驟S1 計算得到的多網絡模塊度對多網絡中社團進行劃分;具體包括以下分步驟:
S21、初始時將多網絡中每個節點視為一個社團;
S22、遍歷多網絡中每個節點z,找出所有與之相連的節點,并對每個相連的接點計算節點z 加入該相連的節點所在社團的多網絡模塊度增量;
S23、找出多網絡模塊度增量最大值所在的社團,將節點z 添加至該社團;
S24、重復步驟S22 至步驟S23,直至社團個數不再變化;
S25、將由步驟S22 至步驟S24 劃分出的社團看作新的節點,重復步驟S22 至步驟S24,直至所有新的節點的多網絡模塊度增量小于或等于0 時,結束。
【案例分析】
對于該申請是否屬于專利保護的客體,存在以下兩種觀點:
觀點1:該申請關于社區網絡/關系網絡的數據挖掘,其不涉及具體的應用領域,且對網絡中的各個節點和節點間關系也沒有限定,其本質是算法本身的改進,即便采用了自動化的實現手段,但是其所要解決的問題、采用的手段、實現的效果仍然在于數學方面,而非技術方面。因此,該方案不是技術方案,不屬于專利法第2 條第2 款規定的技術方案。
觀點2:該申請中的“社團”并非“社區”含義,結合說明書的記載,“社團”指“人員”,百度百科中也指出社團指具有某些共同特征、愛好的人相聚而成的互益組織,并且權利要求1 的S21 步驟還限定了“初始時將多網絡中每個節點視為一個社團”,可見,該申請的網絡中的各個節點及關系可明確出具體的含義,體現了與具體應用領域的結合,因此,該申請的方案屬于專利法第2 條第2 款規定的技術方案。
實際上,觀點2 的意見中,對于該申請中“社團”的理解還不夠準確。在社區發現領域,“社區”有時也被成為“社團”,二者含義在本領域基本相同。雖然該申請中采用了“社團”的描述,但基于本領域技術人員的理解,社團發現與社區發現都指代community detection,其中的社團或社區可以表示社交網絡,也可以表示其他具有網絡關系的實體,如互聯網、交通網、電力網等。另外,雖然該申請的方案中有“圖”、“邊”、“頂點”,但是此種結構圖,例如知識圖譜并非我們傳統認為的圖像領域,而是一種數據關系的表達,仍屬于抽象的算法本身。
從該申請說明書及權利要求來看,其方案通過計算多網絡模塊度并根據得到的模塊度對多網絡中社團進行劃分,從而實現社團發現,因此,其實質上仍然屬于單純的社區發現方法,其解決的是社區發現算法自身的問題,并非技術問題,采用的手段也是定義多網絡的社團結構,屬于社區發現算法本身的優化,并非利用自然規律的技術手段,獲得的也不是技術效果,因此該申請權利要求要求保護的方案不屬于專利法第2 條第2 款規定的技術方案。
2.案例2:關系網絡構建方法及裝置
【方案概述】
該申請涉及一種關系網絡構建方法。
隨著互聯網技術的發展,基于互聯網實現的社交平臺、交易平臺也越來越多。用戶通過這些平臺可以進行各種事件,例如查詢事件、支付事件等,事件涉及到的主體可以是設備名稱、用戶賬號、手機號、銀行卡等。這些平臺可以將用戶、設備或其他介質關聯起來,形成一個關系網絡。在實際應用中,經常會利用該關系網絡開發一些新的應用,例如對于社交平臺,可以利用該關系網絡創建推薦系統,以進行好友推薦等;又例如對于交易平臺,可以利用該關系網絡進行風險識別,以檢查交易是否安全或交易信息是否被盜等。
在使用關系網絡之前,需要首先構建關系網絡。在現有技術中,主要是將事件涉及的主體進行兩兩關聯,形成關系矢量,關系矢量之間相互關聯從而形成關系網絡。這種關系網絡的結構比較龐大,使用效果較差。
基于上述問題,該申請的提出了一種關系網絡構建方法及裝置,用以構建結構合理的關系網絡,提高關系網絡的使用效果。
【權利要求】
1.一種關系網絡構建方法,其特征在于,包括:
確定構建關系網絡所需的事件及事件參數,所述事件參數包括所述事件的結果、所述事件中的主體及所述主體的類型;
執行以下處理以構建出所述關系網絡:
當所述事件的結果屬于預設的事件結果集合時,則將所述事件涉及的主體對映射到所述關系網絡中的同一子網絡,所述主體對包括所述事件中存在關聯關系的主體;
當所述事件的結果不屬于所述事件結果集合,且所述主體對中的所有主體的類型都屬于預設的關鍵主體類型時,將所述主體對映射到所述關系網絡中的同一子網絡;
當所述事件的結果不屬于所述事件結果集合,且所述主體對中部分主體的類型屬于所述關鍵主體類型,則將第一部分主體映射到所述關系網絡中的同一子網絡,并用第二部分主體描述所述第一部分主體的行為屬性,所述第一部分主體是指所述主體對中類型屬于所述關鍵主體類型的部分主體,所述第二部分主體是指所述主體對中類型不屬于所述關鍵主體類型的另一部分主體。
【案例分析】
該申請的關系網絡構建方法要解決的問題是當前關系網絡結構龐大、使用效果差的問題。其中,該方案中關系網絡構建是通過對關系網絡所需事件涉及的主體對的映射來實現關系網絡的分割,進而構建結構合理的關系網絡,這屬于技術問題;權利要求請求保護的方案通過數據分析挖掘出不同的事件對應的主體之間的關系(如訪問網站、在線支付等),與事件相關的信息包括事件的主體、主體的類型、事件的結果、事件的名稱等,其涉及的事件、主體、主體類型并非為抽象概念,而對這些數據之間關聯關系的挖掘和處理屬于遵循自然規律的技術手段。最后,該申請構建的關系網絡并不僅僅是一種抽象算法的數學運算結果,方案實施后通過主體和子網絡的映射關系的改進,提高了關系網絡的使用效果,屬于技術效果。因此,上述方案屬于專利法第2 條第2 款規定的技術方案。
社區發現算法實質上屬于一種聚類算法。由于單純的抽象算法本身屬于專利法第25 條第1 款第(2)項規定的智力活動的規則和方法,不屬于專利保護的客體。因此,對于單純的涉及社區發現算法本身改進的解決方案來說,如果未能體現出方案能夠解決某具體應用領域的技術問題,即,對于改進在于算法特征的申請,如果權利要求記載的方案無法體現出該社區發現算法具體應用于何領域,那么,這樣的解決方案難以獲得專利保護。
綜上,對于改進在于社區發現算法的發明專利申請,如果能夠成為專利保護的客體,那么,在撰寫此類申請的申請文件時,除了在說明書的背景技術部分詳細寫明本申請對于社區發現算法的改進是為了解決其在某領域的應用過程中遇到的何種技術問題,實施該方案能夠獲得的技術效果之外,同時,還需圍繞要解決的技術問題,在權利要求的方案中詳細記載算法各步驟用于解決該技術問題的具體過程,即,算法的執行直接體現出利用自然規律解決某一技術問題的過程。
專家點評
該篇文章圍繞“社區發現”這一人工智能領域的熱點算法,從專利申請和保護的現狀,特別是通過五局申請量的對比,讓廣大讀者能夠了解到國內外相關企業和機構,對于社區發現這一領域的研究熱點和專利申請熱點,也從申請量的對比分析中讓讀者直觀感受到我國在社區發現算法研究領域的領跑地位。同時,面對該領域與日俱增的專利申請量,本文針對2020 年2 月《專利審查指南》新增專節6 中關于新領域、新業態的審查最新規定,圍繞典型案例,給出正反兩方面的客體判斷思路,不僅對最新客體審查基準進行了案例詮釋,同時圍繞社區發現相關發明專利申請的特點給出了申請文件撰寫建議,能夠有效幫助讀者了解審查相關規定,提升該領域專利申請的撰寫質量。