劉 超,石艷麗,趙 怡
(國家知識產權局專利局專利審查協作北京中心,北京 100083)
《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》中指出,為強化國家戰略科技力量,瞄準人工智能、生命健康等前沿領域,實施一批具有前瞻性、戰略性的國家重大科技項目。智慧醫療技術是深度融合了人工智能和生命健康技術[1]。人工智能技術的核心在于機器學習,其通過對海量的數據進行不斷的采集、加工、分析和挖掘,對特定的模型進行不斷的訓練,最終形成有價值的知識模型[2]。人工智能技術與疾病診斷十分契合,是智慧醫療的重要應用場景和研究熱點[3-6]。人工智能輔助診斷針對的疾病包括癌癥、腦部疾病、精神類疾病、心血管疾病和肺部疾病等[7,8]。乳腺癌是全球發病率最高的惡性腫瘤及女性常見的惡性腫瘤[9,10]。在過去20 年里,乳腺癌的發病率逐年提高[11]。目前關于乳腺癌的確切發病機制尚不明確,相關高危因素難以控制,一級病因預防較難實現,故乳腺癌的防控以“早發現、早診斷、早治療”的二級預防為主。雖然目前沒有預防乳腺癌的手段,但是疾病的早期發現延長了患者預期的壽命,并且降低了需要全乳腺切除的可能性[12]。臨床上乳腺癌篩查主要依靠影像學檢查和活體組織檢查。影像學檢查手段有乳腺X 線鉬靶圖像、乳腺超聲及乳腺MRI 等。活體組織檢查是乳腺癌最終確診的金標準[13-15]。乳腺癌的臨床早期篩查面臨著一些問題,如醫療資源不均衡、影像成像質量不同、影像數據量大、人工閱片耗時長,還可能會因醫生水平參差不齊及閱片主觀性導致閱片錯誤,存在漏診誤診的風險[16]。人工智能輔助診斷與醫師診斷相比,具有不受醫師主觀性、經驗差異及疲勞等人為因素影響的自身優越性[17-20]。本文主要以乳腺癌人工智能輔助診斷為例進行專利情報研究。
1.1 資料來源 在incoPat 全球專利數據庫中檢索乳腺癌人工智能輔助診斷全球專利。首先采用關鍵詞和分類號檢索,在每次檢索后導出少部分檢索結果以簡單瀏覽其標題和摘要,補充遺漏的關鍵詞和分類號,大概計算噪聲文獻的比例。根據明顯的噪聲文獻修改檢索式,在檢索式中用“NOT 噪聲關鍵詞”的方式剔除掉這部分噪聲文獻。用修改后的檢索式重復上述步驟,直到噪聲文獻的比例在20%左右。由于后期需要人工閱讀每篇文獻并標引,因此噪聲文獻過多不利于后期人工閱讀,而噪聲文獻過少可能表示文獻的查全率不足。最后針對該領域的重要創新主體進行針對性的檢索,完善檢索結果。
1.2 關鍵詞 包括乳腺、癌、人工智能及具體算法、診斷的中英文擴展關鍵詞,如(乳腺or 乳房or 乳頭orbreastormammary)、(癌or 瘤or 惡性占位or 惡性病變orcancerortumorortumourorneoplasm)、(診斷or確診ordiagnos+)、(人工智能or 機器學習or 神經網絡or 深度學習or 支持向量機or 貝葉斯orK 近鄰等具體算法及其英文)。分類號包括IPC 和CPC 分類號,如 A61B5 -A61B10、G16H50、G16H30、G06N20、G06N3 等。噪聲關鍵詞包括駕駛、汽車、動物、睡眠、保險等。檢索結果經簡單同族合并后導出數據。
1.3 方法 首先,閱讀申請文件從而剔除噪音并人工標引,閱讀標題、摘要以及必要時閱讀說明書,剔除掉無關專利文獻,標引相關文獻,重點標引項包括診斷所采用的醫學數據源、人工智能算法的名稱和作用、專利發明點、技術效果。其次,分析全球專利申請趨勢和中國專利申請趨勢,統計各國專利申請量并排序,確定專利申請的主要原創國家/地區。最后,統計并確定重要申請人,對重要申請人進行背景調查、專利布局分析和專利技術分析。
2.1 專利申請趨勢 乳腺癌人工智能輔助診斷專利申請最早出現在20 世紀90 年代初,在最初的20年,乳腺癌人工智能輔助診斷技術長期處于萌芽階段,每年的全球申請量很少。2015 年以后乳腺癌人工智能輔助診斷領域的全球申請量進入了高速增長階段且增長勢頭不減。我國相關專利技術長期處于空白階段,2017 年才開始出現了一定的專利申請,但是增長迅速,見圖1。由于專利從申請到公開要間隔一段時間,因此很多2020、2021 年申請的專利尚未公開。

圖1 乳腺癌人工智能輔助診斷專利申請情況
2.2 主要國家/地區專利申請量 乳腺癌人工智能輔助診斷領域全球專利申請主要原創國為美國、中國、韓國、日本、荷蘭和德國。從申請趨勢來看,在2015年前美國維持著少量專利申請,其他國家的申請量可忽略不計,近幾年雖然各國的專利申請量均出現了增長,但增長量主要由美國和中國貢獻。從申請總量來看,美國申請總量為482 項,為最主要的技術產出地區,占比全球總量的43.78%,其次是我國,申請總量為265 項,占比24.07%,韓國、日本、荷蘭、德國占比在6.64%~4.43%,見圖2。

圖2 乳腺癌人工智能輔助診斷原創國申請趨勢
2.3 重要申請人
2.3.1 全球申請人排名 乳腺癌人工智能輔助診斷專利全球申請人排名前15 見圖3。飛利浦、西門子是醫療器械行業的巨頭,專利申請量明顯多于其他申請人。Enlitic 公司成立于2014 年1 月,是一家運用機器學習等前沿技術輔助醫療診斷的新公司。IBM和谷歌在人工智能算法領域技術先進,IBM 為了豐富自身的醫療數據庫收購了醫學圖像軟件公司Merge Healthcare。排名中有4 家中國申請人:騰訊、聯影、中國科學院和杭州依圖。

圖3 乳腺癌人工智能輔助診斷全球申請人排名
從申請人的專利布局來看,飛利浦和西門子在美國、中國、歐洲均有較多申請,并且有較多的PCT申請。飛利浦79 項專利中43 項進入中國,西門子73 項專利中20 項進入中國,飛利浦在中國的專利申請量為西門子的2 倍。Enlitic、IBM 主要在美國申請專利。騰訊、聯影主要在中國申請專利,另有少量的美國專利和PCT 專利,見表1。

表1 重要申請人在目標國家/地區專利申請量(項)
2.3.2 飛利浦 飛利浦的專利申請趨勢見圖4。飛利浦是傳統醫療器械三巨頭(GE、飛利浦、西門子)之一,其在乳腺癌人工智能輔助診斷領域已持續發展了近30 年,除2018 年申請量明顯上升之外,近年的申請量比較穩定。飛利浦的乳腺癌人工智能輔助診斷專利中64.29%以醫學影像為數據源,15.71%以基因為數據源,病理圖像占5.71%,生化數據占2.86%。飛利浦的專利申請的技術分支分布見圖5。飛利浦在乳腺癌人工智能輔助診斷專利中的重點技術分支是診斷分級,也就是通過對輔助診斷流程中多個步驟的改進,提供整體的解決方案和進步。另外,圖像預處理、模型建立、特征提取也是飛利浦的主要技術布局方向,所實現的主要技術效果是提高診斷的自動化、優化訓練數據、改進特征或參數、提高診斷精準度。

圖5 飛利浦在乳腺癌人工智能輔助診斷中的技術分支
2.3.3 西門子 西門子的專利申請趨勢見圖6。西門子在乳腺癌人工智能輔助診斷領域保持著一定的申請量,2017 年開始專利申請量出現了明顯的增長。西門子有54.79%的專利是基于醫學影像實現人工智能輔助診斷,26.03%的專利合并考慮了醫學影像數據與其他數據,例如以患者的醫學影像為主并結合生化數據、大數據實現輔助診斷或良惡性判別,13.70%的專利基于生化數據。西門子的專利申請的技術分支分布見圖7。西門子在乳腺癌人工智能輔助診斷專利中的重點技術分支依次是診斷分級、模型建立和圖像預處理。所實現的主要技術效果是改進醫學圖像質量、優化診斷模型、提高診斷精準度、預測治療效果、降低醫療成本。

圖6 西門子在乳腺癌人工智能輔助診斷的申請量

圖7 西門子在乳腺癌人工智能輔助診斷中的技術分支
2.3.4 騰訊 騰訊公司的專利申請包括2018 年6 件,2019 年32 件,2020 年9 件,2021 年4 件。騰訊首先完成了乳腺鉬靶人工智能診斷產品的研發和落地,并且在核磁共振和病理方面,相關的研發的工作也已經展開。騰訊與多家醫院聯合研發,在2018 年7月推出了“騰訊覓影”乳腺腫瘤篩查人工智能系統。在乳腺癌人工智能輔助診斷中,80.39%的專利基于醫學影像進行輔助診斷,17.65%基于病理圖像。在醫學影像中,41.46%采用乳腺鉬靶圖像,14.63%采用磁共振圖像,4.88%采用超聲圖像,還有39.02%的專利也采用醫學影像但是可以采用乳腺鉬靶圖像、磁共振圖像、超聲圖像中的任一種或多種。騰訊的專利申請的技術分支分布見圖8。在技術分支來看,43.14%的專利的重點在于確診分級,也就是從人工智能輔助診斷流程的多個步驟進行改進,33.00%的專利的重點在于圖像預處理,19.61%的專利的重點在于模型建立。騰訊的大部分專利都撰寫為人工智能輔助診斷整體方案,從一個新的技術構思出發,圍繞該技術構思在圖像預處理、特征提取、模型建立和診斷分級各步驟將技術方案完整的體現在專利申請文件中。

圖8 騰訊在乳腺癌人工智能輔助診斷中的技術分支
騰訊公司的專利授權率為45.10%,在審率49.02%,而失效率僅有3.92%。已經審結的案子中幾乎全部都被授權,由此可見,騰訊公司的技術水平以及專利申請水平很高。在全部專利中,有72.55%的專利申請僅包含CN 同族,23.53%的專利申請有WO 同族,有1.96%的申請僅包含CN 和US 同族。騰訊公司3/4 的申請為國內申請,1/4 的申請為PCT申請。騰訊在該領域有一定的海外專利布局,較為重視海外專利保護。
2.3.5 聯影 聯影公司的專利申請包括2012 年1 件,2013 年1 件,2016 年2 件,2018 年5 件,2019 年8 件,2020 年12 件,2021 年8 件。聯影在乳腺癌人工智能輔助診斷領域的專利全部都是采用醫學影像作為數據源,沒有涉及病理圖像、生化數據、大數據的專利。聯影的專利申請的技術分支分布見圖9。聯影將近一半的專利的發明點在于圖像預處理,研究重點包括:實現對掃描影像質量的智能評估,在數十層甚至上百層掃描影像中方便快捷地篩選出存在質量問題的掃描影像并進行異常區域的提示,從而提升檢查診斷整個流程的效率以及準確率。

圖9 聯影在乳腺癌人工智能輔助診斷中的技術分支
人工智能輔助乳腺癌等癌癥的診斷是人工智能在醫療領域的熱點,該領域的發展得益于人工智能算法的發展。2015 年在圖像識別領域基于深度學習的人工智能算法實現了飛躍式發展。2015 年前人工智能輔助乳腺癌診斷專利處于緩慢增長期,全球專利申請量較少。2015 年后進入快速發展期,隨著人工智能進入第三波發展高潮、醫學影像學、大數據、海量計算技術的不斷發展,專利申請大量出現,2015-2020 年保持高速增長,可以預計專利申請量會繼續增加。我國相關專利技術起步晚一些,但多方面因素促進其快速發展:我國政府高度重視智慧醫療的發展,我國是人口大國,醫療資源相對緊張,而人工智能輔助診斷能夠提升診斷效率、彌補基層醫療力量的不足,國家政策的支持與市場需求促使相關產業快速發展。
美國、中國在該領域的技術優勢明顯。美國作為發達國家、超級大國,基本上在各個領域都是專利實力最強的。我國在該領域的專利申請總量排第2 位,一方面是因為我國有一批實力強的創新主體,另一方面是中國人口基數大從而專利申請數量多。我國正在從專利數量大國向專利質量強國轉變,我國的申請人要摒棄低質量專利申請,提高專利質量,充分用好專利制度,最終實現專利的經濟價值。
該領域的重要申請人主要分為兩類:醫療公司和計算機公司,具體來說包括醫療強企如飛利浦和西門子、醫學影像企業如聯影,還包括計算機互聯網企業如騰訊和IBM、新科創企業如Enlitic 公司。飛利浦、西門子在醫學影像領域有成熟的產品、海量的圖像數據,因而在人工智能輔助診斷乳腺癌技術上有明顯的優勢。聯影在醫學影像領域具備一定的基礎和技術儲備。騰訊利用自身在互聯網、人工智能、大數據上的優勢聯合多家醫院和科研機構在人工智能輔助診斷乳腺癌領域申請了大量專利。IBM 本身在人工智能領域即具備一定的實力,并通過企業并購彌補了自身在醫學影像數據庫上的不足。Enlitic 公司更是一家專門致力于機器學習輔助診斷的公司。
從在目標國家/地區的專利布局情況來看,飛利浦和西門子的目標市場是全球,因此重視PCT 專利申請,在各個國家的專利布局也比較廣泛和均衡。同為醫療行業巨頭,飛利浦有43 項在我國的專利申請,而西門子僅為20 項,西門子對我國市場的關注和保護力度更弱一些。Enlitic、騰訊、IBM 等申請人更偏重于在自身所屬的國家申請專利,影響這些企業專利布局的因素包括公司實力、申請和維持專利的成本、進入目標市場并獲得商業利益的預期等。在我國申請人中,騰訊的PCT 申請量是最多的,具備更優秀的研發實力和全球布局意識。
這些企業的成功經驗有以下幾點:依托于醫學成像設備獲得大量的醫學影像數據,研發先進的人工智能或大數據算法,與醫院合作彌補自身在醫學數據、醫學知識方面的不足,與企業和科研院所合作或通過并購提升研發能力彌補在醫學數據或人工智能算法方面的不足,進行PCT 申請的全球布局,圍繞核心專利構建專利保護壁壘。
乳腺癌人工智能輔助診斷是智慧醫療的熱點領域,我國創新主體要重視技術研究和專利布局。首先,利用好國家對智慧醫療的鼓勵和優惠政策,積極參與相關項目;其次,醫學影像數據的獲取、輔助診斷算法的驗證離不開醫療機構,建議企業、科研院所加強與醫院的合作,獲得醫學數據、相關醫學知識、以及醫生與患者的反饋,有助于相關技術更貼合實際應用場景,并彌補醫療機構在人工智能算法領域的劣勢;再次,創新主體要做好目標市場和競爭對手的分析,包括目標市場的產業現狀、競爭格局、關鍵技術發展趨勢,以及競爭對手的專利現狀、專利布局,找準技術熱點、技術機遇,規避專利風險、技術短板,從而規劃創新主體自身的技術發展路徑。