文 / 羅嘯 / 北京國之專利預警咨詢中心
當前,在“專利運用”概念逐步進入人們視野的同時,作為專利運用重要方面的專利信息分析,也逐漸被廣泛認知。由于專利文獻承載著豐富的技術信息、商業信息和法律信息,因此,對專利信息價值的挖掘利用已經得到人們越來越多的重視,并且尤其得到企業界的關注,企業常常希望能夠通過對專利信息開展分析,實現技術跟蹤、侵權預警、市場布局、尋求合作等多種目的,無論是出于什么目的,能夠快速、準確地檢索出該專題領域的主體專利文獻(包括有效或者失效的專利、專利申請)是保障上述目標得以實現的重要基礎。然而,要做好這一點卻并不容易,這是由于專利檢索是一項專業性很強的工作,既需要深諳專利文獻特點,也需要積累檢索經驗。在這種情況下,一些企業工作人員面對經常出現的專利檢索結果的不確定性,會產生一些認識上的誤區:一種觀點認為專利檢索沒有策略可循,因此出現不一樣的結果是必然的,另一種觀點則認為專利檢索沒有技巧可言,無非是輸入關鍵詞和分類號等檢索要素即可。因此,在專題技術專利檢索實踐方面,還存在很大的提升空間。
鑒于這種現狀,本文試圖從檢索策略的層面出發,進行可行性和實證性探討,提出一種適宜企業工作人員快速掌握、準確實現專題技術專利檢索的方法。
面對一項專題檢索任務,即使是檢索經驗豐富的專業檢索人員和技術功底扎實的企業工作人員都無法立即獲得完整的檢索要素,這些要素包括:適應專題領域專利特點的技術層次結構、表述技術要點的關鍵詞、相關的分類號、主要專利申請人等。但是,通過初步了解技術內容,可以迅速提煉出有效的基本檢索要素,以“晶硅光伏制造技術”為例,“晶硅”、“光伏”是基本檢索要素。專利文獻雖然著錄項目豐富,但不同發明人對技術術語的表達卻不盡相同,而且基本檢索要素并非一定會出現在著錄項目信息中,因此,通過基本檢索要素構建的檢索式通常會出現較多漏檢,檢索人員不能期望通過一條基本檢索式即獲得完整的檢索結果,但是,通過基本檢索我們卻能獲得集中度、準確度高的檢索結果。具體到本例,“光伏 and 晶硅”即為一條基本檢索式。我們將嘗試以此為突破口,開啟本專題的檢索之路。
經初步檢索,容易了解到申請人在專利文獻中常以“太陽電池”、“太陽能電池”作為“光伏”的通俗表達方式,因此,可將基本檢索式擴展為“(光伏or 太陽電池 or 太陽能電池) and (單晶硅 or 多晶硅or 晶體硅)”;更進一步,由于在摘要(AB)字段下檢索引入的噪音文獻多,而在專利文獻題名字段(TI)檢索命中率高,充分利用該特點,在中國專利數據庫中用TI字段初步檢索得到781篇專利文獻。

表1 TI字段下基本檢索后的IPC統計分析

表2 AB字段下基本檢索后抽樣文獻的IPC統計
為了有效遴選相關度高的分類號,我們可從產業鏈角度加深了解“晶硅光伏制造技術”的生產環節。“晶硅光伏”產業鏈包括硅料、鑄錠(拉棒)、切片、電池片、電池組件、應用系統等六個環節,其中上游為硅料、硅片環節,中游為電池片、電池組件環節,下游為應用系統環節。經過統計分析,我們得到如下IPC分類號大組與技術方向的相關對照表,如下表1所示。
基于上述統計結果,容易得知IPC分類號主要集中在H01L31、H01B1、C30B、B23K、G01等分類領域1. IPC分類體系按部、大類、小類、大組、小組逐層細化,筆者認為專題技術通常涉及面較寬,以選取大組分類號為宜;可利用專業的專利信息分析工具或者EXCEL進行分類號統計。;為驗證該結果的可信度,將其與《國內外光伏產業專利情報分析》一文【1】中表2所列的光伏領域主要IPC排名進行對比,除H02N6/00(光輻射直接轉變為電能的發電機,不含太陽能電池)、H02J3/38(并網發電裝置)、H01G9/20(光敏器件)、H02J7/00(用于電池組的充、供電或去極化的裝置)、F21S9/03(通過曝光再充電,如太陽能路燈)、E04D13/18(能量收集裝置的屋頂覆蓋物,如光伏屋頂)外,其它IPC分類號都完全涵蓋,并且更為完整。由于本專題“晶硅光伏制造技術”側重關注產業鏈上游和中游光伏電池制造技術,因此,有關并網、充電、太陽能路燈以及光伏屋頂等涉及下游應用領域的IPC分類不需考慮。上述統計結果充分體現出,在樣本量適當的情況下,利用基本檢索在TI字段下統計IPC分類號具有良好的可信度, 表1中的IPC分類號全部涉及光伏產業上游和中游技術。
為進一步驗證統計結果是否比較好地囊括了全部相關IPC分類號,即驗證其完整度,我們還可根據基本檢索式在AB字段下的檢索結果(通常,AB字段下的檢索結果遠大于TI字段下的檢索結果),采取抽樣的方式驗證。具體操作方式是:在中國專利數據庫中摘要字段(AB)下進行基本檢索;抽取早期、中期和最近年份申請的部分專利文獻;對樣本進行IPC統計分析;比對該統計結果和TI字段下基本檢索的分類號統計結果。本案例在中國專利數據庫下利用基本檢索式“(光伏 or 太陽電池 or 太陽能電池) and (單晶硅 or 多晶硅 or 晶體硅)”獲得1847篇專利文獻2. 檢索日期為2013年1月18日。。抽取2000年、2005年和2011年申請的專利共計602篇,統計結果如下表2所示。
基于上述統計結果可知,仍有不少IPC分類號未出現在表1的統計結果中,對這些分類號的釋義查看后發現,部分IPC分類號與本專題技術有一定的關聯性,如C01B33(硅及其化合物)、B32B17(實質上由玻璃片或玻璃纖維、礦渣或類似物組成的層狀產品)、H01L25(由多個單個半導體或其它固態器件組成的組裝件)、B28D5(半導體材料精加工)、B41F15(絲網印刷機)等,但并非晶硅光伏制造技術的最佳分類位置,如C01B33完全可由C30B15、C30B28、C30B31等分類號代替。
由此可見,表1中的結果已較好地覆蓋了本專題技術領域。

表3 主要關鍵詞和IPC分類領域對應關系表
梳理技術結構是專題技術檢索的一個重點,其目的一是建立專利技術索引,二是輔助確定基本關鍵詞,從而使檢索富有針對性。本領域技術人員可以結合工作經驗首先列舉出本專題下不同技術分支常用的技術術語,并在檢索實踐過程中對其不斷完善;也可利用表1得到的分類領域,選擇各技術分支對應分類號下的部分專利文獻進行試探性閱讀,這是一種相對更為直觀的方法。由于梳理技術結構、確定技術領域關鍵
注 釋詞是本領域技術人員相對熟悉的方面,因此,本節將不做深入探討,僅從以下幾個方面歸納關鍵詞選取中值得注意的方面:
(1)即便是本領域技術人員,也需要積累、補充、完善有關技術術語,一種好的方法是建立本領域的關鍵詞表,并不斷完善其表達形式;
(2)關鍵詞的選取不宜多,而在于精和全?!熬斌w現在能夠很好地代表某技術分支的主要特點,如“制絨”就是太陽能級晶硅表面處理工藝的代表性關鍵詞;“全”則體現在是否對關鍵詞做了全面擴展,如對“制絨”擴展為“陷光”。
(3)從領域和專利文獻的特點選擇關鍵詞。專利文獻不同于技術資料和科學論文,其主題只能是“產品”或“方法”,為了獲得較大保護范圍同時保護技術秘密,其中往往不記錄具體的工藝參數,因此關鍵詞需從領域特點和文獻特點出發進行選擇。
(1)水分析出階段:由室溫至190 ℃左右,該階段的失重主要是由于污泥內在結合水和少量外在水的析出引起的。由DTG曲線可見,在溫度為82.9 ℃時,失重速率最大,達到了1.06%/min,該階段物質損失量約為初始污泥重量的5%。
下表3列出了本專題技術的主要關鍵詞及與其對應的分類領域【2】。檢索人員通過對本表的不斷完善,有利于實現更精準的檢索結果。
實踐表明,在專題技術檢索中,通過某一檢索方式不可能獲得比較完整的檢索結果,為了快速檢出主體部分的專利文獻,本文采用一種可稱為“互補-關聯”式的組合檢索策略3. 互補式檢索實質上是組合檢索策略的一種表現形式,但“互補”在定義上從專題檢索出發,強調構建的檢索式之間應具有明確的關聯性?!瓣P聯”的最大作用在于引導不具備良好檢索技巧的人員實施一個完整的檢索過程。,下圖形象地示出了該檢索策略的“互補”特點。

其中“1”代表的檢索式表示從專題的技術主題入手進行的第一階段檢索,檢出率高,但漏檢率同樣也高;“2”至“6”代表的檢索式表示從技術分支入手進行的第二階段檢索,由于深入了專題的技術內涵,因此,有利于實現對專題整體的擴展檢索;根據需要,還可進行第三階段檢索,即從申請人入手進行的補充檢索。三階段檢索之間具有如下的“關聯”關系:
(1)第一階段,從“主題”入手進行檢索能迅速檢出大量相關專利文獻,并且由于與在TI字段下統計分類號具有類似檢索思路,便于充分利用已有工作成果,并通過初步瀏覽相關文獻,積累完善關鍵詞,為第二階段的檢索做好準備,這對檢索經驗不足的企業工作人員開啟工作思路具有引導作用;
(2)第二階段,結合統計得到的有效分類號和通過第一階段檢索后積累的相對完備的關鍵詞,按“技術分支”進行擴展檢索,這對檢出相關專利文獻的主體部分具有決定作用,利用第一階段和第二階段得到的相對完整的檢索結果,可統計出本專題領域的主要申請人;
(3)第三階段,利用第二階段統計得到的主要申請人,開展以申請人為入口的補充檢索。
根據不同需要,可對三個階段的檢索結果采取不同處理方式:
(1)對于了解專利申請趨勢、主要申請人、主要技術來源、主要申請目標國家等基本信息的需求,可將三階段檢索結果進行“或”處理后,做統計分析;
(2)對于分析技術發展方向、熱點、主要競爭對手技術特點等信息,則需要對三個階段的初檢結果進行篩選,可以預料,三個階段的檢索結果之間必然出現文獻重疊,為此,在篩選新一階段的檢索結果時,將之前已篩選過的檢索結果予以排除,有利于提高工作效率。
(3)為分析特定申請人的技術特點,可根據統計出的申請人名稱做以申請人為入口的跟蹤檢索。

表4 排名前十五的中國專利主要申請人
為了充分發揮關鍵詞和分類號的作用,對任一檢索環節都從兩個角度構造檢索式,這里所指“檢索環節”例如是第一階段的主題檢索、第二階段某一技術分支的檢索等,“兩個角度”則是從關鍵詞和分類號兩個方面限定“晶硅光伏”制造這個基本檢索領域。以對“硅料”的檢索式構造為例,一個角度是“硅料”及擴展關鍵詞用“光伏”及擴展關鍵詞加以限定;另一角度是“硅料”及擴展關鍵詞用相關IPC分類號加以限定。經檢索,第一階段共檢出1543條專利文獻,第二階段共檢出12400條專利文獻。兩個階段檢索結果經“或”運算,共計得到12658條專利文獻4. 檢索截止日為2012年1月30日。。對上述12658條檢索結果統計得到排名前列的申請人如下表4所示。檢索人員根據需要可以申請人為入口開展進一步補充檢索。
為驗證檢索結果的可信度和準確度,可從查全和查準兩個角度進行評估。
查全率評估【3】按如下方式操作:以申請人為入口檢索“山東力諾太陽能電力股份有限公司”的全部專利文獻有85條,其中,與本專題密切相關的有82條,下表4顯示該公司已被檢出72條相關專利文獻;查全率=72/82=0.878,由此可初步評估上述檢索過程的查全率接近90%。

查準率評估按如下方式操作:在全部12658條檢索結果中,在三個不同申請年份隨機各抽取連續排列的100條文獻檢查其相關性。經抽查,100條2005年申請的抽查文獻中有26條噪音文獻,其主要涉及薄膜電池、染料敏化電池技術,查準率達到74%;100條2009年申請的抽查文獻中有11條噪音文獻,其主要涉及光伏應用和非晶硅薄膜電池技術,查準率達到89%;100條2012年申請的抽查文獻中有15條噪音文獻,其主要涉及關伏應用,查準率達到85%?;谏鲜龀闃咏Y果綜合考慮查準率可初步評估為80%以上。
由此可見,結合上述檢索策略獲得的檢索結果具有較好的可信度和準確度。
本文介紹了一種對企業工作人員來說直觀、便捷的專題技術專利檢索策略,對企業開展初、中級階段的專利信息分析具有一定引導作用。由于檢索環節環環相扣,從而使不具備檢索策略構建能力的非專業檢索人員能夠在短時間內檢索到專題技術的主體部分專利文獻,并在逐步完善檢索要素后能夠實現對專題技術的完整檢索。
【1】唐恒,桂勇,霍冠宇. 國內外光伏產業專利情報分析[J]. 情報雜志,2011(11):21-27.
【2】鄧金堂,唐亮,段雪景. 基于專利地圖的我國光伏發電產業專利情報研究[J]. 情報雜志,2011(2):19-23.
【3】楊鐵軍. 專利分析實務手冊 [M]. 北京,知識產權出版社,2012.