文/本刊記者 許歡
但事實上,它需要運用一些數量分析、歷史分析來預測一些相關信息,才能真正用起來。標準館里的標準文獻,可以稱得上是大數據,所以我們會采用標準化理論數據及大數據方法來揭示數據內容,以提升標準化水平。
2018年5月29日,第二屆標準大數據服務發展研討會,發布了《2017我國標準起草單位大數據報告——國家標準與行業標準研制貢獻指數》(以下簡稱《報告》),這份《報告》從大數據角度,利用大數據方法,全面立體地展現我國標準研制起草單位的發展脈絡。此外,會上還詳盡分析了標準信息服務的發展趨勢。
中國標準化研究院國家標準館館長汪濱在發布報告時指出,標準是國家質量技術基礎的重要組成部分,是一個國家、地區和單位軟實力的體現,代表著話語權、治理能力和技術質量水準。
這份《報告》涉及的“國家標準”范圍主要有:原國家質檢總局、國家標準化管理委員會、住房和城鄉建設部、原國家衛生和計劃生育委員會、原農業部、原環境保護部等部門發布的“國家標準”。發布時間在2001—2016年,出版時間截至2017年10月,數量約為3.5萬項國家標準和約4萬家起草單位。
從國家標準研制貢獻指數(以下簡稱“國標指數”)來看,國家標準研制的參與度顯著提升。數據顯示:2016年,國標指數為5786.9,國家標準發布數量2435 項,國家標準起草單位6009家;2016年相對2015年,國家標準發布數量增長7.1%,國標指數降低10.0%,起草單位數量降低11.5%。
2001—2016 年,國家標準發布數量年均增長率5.5%,國標指數年均增長率8.8%,國家標準起草單位數量年均增長率12.2%;平均每個標準起草單位數量從2001年1.8穩步上升到2016年6.5,增長率達到261%。
通過集中度分析得出:2016年,國家標準研制集中度較高,前5%的300家起草單位貢獻38.85%的國標指數,主要由企業和研究院所組成,其中,研究院所國標指數占比達52.7%,企業起草單位數量占比達46.3%,企業占比逐步上升。這表明,已有更多企業投入到國家標準研制,企業正成為國家標準研制的中堅力量。

此外,2016年國家標準起草單位的地域分布也更加廣泛。相對于2015年,2016年北京國標指數和主導國家標準研制數量的全國占比呈下降趨勢,而廣東、浙江、江蘇、上海、山東五省市國標指數之和與主導國家標準研制數量之和,均呈現上升趨勢。與北京市相比,這五省市起草單位的數量和研制國標的數量差距較小,但需要進一步提升研制國家標準的主導程度。
2016年,企業是“國家標準”研制的主要力量。其國標指數與起草單位數量占比均超過50%,研究院所對國家標準研制的引領作用明顯,以20.3%國家標準起草單位數量占比,主導了43.7%國家標準研制。2001—2016年,企業主導國家標準數量與研究院所主導國家標準數量相比增長趨勢明顯,并且在2016年,首次超過研究院所。
由于2016年企業“國標指數”占比最高,《報告》還特別就企業研制“國家標準”情況進行了專題分析。地區分布上,2001—2016 年,企業參與國家標準研制主要從2008年開始,之后逐步增多。這些企業主要分布在浙江省、北京市、江蘇省、廣東省、上海市、山東省等發達地區;領域分布上,2016年制造業企業的國標指數占比最高,達到70.5%,第二是科學研究和技術服務業的企業,第三是信息傳輸、軟件和信息技術服務業的企業。制造業企業國標指數穩定且占比高。
這份《報告》涉及的“行業標準”范圍主要有:機械、電子、郵電通信、化工、農業、輕工、能源、認證認可等63個在國家標準化管理委員會備案并發布的“行業標準”;發布時間在2001—2015年,出版時間截至2017年10月,數量約為5.5萬項行業標準和4.4萬家起草單位。
從行業標準研制貢獻指數來看,行業標準研制的參與度顯著提升。數據顯示:2015年,行標指數為11088.2,行業標準發布數量4599項,行業標準起草單位數量8705家。2001—2015年,行業標準發布數量年均增長7.4%,起草單位數量年均增長11.9%,平均每個標準起草單位的數量從2001 年的2.1 逐步上升到2015 年的4.4,增長率達到110%。
通過集中度分析得出:2015 年,行業標準研制集中度高,前5%的435 家起草單位貢獻45%,主要由企業和研究院所組成。其中,研究院所的行標指數占比達39.8%,企業起草單位的數量占比達41.5%。行標指數排名前十的核心力量呈現出研究院所、企業、政府機關并重的局面。在行標指數排名前435家的單位中,北京占比最高,達29.3%,之后依次是廣東、江蘇、上海、浙江。
此外,2001—2015年,行業標準研制貢獻集中度呈現如下趨勢。整體上,前5%的起草單位研制貢獻占比在增長;地區分布上,前5%的起草單位在北京數量占比在降低;類別上,前5%的起草單位中,研究院所數量和行標指數的占比整體下降,企業數量和行標指數的占比整體在上升。
相對于2014 年,2015 年行業標準起草單位地域分布更加集中,北京市行標指數和主導行業標準研制數量的全國占比呈現上升趨勢,而廣東、浙江、江蘇、上海、山東五省市行標指數之和與主導行業標準研制數量之和,均呈現下降趨勢。2015年與北京市相比,這五省市在起草單位數量和研制行標數量上差距較小,但需進一步提升研制行業標準主導程度。
2015年,企業是行業標準研制貢獻的主要力量,其行標指數和起草單位數量占比均接近或超過50%。研究院所與政府機關對行業標準研制引領作用明顯,以合計27.2%的行業標準起草單位占比,主導了54.8%的行業標準研制。2001—2015年,企業主導行業標準數量與研究院所主導行業標準數量相比,增長趨勢明顯,并且在2012年首次超過研究院所,之后持續高于研究院所。
由于2015年企業“行標指數”占比最高,《報告》特別就企業研制“行業標準”情況進行專題分析。2015 年,北京、廣東、浙江、江蘇四省市的企業對行業標準研制貢獻較高,2001—2015年,從全國重點地區企業行標指數分布變化趨勢來看,自2010 年開始,企業大規模開展行業標準研制,之后逐步增長。
另外,2001—2015 年,制造業企業對行業標準研制貢獻最高,其行標指數達到所有企業行標指數的69.9 %,在全行業占比較為平穩。排名第二的是信息傳輸、軟件和信息技術服務業,排名第三的是科學研究和技術服務業。
中國標準化研究院國家標準館信息技術主任甘克勤在談到標準信息服務發展趨勢時表示,標準信息服務肩負著各界的期待,大眾期待標準要生動并貼近生活;行業用戶期待能隨時隨地呈現出準確的標準內容,免去查找煩惱;決策者期待標準滿足市場監管需要,挖掘決策依據。
大數據是突破計算機和科學范疇的行業概念,具體到標準是交叉性學科,是圖書館學科指導業務、標準化學科定義應用場景、計算機學科突破技術瓶頸。
標準化學科如何定義應用場景?在生產領域里標準是文件,流通領域里標準是語言、說明產品特性和功能,各級貿易里標準是調節手段和進攻戰略,所以標準代表著質量的高低。標準信息化服務應該是把標準和質量的關系顯著地表達出來。如何用標準表達質量、評價質量是標準應用場景之一。另外,標準的應用情況有評價標準化工作成效的應用場景。
到目前為止,計算機與大數據已經突破了傳統計算機理念,但是計算機科學仍然非常重要,它突破了兩個技術瓶頸,一是高效計算、二是機器學習。基于數據率的查詢大家都會用到,但是當數據量達到萬百級時,查詢效率就是問題,這時就需要大數據的檢索技術,如Solx Lucene等,另外對于非結構化的信息研判,比如標準的分類,主題詞乃至指標的抽取,還需要機器學習的應用。
而有了交叉學科的概念,也就有了以下業務路線。簡單來說就是:定位需求痛點,比如評價質量、評價標準化工作成效。還有補足資源短板,包括單位信息、商品信息、指標信息。現在國家標準館已通過大數據研究補足了單位信息,接下來會補全商品信息和指標信息。
此外,應用AI技術針對專題檢索報告形成的情報產品,解決了需求痛點。但現在這項業務路線也在轉型。目前,大部分標準信息從業者都能夠做好傳統服務,但增值服務才是未來發展方向。需要通過數據服務、專題服務、情報服務、標準解決方案來形成增值服務,最后達到持續效益。
標準信息服務發展趨勢的新技術線路,就是要在深度上挖掘出標準化對象和指標,標準化對象要基于詞表和規則,指標要基于AI提升效人工抽取指標效率。另外,在廣度上要把商品和標準進行關聯,讓標準和企業項目新聞、社交、科技文獻等進行關聯,尤其是標準和商品的關聯。
在湖北省標準化與質量研究院主任徐術坤看來,國家層面的大數據應用、大數據戰略可以使國家在發展中有先發的優勢,包括一些政府也成立了大數據局,比如杭州、貴州、浙江、湖北省黃石等地市,說明政府越來越重視大數據在社會經濟中發揮的作用。而企業對于大數據的應用也越來越廣泛,比如百度年度大數據報告、滴滴出行報告等。
他認為,大數據并非只是數量的概念,其實它更是一種思維方法或者技術方式,能為我們解決現實生活中的一些具體問題。如果單純只是把數據管起來,那銀行、稅務、證券行業這些年來的數據規模應該構成大數據了。但事實上,它需要運用一些數量分析、歷史分析來預測一些相關信息,才能真正用起來。標準館里的標準文獻,可以稱得上是大數據,所以我們會采用標準化理論數據及大數據方法來揭示數據內容,以提升標準化水平。