朱躍林 朱萬穎 蔣慧菊 朱竹
摘 要:地理標志產品因其關聯于特定地域的自然與人文因素所形成的特色表現,具有顯著地大數據特征,其知識產權的區域公益性和對貿易日益重大的影響。我國地理標志產品資源豐富,但相關的保護起步較晚,且目前地理標志產品的申報依然處于人工階段所以效率依然低下,迫切要求實現向基于信息化的地理標志產品全業務全流程保護與監管系統的科學轉變,以最大程度地保護我國地理標志產品。該文將對地理標志產品保護與監管系統在大數據環境下對地理標志產品的申報所產生的影響進行討論。
關鍵詞:地理標志產品 大數據 申報流程
中圖分類號:P208 文獻標識碼:A 文章編號:1674-098X(2016)02(b)-0080-02
文章將基于地理標志產品申報全業務全流程的專業知識,主要是針對地理標志產品保護申請流程,結合大數據相關數據挖掘、分析處理等手段,對地理標志產品保護與監管系統在大數據環境下就數據采集、分類、匯總等方面進行分析。
1 地理標志產品
地理標志產品指產自特定地域,所具有的質量、聲譽或其他特性取決于該產地的自然因素和人文因素,經審核批準以地理名稱進行命名的產品。
2 大數據環境
2.1 大數據
大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理的龐大的數據集合。大數據的5 V特點(IBM提出)分別為:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)Veracity(真實性)。
2.2 數據挖掘
大數據有著量大、多變、復雜等特點。所以要在這龐大的數據中尋找到隱藏的、有用的資料十分困難。而大數據的潛在價值主要表現在數據與數據之間的關聯性。所以需要通過數據挖掘等方式來獲取合理、有用的數據。
2.3 地理標志產品數據定義
根據數據的來源與數據的應用領域進行界定,可以把地理標志產品數據定義為:(1)地理標志產品保護申請信息數據;(2)地理標志保護產品專用標志使用申請信息數據。
2.4 地理標志產品數據分類
地理標志產品大數據按其數據結構可分為:結構化數據、半結構化數據和無結構化數據。
文本數據按來源及收集方式可以分為:顯示數據、系統數據。顯示數據是指由用戶主動輸入或者輸出用于顯示的數據。系統數據是指系統自動生成的數據,主要為申請信息數據在工作流程中階段狀態、受理公告、批準公告、核準公告。數據類型圖見圖1。
3 地理標志產品保護與監管系統對申報流程的影響
3.1 數據來源
系統中的數據分為兩類:地理標志產品保護申請信息數據、地理標志保護產品專用標志使用申請信息數據(因此文主要分析對象為地理標志產品保護申請流程,故地理標志保護產品專用標志使用申請信息數據暫不考慮)。來源為有申請者輸入的文本數據。
地理標志產品保護申請信息數據中文本數據主要包括:產品名稱、產品類別、產地范圍、產地地理特征、產品的理化感官等質量特色、產地的自然因素和人文因素、產品生產技術規范、產品知名度、銷售情況、歷史淵源說明。
3.2 地理標志產品保護申請工作流程整理
由現有地理標志產品保護申請流程可知,申請流程主要分為申請、初審、形式審查、公示、技術審查、批準6個階段。通過集成大量的地理標志產品保護申請信息數據,經過數據匯總、合并、過濾、解析,將收集的大量的數據整理成便于系統使用結構化數據、半結構化數據和非結構化數據。如設定統一的申請號、受理號、批準號格式,確定文本的長度及內容限制、擬定附件的格式限制。
3.3 數據挖掘與分析
在大數據環境下,利用數據挖掘方式,獲取地理標志產品保護申請流程中在初審階段、形式審查階段、技術審查階段中被打回的數據的原因。通過建立數學模型進行數據分析,總結出易犯錯誤及優質的申報機構。
3.3.1 總結出易犯錯誤
設定在地理標志產品申報過程中因各種原因需補正或整改材料被打回或是不予受理的總次數為x,因某種原因需補正或整改材料被打回或是不予受理的總次數yn,n=1,2,3,4,...,m,每個數字對應一種錯誤,即y1代表的是因產品名稱不符合規范這一錯誤而被打回的總次數,m為錯誤種類最大數。
根據數值偏差算法:偏差值p=yn-x/m;可得知p值區間為(-∞,+∞),經總結可發現如下規律:(1)數值偏向+∞時,代表這一類錯誤經常出現,需要注意。(2)數值偏向0時,代表這一類錯誤也會出現,但是出現的頻率不高。(3)數值偏向-∞時,代表這一類錯誤只是很少或偶爾出現。由以上結論可以得知何種錯誤屬于易犯錯誤,可在申報之初就提醒申報者注意,以減少犯錯的可能性。
3.3.2 篩選優質的申報機構
與1中所述同理,設定在地理標志產品申報過程中因各種原因需補正或整改材料被打回或是不予受理的總次數為x,設定省局初審通過后,在形式審查階段和技術審查階段因需補正或整改材料被打回或是不予受理的總次數為sj,其中j=1,2,3,4,...,k,每個數字對應省級質量技術監督部門或出入境檢驗檢疫部門,在此便不一一列舉贅述了。k代表所有省級部門總數。
根據數值偏差算法:偏差值q=sj-x/k,可得知q值區間為(-∞,+∞),經總結可發現如下規律:(1)數值偏向+∞時,代表該機構初審通過后的地理標志產品申報信息任然存在較多問題,可提醒該機構加強初審力度。(2)數值偏向0時,代表該機構初審通過后的地理標志產品申報信息任然存在部分問題,需要注意。(3)數值偏向-∞時,代表該機構初審通過后的地理標志產品申報信息任然存在較少問題,可將該機構列為優質上報機構。
4 分析及優勢總結
在大數據環境下地理標志產品保護與監管系統對依然處于傳統人工階的段標志產品的申報流程將起到極大的促進作用,可加快地理標志產品申報流程,加速我國對地理標志產品保護的步伐。且由于大數據分析后可以得出在申報的過程容易出現的錯誤,在申報初期提示申報機構,以避免人力和時間的浪費。而一些被篩選出的優質申報機構,可向社會公布供選擇,也可對一些存在較大問題的申報機構給予有針對性的干預措施。
(致謝:該項目受到質檢公益性行業科研專項項目《質檢行業大數據關鍵技術研究及典型應用示范》的資助。)
參考文獻
[1] 佚名.地理標志產品[J].China Fruit News,2008, 25(1).
[2] 佚名.地理標志產品保護[J].中國蔬菜,2008,1(1):8.
[3] 宋軍,暴志軍.地理標志產品保護[J].品牌與標準化, 2009(10):44-45.