王宇
(眉山職業技術學院,四川眉山620010)
基于大數據分析的茶葉質量評估
王宇
(眉山職業技術學院,四川眉山620010)
茶葉是我國的特色產業,已經成為家家戶戶日常飲用和待客過程中不可或缺的重要物品。茶葉質量既關系到人們飲茶的口感,也關系到我國的食品健康安全,更關系到茶葉生產商的品牌形象和信譽。近年來,隨著市場競爭的加劇,質量已經成為各大品牌商獲得市場空間的前提和保障。本文以大數據分析為平臺,對網絡背景下的茶葉種植狀況和生產情況進行評估,從而對茶葉種植和生產流程進行控制,并對我國茶葉種植和生產過程中的不足進行彌補,為人們提供優質茶源,為茶葉生產提供良好的物質保障,提升我國茶葉的國際知名度和市場競爭力。
大數據分析;茶葉質量評估;云計算;數據網絡
茶葉是我國的一大傳統型產業,其既關系到茶加工企業的生存和發展,又關系到與茶相關的邊緣產品的開發和生產。茶葉的產量和質量決定了我國茶葉市場的發展動向。但是,氣候條件、環境條件和生態條件的不穩定性,使我國茶葉在生產和開發過程中存在諸多問題。茶葉質量是茶葉加工企業獲得市場空間的基礎,也是人們享受到綠色茶源的基本前提。政府和相關部門要結合茶葉發展過程中的諸多訴求,對茶葉種植和生產過程進行監測,確保對其種植和生產過程中的每一個環節進行有效的把控,進而充分發揮我國茶產業的市場潛力。但是,依托于傳統的茶葉種植和生產方式對茶葉進行人工現場采樣、評估和監測等,會耗費大量的人力和物力,并且受到外部因素制約,采樣效果比較差,進而影響茶葉的整體質量評估效率。計算機技術和網絡技術的快速發展為茶質量評估提供了廣闊的空間,使茶葉質量評估過程中得以對網絡技術和計算機基礎進行充分應用,進而提升了其質量評估的整體效益。相關人員可以借助網絡技術對天氣、溫度、濕度和病蟲害等不可控信息進行收集和整理,進而結合相關數據對其進行分析和預測,實現大數據背景下,以茶葉種植和生產為基礎的茶葉質量評估,提高我國的茶葉和茶產品供應質量。
茶葉是我國國民經濟發展過程中的重要組成部分,具有豐富的歷史內涵和文化內涵。而茶葉質量又是我國茶產業發展過程中的主要要素。茶葉質量直接關系到人們的飲茶健康和安全。近年來,消費觀念發生了轉變,人們對茶葉質量提出了更高的要求,政府也不斷凈化茶葉市場環境,以確保茶產品質量安全,最大程度維護消費者的利益。茶葉質量關系到茶企業的效益,也關系到國內外消費者對中國茶葉的整體認可度。借助茶葉種植和茶葉生產開發對茶葉質量進行評估,能夠凈化茶葉市場環境,降低人們日常飲茶過程中的安全隱患,推進我國茶產業的快速發展。同時,對茶葉質量進行評估,能夠從根本上推動我國傳統茶葉種植技術的變革,使相關技術人員積極研發新型茶葉種植和開發技術,減少茶葉種植過程中易溶于水的農藥使用量,確保百姓真正喝到放心茶和安心茶。
2.1大數據分析與云計算
茶葉質量評估過程中,大數據分析的應用原理是借助非結構化和無規律性的數據篩選,對有效的茶葉數據信息進行提取,將其廣泛應用到茶葉種植、生產和銷售等各個環節,進而提升我國茶葉產業的整體發展效益。大數據分析并不是對茶葉質量評估過程中的相關數據進行隨機抽取,而是對所有數據進行全面分析。因此,在大數據背景下,對茶葉質量進行評估,可以不受采集過程中主觀采集方式和樣本等因素的影響,從根本上提升了數據分析結果的準確性。近年來,隨著數據分析在茶葉質量評估過程中的廣泛應用,出現了越來越多的分析方式。例如,谷歌公司通過借助互聯網對網絡環境背景下的流感數據進行分析,進而應用聚合方式對流感發展情況進行預測,提升了數據分析的準確性。同理,借助大數據分析技術對網絡上的茶葉信息進行整合,并結合茶企業本身的發展特色,選擇合理的茶葉質量分析方式,對茶葉質量進行評估和預測。
云計算是一種分布式平行計算方法,其能夠同時對多種數據信息進行處理,并確保數據的處理效率和質量。在茶葉質量評估過程中,應用云計算,能夠提升茶葉質量分析速度和計算效率,降低茶葉質量評估過程中的成本。云計算的開發平臺和應用過程都比較簡單,并且具有容錯性和節點擴充方面的優勢。
2.2平臺設計框架
在云計算背景下進行大數據處理,能夠借助網絡對茶葉質量評估中涉及到的相關要素進行分析和處理,并實現數據的導入和導出。其主要特點表現在以下幾個方面。首先,其借助Hadoop進行存儲,并將其作為存儲中心,通過多個數據源對相關數據進行讀取。其次,借助流分析技術實現各種實時數據的分析和處理。第三,對經過處理的數據進行導出操作,并將相關數據庫作為其導出對象。第四,實現茶葉質量評估過程中,不同數據類型的協同分析,進而提供有用的茶葉質量評估信息。
大數據平臺主要包括數據層、數據處理層和管理層。數據層主要是以流的形式,將茶葉質量評估過程中涉及到的相關數據發送到數據處理層。數據處理層是在云計算平臺背景下,對數據層傳入的數據流進行分析和處理。管理層主要是將茶葉質量評估中的相關數據進行管理,進而將其處理結果傳送給終端客戶。以DAP為平臺,對不同茶葉質量評估方法進行考慮和應用,進而借助相關技術支持,對茶葉質量評估相關執行方案進行確定,從而以大數據分析為依托,進行茶葉質量的評估和預測。
3.1數據層
數據層涵蓋的工作內容和要素比較多。其主要在茶葉質量評估中對茶葉種植和生產過程中涉及到的相關數據進行采集和篩選,并借助互聯網平臺,對茶葉的相關過濾和提取數據執行情況進行監控。應用Hadoop分布式文件系統對處理過的茶葉數據信息進行存儲。以云計算為背景,數據層能夠實現網絡茶葉數據資源的快速采集、整理和更改,進而提高茶葉質量評估過程中的數據處理質量和效率,并且操作過程也比較簡單。
在大數據背景下對相關茶葉信息采集和分析,一般會對茶葉種植過程中涉及到的環境和生態等相關要素進行提取。茶葉種植過程中,影響茶葉質量的因素包括自然環境、土壤、大氣環境、氣候和工藝流程等。部分茶葉產地含有重金屬,其會對茶葉造成污染,同時,氣候變暖為病蟲害提供了生長空間,進而影響茶葉的種植質量和產量。在茶葉種植過程中,要嚴格遵循正確的種植流程和標準,對茶葉種植過程中的不利因素進行控制,最大程度避免氣候問題和病蟲害問題的影響,降低茶葉種植效益。利用計算機技術和網絡平臺,對茶葉種植過程中的相關影響要素進行收集和分析,進而借助數據分析平臺對相關數據進行采集、過濾和存儲。再加上茶企業往年發展過程中的茶葉質量評估經驗,對茶葉種植和生產過程中的質量進行全面控制,從而凈化茶葉市場,為人們供應優質茶葉和茶源,推進我國茶文化傳播和茶產業的快速發展。
3.2數據處理層
數據處理層主要是對經過數據層處理之后的相關茶葉數據進行分析,進而最大程度確保茶葉質量評估的準確性和合理性。筆者以關聯模型作為茶葉質量評估過程中的核心技術,進行相關操作。
將不同時間和地點背景下的相關氣象生態信息數據向量用X進行假設而茶葉質量數據用向量Y進行假設。其中,(X,Y)=X∪Y,任意向量M?(X,Y),其中Supp(M)=Count(M)為M支持度,在向量集合{(X,Y)}中,M的出現次數用Count(M)表示;針對任意向量,我們將Xi→Yi的關聯可信度定義為Conf(Xi→Yi)/Supp(Xi);將可信度閾值設為λ,將關聯規則集合定義為{Xk→Yk}={Xk,Yk},whereConf(Xk→Yk)≥λ。該模型的執行流程為:
首先,借助數據層對各種數據向量集進行過濾分析。
其次,將閾值設置為λ,計算規則集合為{Xk,Yk},其中{Xk}為條件集合。
第三,將當前需要評估的條件數據設定為X,需要對X與集合{Xk}各個向量的Jaccard相似度進行計算,并對Xm的條件向量進行計算。
該計算模型是在MaoReduce和Hadoop框架云計算背景下,通過并行處理技術對茶葉種植和生產過程中的成本進行降低,進而確保在單個節點背景下對相關數據進行處理。
3.3管理層
大數據分析背景下的茶葉質量評估是通過SOA思想設計而成的。面向茶葉質量評估過程中的需要對有關數據進行增加和刪除。前臺頁面是借助HTML完成相關設計工作的,其能夠確保與移動設備之間的互動和訪問,通過借助大數據工作流思路對相關數據信息進行挖掘。進而縮短分析過程和數據結果導入時間,提升茶葉質量評估效率。同時,該模式背景下,也為移動終端交互提供了相應的支持,以確保對茶葉種植過程中的相關信息進行快速而準確的獲得,從而提升茶葉的整體種植和生產效益。
大數據平臺的應用改變了我國傳統的粗放型茶葉種植和生產模式,很大程度上提高了茶葉種植效率和市場效益。其能夠通過對相關信息數據技術的應用,提升茶葉種植過程中的可預測性。傳統茶葉監測方式比較落后,其監測過程中受到諸多因素的限制,很難確保整體監測質量和效率。大數據背景下的質量監測平臺是網絡時代背景下我國茶葉種植和茶產業發展過程中的必然。當前,我國在茶葉質量評估層面已經取得了相應的技術成就,相關科研機構和部門要結合我國茶葉種植和發展狀況,提升茶葉質量評估過程中的技術性和先進性,促進我國茶產業的健康快速發展。
[1]何曉葉,李建科,趙偉,劉潤,張琳,孔祥虹.化學指紋圖譜技術在茶葉質量控制中的應用[J].食品科學技術學報,2015(1):49-54.
[2]周峰,馮小萍.基于大數據分析的茶葉質量評估[J].現代工業經濟和信息化,2015(9):92-93+104.
[3]劉英,吳曙光,尹州,吳廣紅,曹麗芬.指紋圖譜技術在茶葉研究上的應用[J].茶葉科學,2013(1):13-20.
[4]劉新,張穎彬,潘蓉,王國慶,汪慶華,金壽珍,魯成銀.我國茶葉加工過程的質量安全問題及對策[J].食品科學技術學報,2014(2):16-19.
[5]孫慶磊,楊秀芳,王盈峰,鄒新武,張士康.基于數據統計分析的我國茶葉質量安全狀況調查[J].中國茶葉加工,2012(2):4-8.
王宇(1982-),女,四川眉山人,研究生,講師,研究方向:計算機、課程與教學論、計算機輔助教學與管理。