田紅梅 周皎 袁志杰 曲楨
摘? ?要:現如今我們的計算機技術得到了顯著的發展,在大數據以及人工智能技術的應用下,計算機已經能夠對視覺識別的方法進行有效而又深度的學習。面對海量的數據處理人工處理的方式費時費力,而計算機處理卻往往能夠做到事半功倍。然而現如今即使有了大數據以及人工智能技術的應用,但當面臨巨大的信息數據時,計算機的深度學習功能也很難發揮其效用。計算機在對信息進行深度學習的識別過程中,難免會因為程序的偏差而導致數據識別的錯誤,從而讓計算機所作出的處理結果與實際結果產生偏差。在這種情況下,基于Python的訓練集數據標注修改方法能夠發揮很大的效用,通過Python語言進行標注能夠高效、穩定的識別出數據,其具有廣闊的應用前景。本文便淺析基于Python的訓練集數據標注修改方法研究。
關鍵詞:標注修改? Python? 深度學習
中圖分類號:TP311? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2020)02(a)-0208-02
隨著時代的不斷發展,現如今計算機技術已經覆蓋了我們生活的方方面面。在大數據以及人工智能的應用下,計算機已經能夠進行深入學習,并且具備了一定的數據處理能力。但是當面臨海量信息的處理時,現有的計算機技術還有一個學習提高的過程。建立完善訓練集數據是為了幫助計算能夠更好的識別事物,引導計算機能夠更加精確的識別事物的手段。通過訓練集數據能夠讓計算機在反復識別匯總,提升識別的效率精度,做到更加有效的標注。而在計算機識別的過程當中在深度學習的起步階段,容易造成數據識別的錯誤,利用標注軟件進行編寫能夠糾正計算機的這種錯誤。基于Python的訓練集數據標注修改方法是一種穩定的語言標注軟件編寫方法,能夠給計算機深度學習帶來準確的標注數據。
1? Python概述
Python是一種跨平臺的語言程序,現如今被廣泛應用在人工智能、軟件開發、游戲開發和互聯網開發當中。隨著近些年,Python版本的優化升級,已經有越來越多的用戶選擇使用Python。相較于其他語言而言Python語言更加簡潔,語言學習周期短,其能具備更拓展性。在Python設計之初,設計者就秉持著“優雅”、“明確”、“簡單”的設計理念。Python語言具有眾多的有點,其擁有同C++語言一樣的可移植性能,但是邏輯構成上要比C++語言簡單,這就造成其學習周期要明顯快于C++語言。簡單易學是Python的主要特征,作為使用者閱讀Python程序十分簡單,容易上手。而python另一大特性就是開源,由于開放的源代碼,致使使用者可以隨心所欲的閱讀復制,讓這種資源能夠得到共享,這種免費開源的方式為期吸引了一批忠實的用戶,為Python的壯大發展奠定了基礎。此外,Python運行速度快,因為其底層語言是通過C語言所編寫,因此其兼顧了C語言運行速度快的特性。
2? 各種標注軟件的標注修改方法及其特點
現如今標注修改軟件主要是基于C++與Java進行編寫。C++語言由于語言構成復雜,造成雖然利用C++語言編寫程序能夠具備很高的邏輯性,且語言表達能力較強,但是語言學習周期長,開發時間久。利用C++語言進行宏操作,代碼的可讀性較差。雖然目前在語言的使用上C++語言的使用較為普遍,但是在具體在計算機識別的標注修改方面C++語言所編寫的程序可讀性差,不利于對計算機的識別修改的操控。而另一種較為普遍的語言便是Java,Java是在C++的基礎上發展而來,其保留了C++的許多內容,在語言邏輯上也有部分內容類似于C++。但是在句法構成當中,Java的句法更加簡練清晰,在語言學習當中Java更加容易學習。Java有Swing、SWT和AWT三種工具集。Swing與SWT這種兩種工具集能夠識別圖片與非圖片文件,但是在實際編寫過程當中代碼編寫效率低,且可移植性較差。而AWT工具集因為占用的內存較少,能夠在移動或者嵌入式設備當中發揮加大的優勢。但是在具體的計算機識別的標注修改方面AWT工具集模式不能夠支持圖片,無法為圖片進行修改標注,這就造成了標注識別中的識別問題。最后便是Python語言,它是一種跨平臺的計算機程序設計語言,近些年來隨著Python語言的不斷優化更新,如今的這種語言的使用人數已經呈現出爆發式的增長。將其使用在計算機標注修改中能夠提升計算機深度學習的識別程度,提升識別標注的效率。就其語言自身而言,Python編寫更加方便閱讀、修改與擴展,且具備不亞于C++語言的可移植性能,代碼能夠實現開源。總而言之,基于Python的訓練集數據標注修改方法能夠實現語言編寫的簡單便捷,為計算機的標注修改提供保障。
3? 基于Python的訓練集數據標注修改方法
基于Python的訓練集數據標注修改能夠實現計算機深度學習的識別率,保證計算機識別標注的順利運行。在Python的訓集數據中主要分為初始化、建立主窗口、關節點顯示、按鍵操作與保存圖像幾個步驟。
3.1 初始化
在Python中想要做到初始化,需要使用其中的init函數來進行操作,該函數能夠包含各種關鍵變量。使用者需要通過在清除畫布時將這個函數關節點參數全部清零的方式來設置初始化。
3.2 建立主窗口
主窗口是進行Python語言操作的基礎,因此在使用Python需要先搭建好相應的主窗口,其實Python的默認圖形界面。一般而言,在主窗口的搭建上,通常會采用tkinter模塊來進行搭建。Tkinter庫能夠為搭建主窗口提供更加多樣性的選擇,豐富設計人員的設計需求。
3.3 關節點顯示
關節點的格式在計算機中顯示為json。在關節點中顯示上,圖片可以利用PIL與tkinter模塊來進行表達,這兩個模塊能夠提供更為方便的圖形處理。然而圖片在計算機中表達為bmp,這種格式在tkinter模塊中沒有辦法顯示,因此需要通過Pil模塊加以轉換,在此之后方能夠正常顯示。關節點的顯示是一種非常復雜的工作,需要通過逐步確定json格式的坐標并融入相應算法得以實現。通過json模塊來實現相應數據的讀取,并實現對關節點的模擬,最終通過tkinter模塊對關節點進行繪制。
3.4 按鍵操作
在Python應用中按鍵操作總共分為四個部分,即錄入、返回、清除和撤銷。當標注內容跟我們要求相同時我們直接執行保存錄入操作。如果在操作中,因為設計步驟失誤需要返回上一步,則可以單擊返回。如果在設計過程中,編輯文件整體不符合要求則可以單擊清楚按鈕。如果關節點出現錯誤,需要重新開始操作則可以選擇撤銷。
3.5 保存圖像
當設計進入關鍵步驟或者設計完畢時,可以使用os模塊的save來進行保存。在關節點信息的儲存中,可以通過使用os模塊的open方法,運用W+為其寫入新的json數據。
4? 結語
綜上所述,Python的標注方法相較于其他語言編輯來說具有一定的優勢。近些年來Python使用率呈現出了爆發式的增長,而在實際標注工作中,通過對Python被曝光桂云增加標注的識別度與準確人。基于Python的標注方法,實現了更加直觀的訓練集數據重新標注,讓計算機深度學習的目的得以實現。本文分析了各種標注修改語言之間的特點,并著重介紹了Python在訓練集數據標注中優勢,其能夠簡化編寫的步驟,降低編寫難度低,且在編寫當中擴展性較強,加之開源的模式更加具備開放性與兼容性。通過Python的標注方式讓計算機更加智能,能夠真正實現計算機深度學習的效果。筆者相信,在不久的將來,隨著Python技術的更加成熟,其在訓練集數據標注修改的應用一定會更加優化,未來一定會有更加廣闊的應用價值。
參考文獻
[1] 張文帥.基于Python的農副產品銷售數據分析應用[D].浙江海洋大學,2019.
[2] 劉承林.計算思維培養視角下高中Python課程教學模式研究[D].山東師范大學,2019.
[3] 李建飛.基于Python的代理模型優化平臺設計及應用[D].大連理工大學,2019.