摘 要: 隨著智能移動通信和物聯(lián)網(wǎng)技術(shù)的快速進步,各種數(shù)據(jù)采集及處理逐步從PC端向移動端轉(zhuǎn)移。以Android系統(tǒng)的移動終端做平臺,進行圖像數(shù)據(jù)采集及處理,對于有聲可定位圖像采集方法是集語音、圖像及基本信息(包括時間、地點、屬性、圖片大小等)為一體的多元素數(shù)據(jù)采集方法,圖像儲存文件類型為EXIF格式,以鍵值的方式進行圖像文件數(shù)據(jù)存儲。研究內(nèi)容相對PC端的圖像采集不僅方便快捷,又能全面的進行非文字型數(shù)據(jù)記錄,應(yīng)用范圍廣。
關(guān)鍵詞: 移動終端; 有聲可定位圖像; EXIF格式; 多元素數(shù)據(jù); Android平臺
中圖分類號: TN911.73?34 文獻標識碼: A 文章編號: 1004?373X(2016)19?0053?03
Abstract: With the rapid advances of the intelligent mobile communication and Internet of Things technology, a variety of data acquisition and processing are transferred from the PC terminal to mobile terminal. In this paper, the mobile terminal of Android system is taken as the platform for image data acquisition and processing. The multi?element data acquisition method combining voice, image and basic information (time, place, attribute, picture size, etc) is used to acquire the voice locatable image. The image storage file type is EXIF format, and the image file data is stored in the key value mode. In comparison with the method of image acquisition at PC terminal, the method studied in this paper is more convenient and efficient, can record the non?text data comprehensively, and has wider application range.
Keywords: mobile terminal; voice locatable image; EXIF format; multi?element data; Android platform
0 引 言
Android系統(tǒng)是基于Linux的自由及開放源代碼的操作系統(tǒng),Android操作系統(tǒng)就是對Linux內(nèi)核、Linux設(shè)備驅(qū)動及Linux初始化過程的移植應(yīng)用。本文以Android移動終端作為平臺也是從其內(nèi)部特性及使用廣度為基礎(chǔ)來選擇的。
有聲可定位圖像采集可以準確、詳細的以圖片或視頻形式進行記錄,而傳統(tǒng)的數(shù)據(jù)采集主要采用圖像要素分離儲存及數(shù)據(jù)庫關(guān)聯(lián)管理的方法,這種采集手段不僅處理過程繁瑣,而且采集后數(shù)據(jù)同步管理困難,容易造成圖像文件關(guān)聯(lián)失敗、信息錯誤等現(xiàn)象。本文的有聲可定位圖像采集是基于Android系統(tǒng)下圖像采樣、IMA?ADPCM編碼及EXIF格式存儲的數(shù)據(jù)采集系統(tǒng),并推廣應(yīng)用于智能移動終端設(shè)備上,實現(xiàn)圖像的快速、便捷、詳細的信息多方位采集[1]。
1 Android平臺的有聲可定位系統(tǒng)模型
1.1 基于Android系統(tǒng)優(yōu)勢分析
Android是以Linux為核心基礎(chǔ)的開源移動終端應(yīng)用軟件平臺。因其開放性高,各軟件開發(fā)企業(yè)或終端設(shè)備制造公司都可以以Android系統(tǒng)為基礎(chǔ)研發(fā)軟件、開發(fā)設(shè)備系統(tǒng)功能[2];Android系統(tǒng)網(wǎng)絡(luò)集成性好,所以對于一些需要網(wǎng)絡(luò)的應(yīng)用或者定位功能的軟件都可以用以終端服務(wù),本文的有聲可定位圖像采集即應(yīng)用了Android系統(tǒng)的GPS定位功能;Android功能擴展非常靈活,不僅可以應(yīng)用在手機產(chǎn)品上,也可以應(yīng)用于多種屏幕式有線、無線終端設(shè)備。
1.2 有聲可定位圖像結(jié)構(gòu)模型
有聲可定位圖像采集方法歸根結(jié)底是屬于數(shù)據(jù)收集與處理的過程,是對移動性的場景或事發(fā)區(qū)域進行綜合性的圖像收集,而大多數(shù)移動性數(shù)據(jù)采集方法采用XML文件對數(shù)據(jù)結(jié)構(gòu)進行掃描,或者像傳統(tǒng)方法的數(shù)據(jù)關(guān)聯(lián)性儲存,這些方法實質(zhì)上都是將收集的數(shù)據(jù)通過關(guān)聯(lián)處理后再進行有層次的分離并儲存,因此這種數(shù)據(jù)收集方法在調(diào)用該數(shù)據(jù)時會出現(xiàn)調(diào)用數(shù)據(jù)緩慢,調(diào)用數(shù)據(jù)信息不同步或者錯亂等現(xiàn)象,并且這種存儲方法也不利于數(shù)據(jù)的組織管理。通過對傳統(tǒng)數(shù)據(jù)采集方法的分析,提出了圖像信息可以綜合性儲存調(diào)用的方式即有聲可定位圖像采集方法,有聲可定位采集方法彌補了傳統(tǒng)方法的缺陷,使采集的圖像數(shù)據(jù)更加全面,調(diào)用更加快捷、準確、靈活。有聲可定位圖像模型由圖像、圖像元數(shù)據(jù)、圖像屬性和圖像空間信息四部分組成[3?4]。
如圖1所示,圖像及圖像元數(shù)據(jù)屬于圖像采集的骨架,即基本信息,比如圖像分辨率、焦距大小、曝光度、光圈等級參數(shù)等,而圖像屬性及圖像空間信息就屬于高級信息,也屬于有聲可定位圖像采集的特有信息,主要包括圖像數(shù)據(jù)數(shù)值、場景語音植入、拍攝方位及GPS位置信息等。
有聲可定位數(shù)據(jù)采集方法在數(shù)據(jù)處理上采用EXIF格式(可交換圖像文件格式)處理儲存,EXIF圖像格式是一種專門為數(shù)碼相機拍攝而制作的圖像文件,在數(shù)據(jù)記錄及處理存儲方面完全符合有聲可定位圖像采集,EXIF文件的儲存格式遵從JPEG標準,JPEG格式是常用的圖片存儲格式,所有的JPEG文件以字符0xFFD8開頭,并以字符串0xFFD9結(jié)束。文件頭中有一系列0xFF_格式的字符串,稱為JPEG標識或JPEG段,用來標記JPEG文件的信息段。0xFFD8表示圖像信息開始,0xFFD9表示圖像信息結(jié)束,這兩個標識后面沒有信息,而在中間的字符段中的其他標識緊跟一些信息字符,用來存儲各種與圖像相關(guān)的信息[5?6]。所以用EXIF處理儲存的圖像可讀性高,適用范圍廣,而EXIF文件處理就是在JPEG文件的頭部根植所謂的高級信息,JPEG格式的文件結(jié)構(gòu)的頭部是APP1?APPn標識段,而APP1標識段通常默認開啟,其段內(nèi)信息包括IFH,IFD及縮略圖3部分,而其余APP段信息屬于寫入信息,可以用來儲存音頻、方位、GPS等數(shù)據(jù),開啟后可以根據(jù)需要開發(fā)使用,本文應(yīng)用APP2標識段存儲音頻信息,以0xFFE2字符段開始標識,字符段內(nèi)前兩個字符用于區(qū)分標識信息,后6個字符用來存儲語音信息[7]。為了避免標識段重復,用APP3標識段記錄位置信息,而每個標識段的文件儲存大小為64 KB,相同標識段可以多次建立儲存,因此有聲可定位數(shù)據(jù)處理需要用到APP1段內(nèi)的信息及APP2,APP3段內(nèi)的附加信息,圖2為EXIF圖像結(jié)構(gòu)及標識段應(yīng)用。
2 基于Android平臺的有聲可定位圖像采集過程
2.1 圖像采集總體設(shè)計
在Android系統(tǒng)的終端平臺上,有聲可定位圖像采集主要應(yīng)用攝像機、麥克風、GPS及電子羅盤等的硬件設(shè)備,通過攝像機獲取現(xiàn)場圖像,并將其作為基礎(chǔ),此時GPS及電子羅盤開始定位讀寫位置信息,GPS通過衛(wèi)星定位解析拍攝地點的經(jīng)緯度及地理名稱,電子羅盤獲取鏡頭拍攝的方位信息(方向角、俯仰角和翻轉(zhuǎn)角)[8],將記錄信息寫入載體(即以圖像為主的基本信息),麥克風通過錄入功能將獲取的語音文件進行編碼,存儲到EXIF的APP2標識段中,再經(jīng)Android SDK功能和定義好的EXIF綜合存儲過程進行兼容性匹配,生成JPEG格式的有聲可定位圖像文件。
2.2 綜合數(shù)據(jù)融合過程
以攝像機采集的圖像作為載體,將其他采集的數(shù)據(jù)有順序的錄入到圖像編碼器中。而位置信息及時間方位信息的數(shù)據(jù)錄入相對簡單,并且現(xiàn)在的智能終端設(shè)備都已經(jīng)得到應(yīng)用,相對于位置、時間、空間等信息,語音信息的寫入過程比較復雜,因為移動終端內(nèi)存存儲有限,而語音信息文件又比較大,對于一些無線終端設(shè)備,語音模塊的融合將直接影響到有聲可定位圖像的利用率及傳輸效率,所以就想到語音文件的壓縮再處理,在數(shù)據(jù)壓縮處理時,考慮用香濃?范諾編碼,這種壓縮算法又叫無損壓縮算法,在本課題中應(yīng)用這種算法可以將音頻信息無損壓縮,在調(diào)用時經(jīng)解碼還原,可以達到錄入時的音頻效果,但最大的問題是壓縮還原過程中耗費時間,不能起到快捷方便的調(diào)用效果[9?10]。考慮到EXIF格式中有IMA?ADPCM語音編程算法,可以將采集的語音信息進行數(shù)據(jù)壓縮,IMA?ADPCM語音編碼雖然是一種有損壓縮算法,但本文有聲可定位圖像采集對語音模塊的音質(zhì)效果要求不是很高,所以有損壓縮算法可以滿足對語音模塊的需要。
語音數(shù)據(jù)的采集融合過程就是將采集后的無壓縮語音信息進行量化,形成PCM數(shù)據(jù),通過IMA?ADPCM編碼器將PCM數(shù)據(jù)壓縮得到壓縮數(shù)據(jù),再根據(jù)自定義好的APP2段進行編碼儲存,經(jīng)EXIF格式系統(tǒng)性融合,就形成了有聲圖像。整個有聲可定位圖像采集流程圖,如圖3所示。獲取音頻文件并設(shè)置采樣頻率、聲道、采樣倍數(shù)、緩沖區(qū)等基本參數(shù),建立元文件,調(diào)用麥克風采集語音,對語音文件量化處理形成PCM數(shù)據(jù)儲存,調(diào)用EXIF模塊的IMA?ADPCM編碼對儲存PCM數(shù)據(jù)壓縮,生成IMA?ADPCM編碼數(shù)據(jù),由于APP2標識段內(nèi)存的限制,所以應(yīng)用程序判斷語句判斷IMA?ADPCM編碼數(shù)據(jù)是否大于64 KB,若大于64 KB,則EXIF可創(chuàng)建多個APP2標識段進行語音文件儲存。
3 基于Android系統(tǒng)的圖像采集實現(xiàn)
3.1 有聲可定位圖像采集系統(tǒng)和移動終端平臺的結(jié)合
有聲可定位圖像采集設(shè)計完成,需要在智能終端設(shè)備上實現(xiàn),首先以該設(shè)計作為系統(tǒng)軟件,以APP形式植入Android系統(tǒng)中,以Android為平臺,實現(xiàn)有聲可定位圖像的采集、儲存、調(diào)用。在這個APP軟件中主要模塊是有聲可定位圖像采集、無線傳輸、查詢?yōu)g覽模塊。
用戶啟用APP進入圖像采集界面,而這個采集界面和其他普通圖像采集無太大區(qū)別,如圖4(a)所示,在進行圖像采集過程中,拍攝位置及拍攝方位會自動寫入有聲可定位圖像中,而此時語音信息以錄制原文件的形式暫存入移動終端內(nèi)存中。當用戶拍攝結(jié)束時,圖像采集界面自動跳轉(zhuǎn)到語音描述界面,如果用戶不需要語音文件,則此界面可直接跳過,而語音文件也會消失,形成可定位普通圖像。若用戶需要語音信息,則在此界面開啟語音錄入功能,就可以形成有聲可定位圖像。當用戶調(diào)用圖像時,可以點擊圖像瀏覽界面標識,有聲可定位圖像采集系統(tǒng)會自動提取當前圖像的位置、方位信息及語音信息。
3.2 圖像采集系統(tǒng)數(shù)據(jù)信息準確性驗證
有聲可定位圖像采集系統(tǒng)的各種錄入信息要準確,而這些圖像信息需要驗證的就是EXIF圖像格式內(nèi)部標識段的完整性,本文驗證方式采用十六進制查看器對其數(shù)據(jù)的完整性、正確性進行驗證,通過數(shù)據(jù)解析,驗證EXIF數(shù)據(jù)結(jié)構(gòu)的完整性及關(guān)聯(lián)穩(wěn)定性,圖像驗證從0xFFD8開始,接著驗證APP1標識段內(nèi)的圖像信息、圖像分辨率、焦距大小、曝光度、光圈等級等基本參數(shù)信息。圖4(b)是有聲可定位圖像查看的基本信息界面。然后驗證APP2段內(nèi)的語音信息,在驗證語音信息時,查看器只能對壓縮后的語音數(shù)據(jù)進行檢驗,所以在語音驗證環(huán)節(jié),需要人為的檢驗音頻文件是否清晰。接著就是驗證APP3段內(nèi)的拍攝位置、地點坐標及名稱信息。這樣,整個有聲可定位圖像采集文件就驗證完成。
4 結(jié) 語
本文提出一種集綜合圖像、語音、地理位置及屬性信息多元結(jié)構(gòu)于一體的新型有聲可定位圖像系統(tǒng)模型,將此系統(tǒng)植入到基于Android平臺的移動終端設(shè)備中,通過圖像數(shù)據(jù)采集、EXIF圖像格式處理、IMA?ADPCM編碼壓縮,最后融合儲存成JPEG格式的圖像文件。基于Android平臺的移動終端系統(tǒng)可以成功地實現(xiàn)有聲可定位圖像采集,而這種圖像形式不僅可以應(yīng)用到科技探索、人文研究、自然災(zāi)害等大型應(yīng)用中,也可以在人們?nèi)粘I钪袘?yīng)用。像監(jiān)控、旅游拍攝、公路攝像等。而且這種有聲可定位圖像采集通過驗證功能,增加了采集系統(tǒng)的精確性和穩(wěn)定性,有聲可定位圖像采集系統(tǒng)能正確地反映拍攝地點的綜合性信息,做到了完全的場景空間還原,為應(yīng)用者提供了豐富的數(shù)據(jù)源,簡化了數(shù)據(jù)采集、處理及儲存的過程,大大提高了采集調(diào)用的效率。
參考文獻
[1] 王偉,張禮中,蔡子昭,等.城市環(huán)境地質(zhì)野外調(diào)查數(shù)據(jù)信息化采集[C]//2010年城市地質(zhì)環(huán)境與可持續(xù)發(fā)展論壇論文集.上海:中國工程院土木、水利與建筑工程學部,2010:551?555.
[2] SHAHIDUZZAMAN M M, NAZNIN M, RAHMAN A A U. Portable and secure multimedia data transfer in mobile phones using record management store [C]// Proceedings of 2010 IEEE International Conference on Computer Science and 1nformation Technology. Chengdu, China: IEEE, 2010: 364?367.
[3] 范忠誠,鄭慧,幸剛鴻,等.基于Android系統(tǒng)的校園手機定位與信息采集平臺的開發(fā)[J].科技信息,2013(20):255.
[4] 李文闖,章永平,潘瑜春.移動地理信息系統(tǒng)中的多源異構(gòu)數(shù)據(jù)融合模型[J].計算機應(yīng)用,2012(9):2672?2678.
[5] 張濤,張建軍,郭波.基于使用可用度的k/N系統(tǒng)(m,N_G)維修策略分析[J].宇航學報,2009,30(1):395?401.
[6] 張鼎周,包雷,錢存華.基于共因失效的層次表決系統(tǒng)可靠勝分析與維護策略[C]//中國運籌學會可靠性分會第八屆可靠性學術(shù)會議論文集.南京:中國運籌學會,2009:170?178.
[7] 吳勇,羅騰元,王美珍.可定位圖像采集與檢索方法研究[J].計算機工程,2014(7):207?211.
[8] 李屏.GIS在中學生地理空間思維能力培養(yǎng)中的應(yīng)用[D].福州:福建師范大學,2015.
[9] 周園春,胡良霖 ,沈志宏,等.基于PDA的野外科考數(shù)據(jù)采集系統(tǒng)及其應(yīng)用[J].科研信息化技術(shù)與應(yīng)用,2008(1):76?82.
[10] 陳彬,陳建平,馬克平,等.攝影定位法野外生物考察與數(shù)據(jù)管理[J].科研信息化技術(shù)與應(yīng)用,2011(5):81?89.