基于Android平臺(tái)的移動(dòng)終端有聲可定位圖像采集方法

2016-04-12 00:00:00劉丹

現(xiàn)代電子技術(shù) 2016年19期

摘要：隨著智能移動(dòng)通信和物聯(lián)網(wǎng)技術(shù)的快速進(jìn)步，各種數(shù)據(jù)采集及處理逐步從PC端向移動(dòng)端轉(zhuǎn)移。以Android系統(tǒng)的移動(dòng)終端做平臺(tái)，進(jìn)行圖像數(shù)據(jù)采集及處理，對(duì)于有聲可定位圖像采集方法是集語(yǔ)音、圖像及基本信息（包括時(shí)間、地點(diǎn)、屬性、圖片大小等）為一體的多元素?cái)?shù)據(jù)采集方法，圖像儲(chǔ)存文件類型為EXIF格式，以鍵值的方式進(jìn)行圖像文件數(shù)據(jù)存儲(chǔ)。研究?jī)?nèi)容相對(duì)PC端的圖像采集不僅方便快捷，又能全面的進(jìn)行非文字型數(shù)據(jù)記錄，應(yīng)用范圍廣。

關(guān)鍵詞：移動(dòng)終端；有聲可定位圖像； EXIF格式；多元素?cái)?shù)據(jù)； Android平臺(tái)

中圖分類號(hào)： TN911.73?34 文獻(xiàn)標(biāo)識(shí)碼： A 文章編號(hào)： 1004?373X（2016）19?0053?03

Abstract： With the rapid advances of the intelligent mobile communication and Internet of Things technology， a variety of data acquisition and processing are transferred from the PC terminal to mobile terminal. In this paper， the mobile terminal of Android system is taken as the platform for image data acquisition and processing. The multi?element data acquisition method combining voice， image and basic information （time， place， attribute， picture size， etc） is used to acquire the voice locatable image. The image storage file type is EXIF format， and the image file data is stored in the key value mode. In comparison with the method of image acquisition at PC terminal， the method studied in this paper is more convenient and efficient， can record the non?text data comprehensively， and has wider application range.

Keywords： mobile terminal； voice locatable image； EXIF format； multi?element data； Android platform

0 引言

Android系統(tǒng)是基于Linux的自由及開(kāi)放源代碼的操作系統(tǒng)，Android操作系統(tǒng)就是對(duì)Linux內(nèi)核、Linux設(shè)備驅(qū)動(dòng)及Linux初始化過(guò)程的移植應(yīng)用。本文以Android移動(dòng)終端作為平臺(tái)也是從其內(nèi)部特性及使用廣度為基礎(chǔ)來(lái)選擇的。

有聲可定位圖像采集可以準(zhǔn)確、詳細(xì)的以圖片或視頻形式進(jìn)行記錄，而傳統(tǒng)的數(shù)據(jù)采集主要采用圖像要素分離儲(chǔ)存及數(shù)據(jù)庫(kù)關(guān)聯(lián)管理的方法，這種采集手段不僅處理過(guò)程繁瑣，而且采集后數(shù)據(jù)同步管理困難，容易造成圖像文件關(guān)聯(lián)失敗、信息錯(cuò)誤等現(xiàn)象。本文的有聲可定位圖像采集是基于Android系統(tǒng)下圖像采樣、IMA?ADPCM編碼及EXIF格式存儲(chǔ)的數(shù)據(jù)采集系統(tǒng)，并推廣應(yīng)用于智能移動(dòng)終端設(shè)備上，實(shí)現(xiàn)圖像的快速、便捷、詳細(xì)的信息多方位采集[1]。

1 Android平臺(tái)的有聲可定位系統(tǒng)模型

1.1 基于Android系統(tǒng)優(yōu)勢(shì)分析

Android是以Linux為核心基礎(chǔ)的開(kāi)源移動(dòng)終端應(yīng)用軟件平臺(tái)。因其開(kāi)放性高，各軟件開(kāi)發(fā)企業(yè)或終端設(shè)備制造公司都可以以Android系統(tǒng)為基礎(chǔ)研發(fā)軟件、開(kāi)發(fā)設(shè)備系統(tǒng)功能[2]；Android系統(tǒng)網(wǎng)絡(luò)集成性好，所以對(duì)于一些需要網(wǎng)絡(luò)的應(yīng)用或者定位功能的軟件都可以用以終端服務(wù)，本文的有聲可定位圖像采集即應(yīng)用了Android系統(tǒng)的GPS定位功能；Android功能擴(kuò)展非常靈活，不僅可以應(yīng)用在手機(jī)產(chǎn)品上，也可以應(yīng)用于多種屏幕式有線、無(wú)線終端設(shè)備。

1.2 有聲可定位圖像結(jié)構(gòu)模型

有聲可定位圖像采集方法歸根結(jié)底是屬于數(shù)據(jù)收集與處理的過(guò)程，是對(duì)移動(dòng)性的場(chǎng)景或事發(fā)區(qū)域進(jìn)行綜合性的圖像收集，而大多數(shù)移動(dòng)性數(shù)據(jù)采集方法采用XML文件對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行掃描，或者像傳統(tǒng)方法的數(shù)據(jù)關(guān)聯(lián)性儲(chǔ)存，這些方法實(shí)質(zhì)上都是將收集的數(shù)據(jù)通過(guò)關(guān)聯(lián)處理后再進(jìn)行有層次的分離并儲(chǔ)存，因此這種數(shù)據(jù)收集方法在調(diào)用該數(shù)據(jù)時(shí)會(huì)出現(xiàn)調(diào)用數(shù)據(jù)緩慢，調(diào)用數(shù)據(jù)信息不同步或者錯(cuò)亂等現(xiàn)象，并且這種存儲(chǔ)方法也不利于數(shù)據(jù)的組織管理。通過(guò)對(duì)傳統(tǒng)數(shù)據(jù)采集方法的分析，提出了圖像信息可以綜合性儲(chǔ)存調(diào)用的方式即有聲可定位圖像采集方法，有聲可定位采集方法彌補(bǔ)了傳統(tǒng)方法的缺陷，使采集的圖像數(shù)據(jù)更加全面，調(diào)用更加快捷、準(zhǔn)確、靈活。有聲可定位圖像模型由圖像、圖像元數(shù)據(jù)、圖像屬性和圖像空間信息四部分組成[3?4]。

如圖1所示，圖像及圖像元數(shù)據(jù)屬于圖像采集的骨架，即基本信息，比如圖像分辨率、焦距大小、曝光度、光圈等級(jí)參數(shù)等，而圖像屬性及圖像空間信息就屬于高級(jí)信息，也屬于有聲可定位圖像采集的特有信息，主要包括圖像數(shù)據(jù)數(shù)值、場(chǎng)景語(yǔ)音植入、拍攝方位及GPS位置信息等。

有聲可定位數(shù)據(jù)采集方法在數(shù)據(jù)處理上采用EXIF格式（可交換圖像文件格式）處理儲(chǔ)存，EXIF圖像格式是一種專門為數(shù)碼相機(jī)拍攝而制作的圖像文件，在數(shù)據(jù)記錄及處理存儲(chǔ)方面完全符合有聲可定位圖像采集，EXIF文件的儲(chǔ)存格式遵從JPEG標(biāo)準(zhǔn)，JPEG格式是常用的圖片存儲(chǔ)格式，所有的JPEG文件以字符0xFFD8開(kāi)頭，并以字符串0xFFD9結(jié)束。文件頭中有一系列0xFF_格式的字符串，稱為JPEG標(biāo)識(shí)或JPEG段，用來(lái)標(biāo)記JPEG文件的信息段。0xFFD8表示圖像信息開(kāi)始，0xFFD9表示圖像信息結(jié)束，這兩個(gè)標(biāo)識(shí)后面沒(méi)有信息，而在中間的字符段中的其他標(biāo)識(shí)緊跟一些信息字符，用來(lái)存儲(chǔ)各種與圖像相關(guān)的信息[5?6]。所以用EXIF處理儲(chǔ)存的圖像可讀性高，適用范圍廣，而EXIF文件處理就是在JPEG文件的頭部根植所謂的高級(jí)信息，JPEG格式的文件結(jié)構(gòu)的頭部是APP1?APPn標(biāo)識(shí)段，而APP1標(biāo)識(shí)段通常默認(rèn)開(kāi)啟，其段內(nèi)信息包括IFH，IFD及縮略圖3部分，而其余APP段信息屬于寫(xiě)入信息，可以用來(lái)儲(chǔ)存音頻、方位、GPS等數(shù)據(jù)，開(kāi)啟后可以根據(jù)需要開(kāi)發(fā)使用，本文應(yīng)用APP2標(biāo)識(shí)段存儲(chǔ)音頻信息，以0xFFE2字符段開(kāi)始標(biāo)識(shí)，字符段內(nèi)前兩個(gè)字符用于區(qū)分標(biāo)識(shí)信息，后6個(gè)字符用來(lái)存儲(chǔ)語(yǔ)音信息[7]。為了避免標(biāo)識(shí)段重復(fù)，用APP3標(biāo)識(shí)段記錄位置信息，而每個(gè)標(biāo)識(shí)段的文件儲(chǔ)存大小為64 KB，相同標(biāo)識(shí)段可以多次建立儲(chǔ)存，因此有聲可定位數(shù)據(jù)處理需要用到APP1段內(nèi)的信息及APP2，APP3段內(nèi)的附加信息，圖2為EXIF圖像結(jié)構(gòu)及標(biāo)識(shí)段應(yīng)用。

2 基于Android平臺(tái)的有聲可定位圖像采集過(guò)程

2.1 圖像采集總體設(shè)計(jì)

在Android系統(tǒng)的終端平臺(tái)上，有聲可定位圖像采集主要應(yīng)用攝像機(jī)、麥克風(fēng)、GPS及電子羅盤等的硬件設(shè)備，通過(guò)攝像機(jī)獲取現(xiàn)場(chǎng)圖像，并將其作為基礎(chǔ)，此時(shí)GPS及電子羅盤開(kāi)始定位讀寫(xiě)位置信息，GPS通過(guò)衛(wèi)星定位解析拍攝地點(diǎn)的經(jīng)緯度及地理名稱，電子羅盤獲取鏡頭拍攝的方位信息（方向角、俯仰角和翻轉(zhuǎn)角）[8]，將記錄信息寫(xiě)入載體（即以圖像為主的基本信息），麥克風(fēng)通過(guò)錄入功能將獲取的語(yǔ)音文件進(jìn)行編碼，存儲(chǔ)到EXIF的APP2標(biāo)識(shí)段中，再經(jīng)Android SDK功能和定義好的EXIF綜合存儲(chǔ)過(guò)程進(jìn)行兼容性匹配，生成JPEG格式的有聲可定位圖像文件。

2.2 綜合數(shù)據(jù)融合過(guò)程

以攝像機(jī)采集的圖像作為載體，將其他采集的數(shù)據(jù)有順序的錄入到圖像編碼器中。而位置信息及時(shí)間方位信息的數(shù)據(jù)錄入相對(duì)簡(jiǎn)單，并且現(xiàn)在的智能終端設(shè)備都已經(jīng)得到應(yīng)用，相對(duì)于位置、時(shí)間、空間等信息，語(yǔ)音信息的寫(xiě)入過(guò)程比較復(fù)雜，因?yàn)橐苿?dòng)終端內(nèi)存存儲(chǔ)有限，而語(yǔ)音信息文件又比較大，對(duì)于一些無(wú)線終端設(shè)備，語(yǔ)音模塊的融合將直接影響到有聲可定位圖像的利用率及傳輸效率，所以就想到語(yǔ)音文件的壓縮再處理，在數(shù)據(jù)壓縮處理時(shí)，考慮用香濃?范諾編碼，這種壓縮算法又叫無(wú)損壓縮算法，在本課題中應(yīng)用這種算法可以將音頻信息無(wú)損壓縮，在調(diào)用時(shí)經(jīng)解碼還原，可以達(dá)到錄入時(shí)的音頻效果，但最大的問(wèn)題是壓縮還原過(guò)程中耗費(fèi)時(shí)間，不能起到快捷方便的調(diào)用效果[9?10]?？紤]到EXIF格式中有IMA?ADPCM語(yǔ)音編程算法，可以將采集的語(yǔ)音信息進(jìn)行數(shù)據(jù)壓縮，IMA?ADPCM語(yǔ)音編碼雖然是一種有損壓縮算法，但本文有聲可定位圖像采集對(duì)語(yǔ)音模塊的音質(zhì)效果要求不是很高，所以有損壓縮算法可以滿足對(duì)語(yǔ)音模塊的需要。

語(yǔ)音數(shù)據(jù)的采集融合過(guò)程就是將采集后的無(wú)壓縮語(yǔ)音信息進(jìn)行量化，形成PCM數(shù)據(jù)，通過(guò)IMA?ADPCM編碼器將PCM數(shù)據(jù)壓縮得到壓縮數(shù)據(jù)，再根據(jù)自定義好的APP2段進(jìn)行編碼儲(chǔ)存，經(jīng)EXIF格式系統(tǒng)性融合，就形成了有聲圖像。整個(gè)有聲可定位圖像采集流程圖，如圖3所示。獲取音頻文件并設(shè)置采樣頻率、聲道、采樣倍數(shù)、緩沖區(qū)等基本參數(shù)，建立元文件，調(diào)用麥克風(fēng)采集語(yǔ)音，對(duì)語(yǔ)音文件量化處理形成PCM數(shù)據(jù)儲(chǔ)存，調(diào)用EXIF模塊的IMA?ADPCM編碼對(duì)儲(chǔ)存PCM數(shù)據(jù)壓縮，生成IMA?ADPCM編碼數(shù)據(jù)，由于APP2標(biāo)識(shí)段內(nèi)存的限制，所以應(yīng)用程序判斷語(yǔ)句判斷IMA?ADPCM編碼數(shù)據(jù)是否大于64 KB，若大于64 KB，則EXIF可創(chuàng)建多個(gè)APP2標(biāo)識(shí)段進(jìn)行語(yǔ)音文件儲(chǔ)存。

3 基于Android系統(tǒng)的圖像采集實(shí)現(xiàn)

3.1 有聲可定位圖像采集系統(tǒng)和移動(dòng)終端平臺(tái)的結(jié)合

有聲可定位圖像采集設(shè)計(jì)完成，需要在智能終端設(shè)備上實(shí)現(xiàn)，首先以該設(shè)計(jì)作為系統(tǒng)軟件，以APP形式植入Android系統(tǒng)中，以Android為平臺(tái)，實(shí)現(xiàn)有聲可定位圖像的采集、儲(chǔ)存、調(diào)用。在這個(gè)APP軟件中主要模塊是有聲可定位圖像采集、無(wú)線傳輸、查詢?yōu)g覽模塊。

用戶啟用APP進(jìn)入圖像采集界面，而這個(gè)采集界面和其他普通圖像采集無(wú)太大區(qū)別，如圖4（a）所示，在進(jìn)行圖像采集過(guò)程中，拍攝位置及拍攝方位會(huì)自動(dòng)寫(xiě)入有聲可定位圖像中，而此時(shí)語(yǔ)音信息以錄制原文件的形式暫存入移動(dòng)終端內(nèi)存中。當(dāng)用戶拍攝結(jié)束時(shí)，圖像采集界面自動(dòng)跳轉(zhuǎn)到語(yǔ)音描述界面，如果用戶不需要語(yǔ)音文件，則此界面可直接跳過(guò)，而語(yǔ)音文件也會(huì)消失，形成可定位普通圖像。若用戶需要語(yǔ)音信息，則在此界面開(kāi)啟語(yǔ)音錄入功能，就可以形成有聲可定位圖像。當(dāng)用戶調(diào)用圖像時(shí)，可以點(diǎn)擊圖像瀏覽界面標(biāo)識(shí)，有聲可定位圖像采集系統(tǒng)會(huì)自動(dòng)提取當(dāng)前圖像的位置、方位信息及語(yǔ)音信息。

3.2 圖像采集系統(tǒng)數(shù)據(jù)信息準(zhǔn)確性驗(yàn)證

有聲可定位圖像采集系統(tǒng)的各種錄入信息要準(zhǔn)確，而這些圖像信息需要驗(yàn)證的就是EXIF圖像格式內(nèi)部標(biāo)識(shí)段的完整性，本文驗(yàn)證方式采用十六進(jìn)制查看器對(duì)其數(shù)據(jù)的完整性、正確性進(jìn)行驗(yàn)證，通過(guò)數(shù)據(jù)解析，驗(yàn)證EXIF數(shù)據(jù)結(jié)構(gòu)的完整性及關(guān)聯(lián)穩(wěn)定性，圖像驗(yàn)證從0xFFD8開(kāi)始，接著驗(yàn)證APP1標(biāo)識(shí)段內(nèi)的圖像信息、圖像分辨率、焦距大小、曝光度、光圈等級(jí)等基本參數(shù)信息。圖4（b）是有聲可定位圖像查看的基本信息界面。然后驗(yàn)證APP2段內(nèi)的語(yǔ)音信息，在驗(yàn)證語(yǔ)音信息時(shí)，查看器只能對(duì)壓縮后的語(yǔ)音數(shù)據(jù)進(jìn)行檢驗(yàn)，所以在語(yǔ)音驗(yàn)證環(huán)節(jié)，需要人為的檢驗(yàn)音頻文件是否清晰。接著就是驗(yàn)證APP3段內(nèi)的拍攝位置、地點(diǎn)坐標(biāo)及名稱信息。這樣，整個(gè)有聲可定位圖像采集文件就驗(yàn)證完成。

4 結(jié) 語(yǔ)

本文提出一種集綜合圖像、語(yǔ)音、地理位置及屬性信息多元結(jié)構(gòu)于一體的新型有聲可定位圖像系統(tǒng)模型，將此系統(tǒng)植入到基于Android平臺(tái)的移動(dòng)終端設(shè)備中，通過(guò)圖像數(shù)據(jù)采集、EXIF圖像格式處理、IMA?ADPCM編碼壓縮，最后融合儲(chǔ)存成JPEG格式的圖像文件?；贏ndroid平臺(tái)的移動(dòng)終端系統(tǒng)可以成功地實(shí)現(xiàn)有聲可定位圖像采集，而這種圖像形式不僅可以應(yīng)用到科技探索、人文研究、自然災(zāi)害等大型應(yīng)用中，也可以在人們?nèi)粘Ｉ钪袘?yīng)用。像監(jiān)控、旅游拍攝、公路攝像等。而且這種有聲可定位圖像采集通過(guò)驗(yàn)證功能，增加了采集系統(tǒng)的精確性和穩(wěn)定性，有聲可定位圖像采集系統(tǒng)能正確地反映拍攝地點(diǎn)的綜合性信息，做到了完全的場(chǎng)景空間還原，為應(yīng)用者提供了豐富的數(shù)據(jù)源，簡(jiǎn)化了數(shù)據(jù)采集、處理及儲(chǔ)存的過(guò)程，大大提高了采集調(diào)用的效率。

參考文獻(xiàn)

[1] 王偉，張禮中，蔡子昭，等.城市環(huán)境地質(zhì)野外調(diào)查數(shù)據(jù)信息化采集[C]//2010年城市地質(zhì)環(huán)境與可持續(xù)發(fā)展論壇論文集.上海：中國(guó)工程院土木、水利與建筑工程學(xué)部，2010：551?555.

[2] SHAHIDUZZAMAN M M， NAZNIN M， RAHMAN A A U. Portable and secure multimedia data transfer in mobile phones using record management store [C]// Proceedings of 2010 IEEE International Conference on Computer Science and 1nformation Technology. Chengdu， China： IEEE， 2010： 364?367.

[3] 范忠誠(chéng)，鄭慧，幸剛鴻，等.基于Android系統(tǒng)的校園手機(jī)定位與信息采集平臺(tái)的開(kāi)發(fā)[J].科技信息，2013（20）：255.

[4] 李文闖，章永平，潘瑜春.移動(dòng)地理信息系統(tǒng)中的多源異構(gòu)數(shù)據(jù)融合模型[J].計(jì)算機(jī)應(yīng)用，2012（9）：2672?2678.

[5] 張濤，張建軍，郭波.基于使用可用度的k/N系統(tǒng)（m，N_G）維修策略分析[J].宇航學(xué)報(bào)，2009，30（1）：395?401.

[6] 張鼎周，包雷，錢存華.基于共因失效的層次表決系統(tǒng)可靠勝分析與維護(hù)策略[C]//中國(guó)運(yùn)籌學(xué)會(huì)可靠性分會(huì)第八屆可靠性學(xué)術(shù)會(huì)議論文集.南京：中國(guó)運(yùn)籌學(xué)會(huì)，2009：170?178.

[7] 吳勇，羅騰元，王美珍.可定位圖像采集與檢索方法研究[J].計(jì)算機(jī)工程，2014（7）：207?211.

[8] 李屏.GIS在中學(xué)生地理空間思維能力培養(yǎng)中的應(yīng)用[D].福州：福建師范大學(xué)，2015.

[9] 周園春，胡良霖，沈志宏，等.基于PDA的野外科考數(shù)據(jù)采集系統(tǒng)及其應(yīng)用[J].科研信息化技術(shù)與應(yīng)用，2008（1）：76?82.

[10] 陳彬，陳建平，馬克平，等.攝影定位法野外生物考察與數(shù)據(jù)管理[J].科研信息化技術(shù)與應(yīng)用，2011（5）：81?89.

現(xiàn)代電子技術(shù)2016年19期

現(xiàn)代電子技術(shù)的其它文章: 碼垛機(jī)器人機(jī)械臂仿真控制系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn); 基于局部不變特征與Camshift復(fù)雜環(huán)境跟蹤技術(shù)研究; 遺傳?蟻群算法的配電網(wǎng)狀態(tài)估計(jì); 人工魚(yú)群算法選擇特征和加權(quán)的模擬電路故障診斷; 基于規(guī)則和工作流引擎的保險(xiǎn)電子商務(wù)系統(tǒng)研究; 基于3DMAX與EONStudio的力學(xué)虛擬實(shí)驗(yàn)室設(shè)計(jì)