潘 影
(伊春市農業技術研究推廣中心 黑龍江 伊春 153000)
電子計算機采集、處理信息的一般過程是:先對自然形態的信息模式進行拾取,得到信息模擬物理量,如聲波轉換成電波;再對模擬物理量進行轉換獲得信息的數字編碼;然后對信息的數字編碼進行存儲、傳遞、編輯等加工處理。當需要輸出信息給人們使用時,則將上述過程逆行處理,即可恢復成原來的信息形態。不同信息形態的編碼方式和處理的方法會有所不同。
電子計算機錄入漢字的方法有4 種:即鍵盤錄入法、掃描錄入法、語音錄入法、手寫錄入法。以鍵盤錄入漢字,制作文本式的電子檔案為例,電子計算機的數字編碼過程有以下—些處理步驟:首先是在輸入時對漢字進行電子計算機的外碼轉換。如果使用普通電子計算機鍵盤作為錄入設備,就可以用漢語拼音、五筆字形等外碼錄入漢字。如果使用漢字大鍵盤作錄入設備、則漢字本身就是外碼,在鍵盤上直接點選就可錄入某個漢字。電子計算機接收了某個漢字外碼之后,接著就把外碼代表的漢字用電子計算機內碼記錄下來。電子計算機的內碼是以16 位二進制的數字表示的。電子計算機外碼的編碼方案有數百種,尚未制定國家標準。而電子計算機內碼的國家標準是GB/T 2312—80《信息交換用漢字編碼字符集》。這個標準中收入—級漢字3755 個、二級漢字3008 個、各類其他字符682 個。當完成文本式電子檔案的錄入工作之后,在電子計算機內進行的文件信息的存儲、傳輸等處理就都是對這些內碼的處理。只有當需要將文件輸出時,才將其漢字內碼所對應的字形點陣,也就是字模,以及眾多字模按格式組成的文章在屏幕或打印機上輸出。
對于圖形信息的數字編碼處理方式和方法有多種類型,但基本過程類似,例如通過掃描儀將平面二維圖形轉換成一維形式,由二進制數字編碼組成序列,并在轉換過程中加上附屬信息,如行碼、幀碼等。圖形中的白點或黑點分別用二進制的“0”或“l”表示。為了節約存儲空間,還可以將二進制數字原編碼序列進行壓縮實現再次編碼。例如文字的行與行之間有空白,就可以將這些空白用簡短的壓縮碼表示,而不必實際存儲很多的空白點編碼。信息壓縮方法有很多種,有的方法對信息的還原質量沒有什么影響,如上面列舉的對連續空白的壓縮編碼,就是一種不丟失信息元素的方法;有些方法會降低信息元素的密度,或丟失部分信息。使用時需注意在基本滿足還原質量要求的前提下,選擇不同的方法或壓縮倍率。文本形式的電子文件與圖形形式的電子文件有時相互交錯,如在文本文件中可能有插圖或直接用光筆在其上進行修改或書寫。此外,文本文件和圖形文件在一定條件下可以互相轉換,如用漢字模式識別技術可以把圖形文件中的漢字圖形經識別后,轉換成漢字內碼,變成文本文件。
在電子計算機多媒體技術的支持下,電子文件還可以包括聲音、影像等多種形式。不過這些信息形態對于電子計算機的內部處理來說,也都不過是二進制的數字編碼而已,只是在輸入和輸出時,才有其各自的特殊形式。電子計算機對于影像信息的處理過程要相對復雜一些。影像信息是由每秒鐘25 或30 幀畫面組成的,一般還配有伴音。在處理時,要分別拾取和加工,并保留其同步特征,即畫面與伴音的對應關系。一幀影像信息按行、列被分成若干象素,如1024 行×860 列等。每個象素的信息屬性編碼可以有顏色、飽和度、亮度等。這種編碼的信息量是很大的,為了少占用存儲空間,也可采用壓縮編碼的方法處理。
電子文件從一個裁體復制到另一個載體,或者從一臺電子計算機傳遞到另一臺電子計算機,實質上是在電子計算機內進行數字信號的傳輸處理。這種處理與通常的紙質文件復制或縮微品拷貝有很大區別。后者于模擬物理量的處理,不可避免地會出現清晰度下降、畸變、信息丟失等問題。而電子文件復制,由于是數字化的信息處理,所以幾乎完全不存在上述問題。原因是數字信息本身特性和各種技術措施決定的。例如在其傳遞過程中可以通過對傳輸碼校驗來糾正誤碼。數字信息傳遞的波型是脈沖方波,對其進行調制的基本領率來自于精確的脈沖信號,如果傳遞過程中發生脈沖信號的丟失,則可在接收端按脈沖信號進行增補,被增補脈沖的特性可根據其前后兩個相鄰脈沖的特性確定,由于脈沖信號顛率很高,對被傳遞信息的取樣密度也就很高,相鄰脈沖差別極小,故增補脈沖與丟失脈沖的差別小到可以忽略不計。此外,如果在傳遞過程中混進了干擾信號,可以采用“脈沖間閑靜噪”、“脈沖限幅”等技術去掉干擾信號。脈沖信號在傳遞過程中其高領分量的衰減較之低頻更大一些,使得方波變成“山包”形,只要在增加強度的同時增補高額分量,就可以完全恢復到與原波形一樣。例如,在光盤被復制時,如采取了較完善的技術措施,所出現的誤碼率能夠做到不超過十的負十四次方,也就是說相當于傳遞200000 份《人民日報》的文字信息量,才可能有一個漢字出錯。所以完全可以做到復制后得到的電子文件與原來的電子文件無任何區別。由此可見,只要數字信息在傳遞過程中尚可識別,信息與干擾就可以幾乎被完全分離,從而獲得高質量的電子文件信息。而模擬信息的傳遞則是另一種情況,例如,接收普通電視信號時,隨著信號的減弱,背景噪音和畫面上的雪花狀干擾就會越來越明顯,直至信號被淹沒在雜波之中。而數字信息在接收時.信號弱到一定程度會突然中斷,事先沒有明顯的征兆。從這個意義上講,在數字信息的處理過程中會產生一些猝不及防的問題。此外,電子文件傳遞和復制的這種高保真性,通常是好事,但是對于想特意區分原件與復制件來說又是很麻煩的事,這個問題需要采取專門的技術措施方能解決。
[1]侯曉莉.水利施工企業電子檔案管理探討[J].甘肅水利水電技術,2008(05).
[2]閻文華.電子檔案的保護[J].林業科技情報,2005(04).