張偉
(中鐵第五勘察設計院集團有限公司 市政工程設計院,北京 102600)
基于信息熵的交通標志信息認知計算模型
張偉
(中鐵第五勘察設計院集團有限公司 市政工程設計院,北京 102600)
交通標志信息認知的有效性直接影響交通行為的安全和舒適程度,在交通標志設計時應當重點關注。以信息論為基礎,從研究交通標志傳遞的交通信息入手,引入滿足需求程度、易于理解程度和預先學習程度作為計算指標,建立信息熵模型。選取中國、美國、日本和英國的城市主干路交叉口交通指路標志進行案例分析,應用信息熵模型計算交通標志傳遞的交通信息認知的有效性。研究發現:信息熵模型可有效量化交通標志信息認知水平,進而科學地反映交通標志版面的優劣;由于傳遞了需求程度較高且易于理解的信息,中國組實驗標志信息認知程度較高。
交通工程;交通標志;標志版面;交通信息;信息熵
隨著社會經濟的快速發展,道路交通網絡規模日益擴大,道路網絡結構和交通參與情況日趨復雜。1879年,英國設置了世界上第一塊交通標志,自此交通標志設置的有效性便成了眾多學者研究的重點。交通信息是構成交通標志的基本元素,交通標志是交通信息的載體,用于消除交通參與者對交通環境的不確定性。有效的交通標志應當傳遞適量、準確的交通信息,協同人、車、路和環境,協助交通參與者安全、舒適地完成交通行為。
在交通領域,根據信息的性質,交通信息也可分為語法信息、語義信息和語用信息。語法信息是直觀、明確的信息,不需要結合具體語境即可理解其表達的含義,如交通指路標志上的文字“XX路”。語義信息是需要結合具體語境才能理解或更好地理解其表達的含義的信息,如交通指路標志上的文字的位置和排列形式。語用信息是語法信息和語義信息存在價值的前提,如研究交通標志的有效性之前,交通參與者應當“認識”交通標志,對它的功能略有了解。
在信息的相關研究中,Shannon C.E.于1948年提出了“信息熵”的概念[1],解決了對信息的量化度量問題。一個系統越是有序,信息熵就越小,確定系統狀態所需要的信息量就越小。由于信息熵可用于衡量系統狀態的有序程度,因此被廣泛應用在交通領域的交通運輸結構分析[2]、公交線網優化分析[3]、公交時間可靠性分析[4]、公交優先線控研究[5]和居民出行距離分布研究[6]中,將主觀數據轉化為概率事件進行客觀化處理,以克服實驗結果的主觀性。然而目前已有研究中,應用的Shannon公式法[7-8]由于僅統計直觀表象的語法信息,未度量較深層次的語義信息和語用信息[9],亟需改進,以便全面評價交通標志信息認知的水平。
為定量評價交通標志版面設計的優劣程度,本文首先從交通標志傳遞的交通信息入手,引入滿足需求程度、易于理解程度和預先學習程度作為計算指標,建立信息熵模型。然后,選取中國、美國、日本和英國的城市主干路交叉口交通指路標志進行案例分析,應用信息熵模型計算交通標志傳遞的交通信息認知的有效性,進而評價交通標志版面設計的優劣程度,驗證模型的有效性。
1.1 指標選取
交通標志的有效性可通過交通信息傳遞的通達性進行表征,即是否滿足需求、是否易于理解。“是否滿足需求”是指交通標志是否傳遞交通參與者需要的信息,可通過廣泛調查得到,能夠賦予具體發生概率值,可歸為語法信息。“是否易于理解”是指交通標志傳遞的信息是否能夠被交通參與者很好地接收,由于受交通參與者個體差異影響,較難賦予具體發生的概率值,可歸為語義信息。交通參與者是否對交通標志進行過學習,或是否對其功能略有了解,會嚴重影響交通標志的有效性。較難識別的交通標志經過多次重復記憶,也可被動認知其表達的含義,進而被動提高其有效性[10]。因此,“是否預先學習過交通標志”作為語用信息也應當在設計交通標志時予以考慮。故將滿足需求程度、易于理解程度和預先學習程度作為計算指標,納入到模型中,計算標志信息認知程度,衡量交通標志是否有效。
(1)滿足需求程度:滿足需求程度定義為交通標志傳遞的信息中交通參與者為確定交通環境需要的信息占交通參與者為確定交通環境需要的信息總量的比率,量綱為1。當交通參與者為確定交通環境需要的信息的總量較難獲取時,可近似取值為交通標志傳遞的信息的總量。
(2)易于理解程度:易于理解程度定義為交通標志傳遞的信息中被交通參與者準確接收的信息占交通標志傳遞的信息總量的比率,量綱為1。
(3)預先學習程度:預先學習程度定義為交通參與者中接受過交通法規培訓的比率,通常取值為交通參與者中取得駕駛執照的比率,量綱為1。
1.2 建模思想
Shannon在信息論中定義信息熵為隨機變量比特量的期望值,即事件發生概率的平均信息量[1]。熵值越小,確定概率事件發生所需信息數量越小,就越能夠確定系統所處的狀態是有序還是無序,計算公式如下:

式中:H為值域為的隨機變量X的熵值(bit),取值介于0~log2n,H存在以下性質:當P(X=xi)=0或1時,H=0;當時,H=log2n。
“是否滿足需求”、“是否易于理解”和“是否預先學習過交通標志”均分為“是”和“否”兩種狀態(“是”反饋“有序”,“否”反饋“無序”),可通過主觀詢問等方法得出“是”或“否”兩種隨機事件各自出現的頻率,即發生概率。
建立二元變量的信息熵函數:

式中:H為值域為{是,否}的隨機變量X的熵值(bit),取值介于0~1,該函數存在以下性質:
(1)當P(X=xi)=0或1時,H=0;當P(X=xi)= 0.5時,H=1;
(2)函數圖像關于P(X=xi)=0.5對稱(見圖1(a));
(3)當P(X=xi)∈[0,0.5]時,P(X=xi)與H(X)成正相關;
(4)當P(X=xi)∈(0.5,1]時,P(X=xi)與H(X)成負相關。
評價交通標志的有效性的優劣程度存在以下原則:
(1)由于熵值越小,確定概率事件發生所需信息數量越小,就越能夠確定系統所處的有序狀態,因此由式(2)計算出的熵值越小表示交通標志的有效性越好;
(2)“是滿足需求”的發生概率、“是易于理解”的發生概率和“是預先學習過交通標志”的發生概率越大表示交通標志的有效性越好。
基于上述原則,“是滿足需求”的發生概率、“是易于理解”的發生概率和“是預先學習過交通標志”的發生概率應分別與熵值H(X)成負相關。但當時,與H(X)成正相關,因此應對式(2)進行修正(見圖1(b)、圖1(c)和圖1(d)),以保證“是”的發生概率與熵值H(X)成負相關。


圖1 熵函數的圖像
修正后的計算公式如下:


由式(3)和式(4),綜合考慮“是否滿足需求”、“是否易于理解”和“是否預先學習過交通標志”,建立信息熵模型,計算標志信息認知程度,進而客觀度量標志傳遞信息的有效性。
1.3 模型構建
1.3.1 語法信息滿足需求程度熵
有效的交通標志應當傳遞適量的、滿足需求的信息,以便獲得更高的效用值。信息熵模型對交通標志傳遞的交通信息是否滿足需求進行了度量。交通標志傳遞的每條語法信息分為“滿足需求”和“不滿足需求”兩類,為概率事件。先計算單條語法信息的滿足需求程度熵,進而計算所有語法信息的平均滿足需求程度熵,公式如下:



1.3.2 語義信息易于理解程度熵
有效的交通標志應當傳遞準確的、易于理解的信息,以便獲得更高的效用值。信息熵模型將語義信息轉化成概率事件,對交通標志傳遞的交通信息是否易于理解進行了度量。交通標志傳遞的每條語義信息分為“易于理解”和“不易于理解”兩類,為概率事件。先計算單條語義信息的易于理解程度熵,進而計算所有語義信息的平均易于理解程度熵,公式如下:



1.3.3 語用信息預先學習程度熵
為更好地提高交通標志的有效性,應當在交通參與者完成交通行為前對其進行交通法規培訓,使其“認識”交通標志,以便獲得更高的效用值。信息熵模型將語用信息轉化成概率事件,對交通參與者是否預先學習過交通標志進行了度量。交通標志傳遞的語用信息分為“預先學習過”和“沒有預先學習過”兩類,為概率事件。語用信息的預先學習程度熵計算公式如下:



1.3.4 計算模型
依托信息熵理論,綜合語法信息、語義信息和語用信息,分別引入滿足需求程度、易于理解程度和預先學習程度作為計算指標,建立信息熵模型。計算語法信息平均滿足需求程度熵、語義信息平均易于理解程度熵和語用信息預先學習程度熵的算術均值,公式如下:

式中:Hk為在特定的交通環境中,交通標志k傳遞的交通信息認知的優劣程度,量綱為1,取值介于0~100%之間,取值越小表征交通標志k傳遞的交通信息認知程度越優。
以中國、美國、日本和英國的城市主干路交叉口交通指路標志為例,在95%置信水平下,隨機挑選44名駕齡不足1年的青年被試者(男女各22人)參加實驗。應用信息熵模型,計算標志傳遞信息的有效性。
(1)圖2和圖3分別舉例介紹了實驗路網和實驗標志。


圖2 實驗路網

圖3 實驗標志
(2)計算中國等4組實驗標志中道路信息或地點信息個數的總和,即標志信息數量[11-12],計算結果見表1。

表1 實驗標志信息數量
(3)要求被試者依次認真觀察(閱讀并理解)幻燈片放映的實驗標志,之后依據自身理解將實驗標志上的道路信息或地點信息標記到空白實驗路網(圖2(a))中相應的位置處。通過比對標記詳細道路信息的實驗路網(圖2(b))和標記詳細地點信息的實驗路網(圖2(c)),實驗組織者統計出被試者標記正確的道路信息或地點信息情況,統計結果見表2。

表2 實驗標志上的道路信息或地點信息被標記正確(理解正確)的情況
(4)針對標記詳細道路信息的實驗路網(圖2(b))和標記詳細地點信息的實驗路網(圖2(c)),假設被試者正駕車通過實驗路網中心的實驗交叉口,要求被試者于60s內在實驗路網上選擇并標記出其需要知道的道路信息或地點信息。實驗組織者統計出中國、美國、日本、英國4組實驗標志中出現的道路信息或地點信息被選擇情況,統計結果如表3所示。

表3 實驗標志上的道路信息或地點信息被選擇(需求)情況
(5)以中國組實驗標志為例,將表2、表3中中國組相關數據代入式(14),信息熵模型計算結果如下。
當交通參與者接受過交通法規培訓時:

當交通參與者未接受過交通法規培訓時:

經計算得到當交通參與者接受過和未接受過交通法規培訓時,中國組實驗標志信息認知的優劣程度依次為18.7%,52%。計算其余3組實驗標志信息認知的優劣程度,填入表4。

表4 實驗標志信息認知計算結果
中國等4組實驗標志案例計算結果反映出:
①信息熵模型的計算結果是有效的、可靠的,可有效量化交通標志信息認知水平,進而科學評價交通標志版面的優劣;
②由于傳遞了需求程度較高且易于理解的信息,中國組實驗標志信息認知程度較高。
交通標志是交通信息的載體,以圖形、文字的形式向交通參與者傳遞信息,以滿足交通參與者的信息需求,消除疑惑,使其安全、舒適地完成交通行為。本文從研究交通標志傳遞的交通信息入手,建立信息熵模型,將語義信息和語用信息轉化成概率事件納入到模型計算中,與語法信息平行計算,能夠較為全面地衡量交通標志傳遞的交通信息是否適量、準確,滿足需求且易于理解,為科學、合理地設計交通標志提供了理論基礎和技術數據,在提高道路交通服務水平方面發揮了積極作用。
但建立的模型在以下方面還有待進一步研究:
(1)交通參與者為確定交通環境需要的信息的總量如何界定;
(2)交通參與者因個體差異接受交通法規培訓的效果對模型的精度是否存在影響;
(3)語法信息、語義信息和語用信息三者之間的關系是否可以用簡單的線性關系表示。
參考文獻:
[1]SHANNON C E.A Mathematical Theory of Communication [J].The Bell System Technical Journal,1948,27(3):379-423.
[2]田志清.基于信息熵和灰色關聯的交通運輸結構的分析[D].呼和浩特:內蒙古大學,2013.
[3]朱文銅,卞兆洋,李海鵬.基于信息熵TOPSIS的公交線網優化方案排序[J].交通科學與工程,2013,29(3):72-76.
[4]胡繼華,程智鋒.基于信息熵的公交時間可靠性度量模型[C]//第七屆中國智能交通年會優秀論文集——智能交通技術.北京:中國智能交通協會,2012:74-80.
[5]魏華,馬榮國,呂斌,等.基于信息熵的公交優先線控系統相位差優化模型[J].中國公路學報,2014,27(5):158-163.
[6]LIU J J,XIAO M D,WANG W.Models of Inhabitant Trip Distance Distribution Based on Utility and Information En?tropy[C]//Proceedings of International Conference on Engi?neering and Business Management(EBM2010).Chengdu: Wuhan University,2010:3125-3129.
[7]曹鵬,吳文靜,雋志才.基于信息度量的交通標志視認性研究[J].公路交通科技,2006,23(9):118-120.
[8]LIU Y C.A Simulated Study on the Effects of Information Volume on Traffic Signs,Viewing Strategies and Sign Fa?miliarity upon Driver's Visual Search Performance[J].Inter?national Journal of Industrial Ergonomics,2005,35(12): 1147-1158.
[9]徐志,關宏志,嚴海,等.交通標志文字信息駕駛員眼動視認特性[J].北京工業大學學報:自然科學版,2011,37(12):1830-1835.
[10]余進程,謝光漢,羅芳.基于深度學習的道路交通標志數字識別技術探究[J].數字技術與應用,2013(12):62-63.
[11]黃凱.交通指路標志極限信息量及漢字字高模型研究[D].北京:交通運輸部公路科學研究院,2008.
[12]杜志剛,潘曉東,郭雪斌.交通指路標志信息量與視認性關系[J].交通運輸工程學報,2008,8(1):118-122.
Information Cognition Calculation Model of Traffic Sign Based on Information Entropy
ZHANG Wei
(Municipal Engineering Design Institute,China Railway Fifth Survey and Design Institute Group Co.,Ltd., Beijing 102600,China)
For the information cognition effectiveness of traffic sign directly impacts the safety and com?fort of traffic behavior,it should be paid more attention to in designing traffic sign.Based on the informa?tion theory,the traffic information transferring by the traffic sign was studied,and the information entro?py model was established.The model had three calculation indexes,including the demand meeting de?gree,the understandable degree and the prior learning degree.Traffic guide signs in China,USA,Japan and UK were selected as the study cases.The cognition effectiveness of traffic information transferring by these signs was calculated via information entropy model.The results show that the information entro?py model can effectively quantify the level of traffic information cognition and scientifically reflect the pros and cons of traffic sign layout;for the experimental sign of China transfers the information that has higher demanding degree and is more easily understood,it can be cognized more easily.
traffic engineering;traffic sign;layout of sign;traffic information;information entropy
U491.52
:A
:2095-9931(2015)04-0056-10
10.16503/j.cnki.2095-9931.2015.04.009
2015-05-04
國家重點基礎研究發展計劃(973計劃)(2012CB723303)
張偉(1988—),男,北京人,碩士,研究方向為交通運輸規劃與管理。E-mail:zhangwei1003@126.com。