2008年英特爾杯大學生電子設計競賽嵌入式系統專題邀請賽圓滿落幕了,我們三人(陳超、何軍、馬翌倫)的作品“互動視窗”獲得了一等獎。回想整個過程,我們感到收獲頗豐。
本作品針對博物館文物展示等應用,通過對參觀者手勢、語音、意念行為等信息進行識別和處理,構建了一個方便、自然、人性化的嵌入式互動平臺。在EC5-1719CLDNA平臺上,針對特定應用增加了攝像頭、揚聲器、可控展品臺等硬件裝置;研究了手勢和人臉的識別與跟蹤、非特定人中英文連續語音識別等人機交互技術;改進了基于手形結構特征的識別算法,建立了手勢缺陷圖的判斷方法;基于Linux實現了具有物品展示、多媒體評論、娛樂等功能的互動平臺,充分展示了基于視覺、語音等多通道交互的優勢。
前期的重視
大三時我們就從徐成老師那里了解到嵌入式領域的一個最高級別的競賽——英特爾杯大學生電子設計競賽嵌入式系統專題邀請賽。秦云川、羅正欽、黃春毅幾位學長在2004年的比賽中取得了二等獎。因為一直在學習嵌入式系統,所以便對這個競賽十分向往。競賽之前,我們也參加過許多其他競賽,雖然沒有取得特別好的成績,但在選題、設計等方面積累了不少經驗,這都在這次大賽上發揮了作用。
不惜代價選好題
我們花了將近一個月的時間選題,現在看來這是完全有必要的。好的主題能很好地拔高作品的水平,比如華南理工大學代表隊就憑著對殘疾人的關懷和較新的技術獲得此次競賽最高獎——“英特爾杯”。選題要與時俱進,要體現創新思想。
我們總結出來的選題方法有兩種,一種就是先有技術,再找應用:另一種就是先定應用,再找技術。我們選擇前者。在2007年底,我們就在初步思考這次競賽的選題,當時王曉棟學長提出了動作識別技術,大家都覺得很新、很有前景。馬翌倫從那時起就開始學習一些相關的技術。
每一個人的知識結構都不一樣,思維方式也不一樣。因此選題不能只靠三個人,必須集思廣益,在交流中激發出靈感的火花。選題初期,我們上網瀏覽了一些前沿科技及許多創意產品,這些都極大地激發了我們的靈感。創意產品往往關注平時不被人注意的細節,他們對生活的細致觀察而衍生出的創意經常讓人會心一笑。楊志邦學長每星期組織我們開兩次會,詳細了解我們的進度,召集學長學姐們根據我們陳述的方案進行詳細討論,并提出好的建議。經過反復醞釀,“互動視窗”的雛形終于出現,它來源于科幻電影《人工智能》中可以與人交流的電腦,即做一個具有智能的系統。
針對這個想法,我們查閱了相關技術,初步定下了使用手勢識別、人臉跟蹤、語音識別、三維建模等技術來構建這樣一個未來系統。那么如何把這些技術有機地融合在一個系統中,使任何一項技術的出現都不顯得突兀?經過長時間的思考,在到深圳實習的火車上,馬翌倫想到最近博物館免費開放,大量游客的擁入使博物館不堪重負的問題。于是我們決定將系統應用到博物館中,以一種新的交互方式來做博物館的導覽系統。定下了應用場合之后,我們又在想如何將技術變成在博物館中的具體應用。開會的時候,我將手機立在桌上旋轉,想到了博物館中文物的旋轉,又聯想到大一時做過的全息成像實驗——從不同角度看二維底片上的全息圖像,能看到圖像中物品的不同側面。我想在系統中使用人臉檢測得到人的觀察角度,再使用步進電機控制物品在攝像頭前的角度,從而實現在二維的顯示器上看到類似全息圖像的效果。我和徐老師說了這一想法,徐老師同意了,并針對一些技術細節提出了建議。回到學校后,經過對多種想法的匯總,排除了一些技術過于復雜或意義不大的想法,最后定下了我提出的全息物品展示、細節點評、多媒體留言、拼圖游戲等幾個功能。接下來的會議討論較多的是技術難度和實現方法的問題。秦云川學長提出首先要將系統的骨架搭好,在這個基礎上一步一步增加功能,這對我們幫助極大。在后來的開發過程中,我們發現整合模塊比開發模塊更加耗時。
在確定選題時,有一個“系統放在哪兒”的問題。如果放在博物館門口,那么文物就放在博物館里面,參觀者為什么要在門口看我們的系統而不進去看實物?如果不放在博物館,那么放在哪兒?做成一個遠程系統?讓用戶在家中的電腦上參觀?這樣的工作量在剩余的時間里是不可完成的。經過多次討論(即使是在開始功能開發后),我們決定放下這個問題。競賽要的是一個理念,不是要做出一個盡善盡美的產品。而事實上,我們在整個開發完成之后撰寫文檔、整理思路的時候,也發現這確實是一個可以忽略的問題,我們的系統大有用武之地。
在選題上,我們總結了下列經驗:
1.不用追求做出在網上找不到的系統。在以前的競賽中,我們總想做出Google搜不到的系統。事實上,這樣的系統幾乎是不存在的。網上也有與我們的作品類似的產品,但技術不同,應用不同,理念不同。有自己的閃光點和理念在里面才是最重要的。
2.作品的特色在于:新技術一定要有好的應用背景,好玩、炫、創新。功能之間要有機結合。
3.多積累知識,不光是IT方面的。一個人能不能創新,跟他的知識面有多寬有很大關系。平時多觀察,創新源自細心觀察。
4.交流產生靈感,集思廣益。
快速學習
計算機科學涉及海量的知識,我們不可能學會全部知識,我們能做的只能是學會如何學習這些知識。在選題后的開發階段,我們遇到很多從未使用過的技術,只能現學現賣。憑借以前的經驗,我們能區分什么是一定能實現的,什么是比較難實現的。依據所要做的工作的重要性給他們排序,從重要的開始做。
對我們要用到的較新技術,英文文獻具有更高的參考價值,所以善于查找英文資料十分重要。網絡能大大提高我們的學習效率。
閱讀公認的經典圖書也能最大程度地提高學習效率。經典書籍歷經考驗,被證明對相關技術的闡述是最深刻的。閱讀這樣的書籍能快速掌握技術的精髓。
交流使大家的思想得到交換,加速對知識的理解。
精益求精,細節決定成敗
開發的過程中,我們經常又能想到新的點子。例如在做語音識別的時候,我閱讀了大量國內外的文獻,發現我們可以在中文語言識別功能的基礎上比較方便地增加英文語音識別功能。如果實現了多語言的語音識別,無疑又將是作品的一大亮點。不出所料,最后非特定人的中英文多語言語音識別得到了評審老師的好評。
在開發的最后階段,所有功能都基本實現了,但它們之間的融合還不是太好,細節上還是有很多待改進的地方。這時我們考慮如何把系統中的各個功能融合為一個整體,在確保系統穩定性的前提下添加一些錦上添花的功能,果斷地去掉一些影響系統整體性能的功能,流暢地演示作品。
組委會要求每個作品都要有一份設計報告,用于說明作品的內容和開發過程。這是一個耗時的工作,也是最后決定作品水平的關鍵,我們特別針對摘要部分做了細致的編寫。另外,我們還細致地檢查了文章的錯別字,統一每個人所寫部分的風格,自己用Office制作圖表,確保圖表清晰。用畢業論文的格式排版,保證文章的專業性。即使是在外地出差,我們晚上也在賓館里修改報告。最后得到了一份令自己滿意的設計報告。
抽象,拔高
將作品中的理念抽象出來,可以將作品的水平提高一個層次。我們長期沉浸在作品所實現的功能中,已經難以抽身從一個旁觀者的角度來分析作品。在寫報告的過程中,我們試圖把作品所蘊含的技術抽象到理論層面,用一種新的角度來詮釋我們所做的事情。徐老師提出,隨著人臉位置改變展品的觀察角度,可以認為是對人的意念行為的理解:人臉向左,表明他要看展品的左側,系統通過對人臉的跟蹤,能夠理解人的意圖。通過對幾個方面的重新詮釋,我們作品的整體理念得到了全新闡釋。
使自己滿意,不留遺憾
在開發的最后階段,心理的變化是十分微妙的。長期面對自己的作品,不知自己的作品能否引起別人的興趣:面對國內外的頂尖高校,也不知道自己作品的水平到底如何。只有一些來參觀老師或學生的鼓勵才能讓我們覺得“互動視窗”還是蠻吸引人的。
這時,徐老師告訴我們要擺正心態,“讓自己滿意,不留遺憾”。抱著這樣的心態,我們為赴上海參賽做好了充分準備。
充分準備,樹立自信
只有做好了充分的準備,針對各種情況都想好了應對方案,在面對評委時才能表現出自信。在去上海前的幾天時間里,負責陳述的我做了大量練習,兩次在會議室給二三十人陳述,數次在小范圍內練習,陳述用的PPT幾經修改。即使是答辯前一天在賓館里,面對同行的隊員、老師,我也做了兩次陳述,并做了最后的修改。充分的準備保證我們可以在評委面前從容不迫地展示我們的工作。
填寫答辯流程單時,我們字斟句酌,構思好了整個答辯的過程。在答辯現場,當別人匆忙地寫流程單時,我們在從容地等待答辯開始。
在向評委們做完陳述報告后,我們演示了作品。一切都如之前的練習一樣順利,只是由于現場環境的原因,有一個小功能的演示沒有成功。不過瑕不掩瑜,兩天后我們接到了復賽通知,一共有十六支隊伍進入了復賽。復賽中很多評委對我們的作品表現出極大關注,我們所做的工作也使評委們信服。
致謝
首先要感謝徐成老師,使我們有機會參加這一高水平的賽事。他提供了一個極好的學習氛圍,讓我們能夠安心做開發,并在很多問題上給予我們指導。感謝劉彥師兄在大方向上給我們的指導。感謝秦云川師兄憑借自己的經驗給我們在選題、開發等各個方面所做的指導,使我們少走了很多彎路。感謝楊志邦師兄每周來給我們開會,一直跟蹤我們的進度,給我們提出大量寶貴的建議。有他的督促,我們才不至于懈怠,工作才能按時按量完成。感謝周志順師兄貢獻了大量絕好的創意,他的創意是“互動視窗”的原型,他能夠一針見血地提出問題,使我們能反思自己所做的事情。感謝徐成老師所有的研究生、本科生抽出時間當我們的聽眾并提出寶貴的意見,他們的意見使我們的作品更加完善。
最后要感謝教務處對我們的大力支持,感謝湖南大學這所優秀的高校。