吳元君



【摘 要】 針對目前很多高校數(shù)字化校園平臺訪問方式單一、建設(shè)初期缺乏統(tǒng)一模型指導(dǎo)、信息資源利用率低等問題,本文基于面向主題的WebCrawler、改良的個性化信息推送、系統(tǒng)無縫集成、改進的熱點發(fā)現(xiàn)算法等技術(shù)研究構(gòu)建了一種門戶式智慧校園移動信息平臺,為高校多方位、效能化、智慧化的創(chuàng)新管理與服務(wù)提供了有效的技術(shù)支撐。
【關(guān)鍵詞】 智慧校園;移動互聯(lián)網(wǎng);WebCrawler;個性化;應(yīng)用集成;話題發(fā)現(xiàn)
【中圖分類號】 G647 【文獻標(biāo)識碼】 A
【文章編號】 2096-4102(2020)01-0033-04 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
一、前言
(一)研究背景
2016年4月,習(xí)近平總書記在網(wǎng)絡(luò)安全和信息化工作座談會上指出,今后,要加快推進社會信息化。建設(shè)國家教育云平臺,集中部署全國優(yōu)質(zhì)教育信息資源,逐步縮小區(qū)域、城鄉(xiāng)、校際差距。進一步提高教育信息網(wǎng)絡(luò)的性能,加快智能校園和智能教室建設(shè),大力發(fā)展智慧教育。
根據(jù)《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020)》,“十二五”到“十三五”以來,教育信息化工作已全面推進,云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、移動計算等新技術(shù)開始進入校園應(yīng)用,校園里的一場數(shù)字化革命已然高速起步成長。數(shù)字化校園門戶平臺,作為專門服務(wù)于學(xué)校的信息門戶平臺被各高校廣泛應(yīng)用,一站式處理所有業(yè)務(wù)。這類門戶平臺通過實現(xiàn)從環(huán)境、資源到應(yīng)用的全面信息化,為校園師生提供了一個集成了多種校園應(yīng)用的虛擬數(shù)字校園,拓展了校園應(yīng)用和體驗的時空維度,但是建設(shè)目標(biāo)不明確、基礎(chǔ)平臺選型不準(zhǔn)確、底層硬件支撐平臺設(shè)計不合理以及個性化定制不合理等問題也影響了高校智慧校園建設(shè)的持續(xù)穩(wěn)步推進。
文章結(jié)合新時代高校師生服務(wù)需求和發(fā)展要求,成功搭建了集合面向主題的數(shù)據(jù)爬取、改良的個性化信息推送、系統(tǒng)無縫集成、改進的熱點發(fā)現(xiàn)算法等多項技術(shù)的門戶式智慧校園移動服務(wù)平臺。
(二)國內(nèi)外研究現(xiàn)狀
1.智慧校園發(fā)展現(xiàn)狀
智慧校園的概念伴隨著當(dāng)前大數(shù)據(jù)計算、移動互聯(lián)等新技術(shù)的興起而被逐漸重視,很多高校的智慧校園研究和建設(shè)也開始看到了成果。上海交通大學(xué)的智慧圖書信息中心、浙江大學(xué)的智慧園區(qū)、東南大學(xué)的智慧一卡通等智慧校園的建設(shè)和研究,既切實提高了高校的管理服務(wù)水平,也讓我們看到了云計算、移動互聯(lián)技術(shù)對高校師生在教科研、后勤管理、一卡通、圖書借閱、智慧教室等校園生活的改變。
在普適計算的模式下,相當(dāng)多的智慧校園原型的開發(fā)、服務(wù)和推廣也相繼推出。Talal提出的智能卡方案類似于國內(nèi)的校園一卡通服務(wù),即通過把服務(wù)程序?qū)懭胫悄芸ㄖ校梢栽谝粡埧ㄖ姓隙喾N校園服務(wù)。Michael提出了一個可以整合校園虛擬環(huán)境和服務(wù)的EHOC系統(tǒng),該系統(tǒng)支持各種移動設(shè)備或打印、校園卡充值等服務(wù)。
為了更多地體現(xiàn)用戶與服務(wù)之間的交流和互動,更好地為師生主體提供主動服務(wù),“智慧校園”通過物聯(lián)網(wǎng)、移動互聯(lián)、大數(shù)據(jù)、云計算等概念和技術(shù)手段,能夠智能識別用戶使用場景,提供主動的網(wǎng)絡(luò)服務(wù),對于學(xué)校開放教育教學(xué)環(huán)境、智能支持教學(xué)科研過程,以及提供個性化生活服務(wù)都有積極意義,并在真正意義上實現(xiàn)校園智慧化管理和服務(wù)。
2.移動互聯(lián)網(wǎng)發(fā)展現(xiàn)狀
基于移動、電信、聯(lián)通等運營商4G、4G+及5G標(biāo)準(zhǔn)服務(wù)的加持,從移動電子商務(wù)到政務(wù)服務(wù)平臺,從簡單的基于web服務(wù)到真正的移動終端,移動互聯(lián)技術(shù)廣泛應(yīng)用于社會生活和服務(wù)是大勢所趨,智能手機普及、校園無線全覆蓋、全城Wi-Fi的探索和推廣,助力了真智慧校園的研究和建設(shè)。
移動應(yīng)用、虛擬服務(wù)等如何在智慧校園中部署,如何在智能空間里管理這些應(yīng)用服務(wù),是目前討論的熱點。比如建立一種基于粗粒度、開放式、松耦合的服務(wù)結(jié)構(gòu)(SOA)的智慧校園平臺,可以通過點對點的檢測用戶位置,來提供主動個性化校園服務(wù)和社交應(yīng)用。
二、相關(guān)技術(shù)及實現(xiàn)研究
(一)個性化校園資訊服務(wù)平臺研究
1.面向校園主題的爬蟲技術(shù)
傳統(tǒng)的數(shù)據(jù)爬取技術(shù)不提供關(guān)鍵字篩選,多為廣度優(yōu)先,主要是最大范圍的爬取互聯(lián)網(wǎng)中的目標(biāo)數(shù)據(jù)采集到搜索引擎中,而面向主題數(shù)據(jù)爬取過程是選擇性的,面向特定關(guān)鍵字,可以在有限的周期和資源內(nèi)最大程度采集到主題數(shù)據(jù)。面向校園主題的數(shù)據(jù)爬取流程見圖1。
2.個性化資訊服務(wù)技術(shù)
為了更精準(zhǔn)地對智慧校園用戶的行為模式進行分析,文章構(gòu)建了一個用戶行為模式挖掘模型,通過數(shù)據(jù)挖掘,尋找用戶行為規(guī)律,構(gòu)造行為序列模式,找出用戶行為特征。原理見圖2。
結(jié)合智慧校園用戶訪問行為的特征,既要考慮到利于序列投影,所以每個元素為單項,又要兼顧到序列模式的長度,文章采用PrefixSpan算法進行序列模式的數(shù)據(jù)挖掘。對不同校園用戶的訪問行為進行采集后,得到序列模式如下:
FSgroupid=(groupid,{(as1,spt1),(as2,spt2),…,(asi,spti),…,(asn,sptn)},sptmin)
(二)個性化校園信息推送技術(shù)研究
Apache Mina Server 是一個常用、小巧的網(wǎng)絡(luò)通信應(yīng)用框架,Mina框架同時對網(wǎng)絡(luò)服務(wù)器端和客戶端進行封裝,它的API可以真正隔離應(yīng)用服務(wù)與網(wǎng)絡(luò)通信,一個基于MINA框架的智慧校園移動信息平臺,只需要關(guān)心應(yīng)用程序數(shù)據(jù)的發(fā)送、接受以及業(yè)務(wù)邏輯即可。平臺的服務(wù)器端基于Spring、Spring MVC、Hibernate等JavaEE開源框架構(gòu)建,Spring框架具有高便利性、高擴展性、輕量級的特點,Spring MVC天然的與Spring集成,是實現(xiàn)了Web MVC和前端控制器模式的請求驅(qū)動類型的輕量級Web框架。另外,基于Android系統(tǒng)的開源特性,信息推送的移動接收端基于Android編寫。基于智慧校園信息推送架構(gòu)見圖3。
(三)校園應(yīng)用無縫集成框架研究
1.無縫集成
長期以來,眾多高校的信息化平臺建設(shè)都不夠集中,多種應(yīng)用程序缺乏統(tǒng)一規(guī)劃,看似功能全面,卻各成體系,沒有數(shù)據(jù)共享協(xié)同機制,形成多個數(shù)據(jù)孤島。文章中構(gòu)建的智慧校園平臺將基于校園應(yīng)用程序的無縫集成框架,校園用戶擁有統(tǒng)一身份認證門戶,利用開放的應(yīng)用程序集成和規(guī)范的標(biāo)準(zhǔn)接口,全面支持多種應(yīng)用程序的無縫集成。
2.智慧校園的無縫應(yīng)用集成方案
文章中構(gòu)建的智慧校園應(yīng)用程序無縫集成方案能夠為各種應(yīng)用程序提供正確的集成模式。特別是對于一些應(yīng)用實時性要求高、業(yè)務(wù)邏輯復(fù)雜的程序,我們將使用SOA與HTML5整合的模式。SOA,即面向服務(wù)的體系架構(gòu),具有高適應(yīng)性和高擴展性,HTML5同樣具有很好的適應(yīng)性,可以很好地適應(yīng)于不同規(guī)格的移動終端。另外,如果應(yīng)用程序強調(diào)用戶體驗和UI界面設(shè)計,我們也提供手機原生C/S集成模式,見圖4。
(四)基于智慧校園平臺的熱點話題發(fā)現(xiàn)技術(shù)
1.文本聚類算法
熱點話題發(fā)現(xiàn)的研究重點在于對聚類算法的優(yōu)化上。K-means是典型的基于距離的聚類算法,即組成簇的兩個對象距離越近,相似度就越高。K算法的缺點是數(shù)據(jù)量增大時的時間開銷很大,它需要不斷的樣本分類調(diào)整并計算新的聚類中心。考慮到校園熱點話題的輿論引導(dǎo)性等因素,文章提出了一種優(yōu)化的熱點話題發(fā)現(xiàn)算法。增量聚類算法Single-pass規(guī)避了K-means算法難以處理新文本對象的問題,它可以不規(guī)定初始類簇數(shù),自動調(diào)整形成新的聚類簇,并且不會產(chǎn)生準(zhǔn)確度降低的問題。
2.智慧校園熱點話題發(fā)現(xiàn)流程及算法優(yōu)化
智慧校園平臺熱點話題發(fā)現(xiàn)模塊的設(shè)計采用中文分詞系統(tǒng)ICTCLAS,包括改進的K-Means文本聚類算法、分詞預(yù)處理、特征項提取以及文本表示模型等。熱點話題發(fā)現(xiàn)流程見圖5。
我們采用的設(shè)計方法是在K-Means算法之前,通過統(tǒng)計熱點話題標(biāo)題詞頻的方式,提取出M個特征主題文本,作為初始聚類中心。算法的描述為:
(1)從樣本話題中提取話題標(biāo)題,組成文本集{N1,N2,...,Nn};
(2)對話題文本集合進行分詞,統(tǒng)計標(biāo)題文本詞的頻率;
(3)對標(biāo)題文本分詞詞頻排序,抽取詞頻最高的M個特征詞,集合成為特征文本詞集{St1,St2,...,Stk};
(4)初始的話題文本根據(jù)特征詞集組成M個文檔集,即Ti={Si1,Si2,...,Sin},其中Sij表示包含特征詞Sti的第j個文本,n為文本數(shù)量;
(5)比較Sti與Tti剩下文本相似度,得到相似度值后求和;將數(shù)值最大的熱點話題新聞作為Sti的特征文本,可得到M個特征文本;
(6)設(shè)定一個閾值,計算M個特征文本的相似度,相似度超過閾值的兩個文本將中心點合并。如果相似度值均低于設(shè)定的閾值,則直接進入(9);
(7)從(2)中得到第m+1個關(guān)鍵文本,返回(4);
(8)計算推出M個關(guān)鍵文本;
(9)M個熱點話題關(guān)鍵文本作為算法的初始聚類中心,執(zhí)行K-Means算法。
三、移動智慧校園平臺的實現(xiàn)
(一)系統(tǒng)整體架構(gòu)
面向切面編程思想(AOP)流行于.Net,在框架組件的模塊設(shè)計中,AOP已經(jīng)是標(biāo)配,它能有效降低軟件架構(gòu)的復(fù)雜度,支持動態(tài)修改OO模型,利于軟件設(shè)計模塊化,開發(fā)系統(tǒng)時只需專注于業(yè)務(wù)邏輯設(shè)計。智慧校園移動平臺服務(wù)端基于AOP思想開發(fā),將應(yīng)用程序中的業(yè)務(wù)邏輯和通用服務(wù)進行分離,通用邏輯通過AOP的方式統(tǒng)一提供。客戶端與服務(wù)端的數(shù)據(jù)通信依賴于HttpClient、MINA框架又能很好地保持長時間會話和數(shù)據(jù)推送系統(tǒng)。總體架構(gòu)如圖6。
(二)主要功能模塊設(shè)計
1.無縫集成模塊
智慧校園平臺的應(yīng)用集成讓校園用戶統(tǒng)一了身份認證,對平臺集成的多種應(yīng)用程序可以統(tǒng)一訪問,無縫集成為其他應(yīng)用程序提供了統(tǒng)一的API調(diào)用,整合了原本分散的各種業(yè)務(wù),提高了數(shù)據(jù)共享性和利用率,讓校園用戶在平臺客戶端上擁有統(tǒng)一的應(yīng)用程序體驗服務(wù)。無縫集成模塊對初始的業(yè)務(wù)調(diào)用進行了優(yōu)化,并使用了面向服務(wù)的體系架構(gòu)、原生C/S與Web中核心語言HTML5整合的模式,很好地提高了數(shù)據(jù)安全性和系統(tǒng)穩(wěn)定性。該模塊的的處理流程見圖7。
2.熱點話題發(fā)現(xiàn)模塊
熱點話題發(fā)現(xiàn)模塊包括改進的K-Means文本聚類算法、分詞預(yù)處理、特征項提取以及文本表示模型等,模塊將個性化新聞平臺收集的文本進行預(yù)處理,通過改進的K-Means文本聚類算法爬取和識別出一個周期內(nèi)發(fā)生的新話題或特征話題等。模塊的處理步驟如下:
(1)通過中文分詞系統(tǒng)ICTCLAS處理對、話題數(shù)據(jù)庫中的文本;
(2)設(shè)定的閾值,從ICTCLAS系統(tǒng)處理后的文本中提取特征文本;
(3)結(jié)合向量數(shù)理模型,利用提取的特征文本構(gòu)建文本知識表示模型;
(4)利用改進的K-Means文本聚類算法,對特征文本進行話題聚類。
(三)移動智慧校園平臺的應(yīng)用
文中設(shè)計的智慧校園移動信息平臺包括基于校園門戶的服務(wù)器端和基于移動設(shè)備的用戶終端,適應(yīng)IOS、Android、Windows等移動設(shè)備操作系統(tǒng),支持個性推送、信息定制、智慧課堂、掌上校園、校園論文檢索、個人成績推送、圖書借閱管理、校園社交平臺等第三方服務(wù),為校園師生用戶提供了多層次一體化體驗的智慧校園服務(wù)。平臺整體的設(shè)計架構(gòu)見圖8。
四、總結(jié)
文章基于新時代校園師生用戶的服務(wù)需求,利用移動互聯(lián)、云計算等技術(shù)設(shè)計開發(fā)了一個有多種應(yīng)用集成的智慧校園移動服務(wù)平臺,在為校園師生提供了豐富友好的校園應(yīng)用集成體驗的同時,也為目前智慧校園平臺的搭建提供了一種思路。后續(xù)研究將主要集中在大數(shù)據(jù)爬取、模塊擴展性等關(guān)鍵技術(shù)上,希望能更好地解決校園用戶習(xí)慣性行為和特征操作預(yù)測等問題。
【參考文獻】
[1]王小簡.基于建構(gòu)主義的高職英語信息化教學(xué)探究[J].湖北開放職業(yè)學(xué)院學(xué)報,2019,32(6):171-172,175.
[2]周興國.共享有質(zhì)量的教育:學(xué)習(xí)習(xí)近平教育思想體會[J].安徽教育科研,2018,18(4):12-17.
[3]羅秀梅.中小學(xué)教師教育技術(shù)能力培養(yǎng)對策探析[J].中國教育信息化,2010,28(9):57-58.
[4]喬一乘.基于Android+JAVAEE架構(gòu)的校園信息交互系統(tǒng)[D].長春:吉林大學(xué),2012.
[5]劉靈輝,蔡寧芝,王家輝.信息化技術(shù)環(huán)境下高校教學(xué)中存在的問題與對策研究[J].廣西教育學(xué)院學(xué)報,2018(6):176-179,186.