999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中國現(xiàn)代職業(yè)教育理論之概念的抽取研究

2016-02-15 05:17:32良,梁
職教通訊 2016年19期
關(guān)鍵詞:規(guī)則概念理論

王 良,梁 卿

中國現(xiàn)代職業(yè)教育理論之概念的抽取研究

王良,梁卿

構(gòu)建中國現(xiàn)代職業(yè)教育理論體系和概念體系的前提是確定中國現(xiàn)代職業(yè)教育理論的概念?;谛g(shù)語學(xué)理論和實踐,中國現(xiàn)代職業(yè)教育理論的概念獲取摒棄了傳統(tǒng)的純?nèi)斯し绞?,而是通過計算機技術(shù)的運用從專業(yè)文獻中獲得候選術(shù)語集合,從候選術(shù)語中篩選得到最終術(shù)語,并進而確定作為中國現(xiàn)代職業(yè)教育理論概念體系構(gòu)成要素的概念。

現(xiàn)代職業(yè)教育理論;概念;術(shù)語

概念體系就是“根據(jù)概念間相互關(guān)系建立的結(jié)構(gòu)化的概念的集合?!保?]根據(jù)這一界定,概念是構(gòu)成概念體系的要素。因此,構(gòu)建概念體系首先就需要識別并確定組成體系的概念。中國現(xiàn)代職業(yè)教育理論概念體系的建構(gòu)亦不例外。但問題也隨之而來,即如何才能識別并確定中國現(xiàn)代職業(yè)教育理論的概念呢?傳統(tǒng)上,一般都是由專業(yè)領(lǐng)域的專家學(xué)者組成團隊,采取人工的方式從專業(yè)文獻中識別并收集概念。這種方式的典型代表就是各種專業(yè)詞典的編纂。在人工方式中,概念的識別和收集是由專家學(xué)者集體完成的,因而具有很強的可靠性。但這種方式也具有明顯的缺陷,即費時費力,效率低下。這一缺陷的進一步后果是,新出現(xiàn)的概念難以得到及時的識別和收集。如果采用這種方法收集中國現(xiàn)代職業(yè)教育理論的概念,并進而構(gòu)建概念體系,那么,不僅概念的收錄工作非常復(fù)雜,而且即使概念體系建構(gòu)起來,其更新也將頗為緩慢。因此,從中國現(xiàn)代職業(yè)教育理論概念體系本身的發(fā)展來講,需要找到一個新的獲取概念的方法。

一、理論基礎(chǔ)

我國國家標(biāo)準(zhǔn)《術(shù)語工作:原則與方法》(GB/ T 10112-1999)指出,概念是人們根據(jù)客體(包括客觀存在且可感知的事物和想象產(chǎn)生的事物)的“特性概括而得到的心理構(gòu)想。”“在一個知識領(lǐng)域中,概念用定義描述,被賦予約定的指稱(即術(shù)語)?!保?]國家標(biāo)準(zhǔn)的這些論述清晰地建構(gòu)了一個“客體—概念—術(shù)語”的理論框架。根據(jù)這一框架,人們先是通過感官的觀察和大腦的抽象,揭示客體的特征,并以此為依據(jù)對客體進行概括和分類,形成特定的心理構(gòu)想,即概念。這是一個概念化的過程。作為一種心理構(gòu)想,只有當(dāng)概念能夠被清晰地“說”出來的時候,才意味著概念的真正形成。因此,在概念化過程之后還有一個指稱化的過程,即使用特定語詞來代表或指稱已經(jīng)形成的概念。在這里,特定的語詞就是術(shù)語。顯然,客體先于概念,概念先于術(shù)語。

根據(jù)上文論述,在理想的情況下,概念的識別應(yīng)與概念的形成是同一過程。這意味著,在中國現(xiàn)代職業(yè)教育理論概念體系的建構(gòu)過程中,概念獲取的根本途徑就是通過對中國現(xiàn)代職業(yè)教育的現(xiàn)實進行觀察和抽象。但這種途徑存在巨大困難。第一,這個過程將會非常漫長。第二,在一個專業(yè)領(lǐng)域,一個所謂的“概念”是否稱得上“概念”還需要得到同行的認可。也就是說,即使某個專家面向中國現(xiàn)代職業(yè)教育的現(xiàn)實抽象出了所謂“概念”,還需要通過某種方式由同行進行認定。這又會進一步增加概念獲取的難度。因此,試圖在“客體—概念”的框架中來獲得中國現(xiàn)代職業(yè)教育理論的概念并不具有現(xiàn)實的可行性。因此,我們只能在“概念—術(shù)語”的框架中來尋找辦法。

事實上,在我國,學(xué)者們圍繞著現(xiàn)代職業(yè)教育的各種問題,開展了大量研究,已經(jīng)形成了一定數(shù)量的概念。在構(gòu)建中國現(xiàn)代職業(yè)教育理論概念體系的過程中,人們的主要任務(wù)是從已有的關(guān)于現(xiàn)代職業(yè)教育的研究文獻中,識別這些已經(jīng)形成的概念。那么,如何才能識別已有概念呢?在“概念—術(shù)語”框架下,可行的路徑是以術(shù)語識別為基礎(chǔ),獲取概念。在理論上來講,術(shù)語只是表示概念的一種符號,獲取了符號并不代表得到了概念。因此,試圖通過術(shù)語識別的方式獲取概念似乎并不可靠。但如果換個角度,這不失為一種比較好的方式。其一,從概念與術(shù)語的關(guān)系上看,概念雖然先于術(shù)語,但任何概念都必然表現(xiàn)為一定術(shù)語。其二,在術(shù)語學(xué)上,理想的情況是,一個特定概念在某一特定語種之中,一般只有一個相對應(yīng)的術(shù)語。雖然現(xiàn)實并不如此,但這是術(shù)語學(xué)的努力方向。因此,在中國現(xiàn)代職業(yè)教育理論的概念體系建構(gòu)過程中,人們可以通過對中國現(xiàn)代職業(yè)教育研究文獻的考察與分析,從中提取相關(guān)術(shù)語,進而識別相關(guān)概念。

二、中國現(xiàn)代職業(yè)教育理論術(shù)語的收集方法

傳統(tǒng)上,專業(yè)領(lǐng)域術(shù)語主要是由該領(lǐng)域的學(xué)者們直接從專業(yè)文獻中識別。在信息技術(shù)尚不發(fā)達的情況下,這種方式即使存在缺陷,也是不可替代的。但是,近些年來,伴隨著信息技術(shù)的發(fā)展和日漸成熟,人們開始嘗試使用信息技術(shù)實現(xiàn)術(shù)語的自動發(fā)現(xiàn)和識別。從目前的實踐來看,術(shù)語的自動識別一般有三種方法。

(一)基于規(guī)則的術(shù)語抽取法

這是一種以句法(術(shù)語上下文)或詞法(術(shù)語的內(nèi)部構(gòu)成成分)為基礎(chǔ)的術(shù)語抽取法。這種方法不僅需要對文檔進行分詞和詞性標(biāo)注,而且需要借助人工方式將語言學(xué)知識和特定專業(yè)領(lǐng)域知識結(jié)合起來,總結(jié)歸納特定專業(yè)領(lǐng)域術(shù)語構(gòu)成知識,并用規(guī)則表達出來,進而使用計算機程序完成術(shù)語的自動抽取?;谝?guī)則的術(shù)語抽取法的最大優(yōu)點是具有較高的準(zhǔn)確性。但是,這種方法也具有以下局限:(1)覆蓋范圍窄。即不同專業(yè)領(lǐng)域的術(shù)語的結(jié)構(gòu)不同,因此,使用基于規(guī)則方法抽取術(shù)語時,每個專業(yè)領(lǐng)域都需要建立一套規(guī)則。(2)規(guī)則的建立費時費力。基于規(guī)則的抽取法的前提之一就是要建立規(guī)則,但規(guī)則的建立需要對大量專業(yè)文獻進行研究才能完成,比較耗費時間。(3)不同時期術(shù)語的構(gòu)成規(guī)則可能會發(fā)生變化。

(二)基于統(tǒng)計的術(shù)語抽取法

這種方法主要是基于術(shù)語區(qū)別于普通詞匯的統(tǒng)計特征來實現(xiàn)術(shù)語的自動抽取。其優(yōu)點在于:(1)簡單直接。這種方法不需要借助規(guī)則等額外的要素,而是直接基于術(shù)語自身的統(tǒng)計特征來實現(xiàn)術(shù)語的自動識別,既簡單又直接。(2)跨領(lǐng)域。基于統(tǒng)計的方法不用考慮特定專業(yè)領(lǐng)域的句法和詞法等語言學(xué)信息,因此,這一方法適用于各個專業(yè)領(lǐng)域。(3)對于高頻術(shù)語具有很好的識別率。其不足主要表現(xiàn)為:①受語言材料多少的影響較大。一般來說,在語料規(guī)模較大的情況下,這一方法的效果較好。②對低頻術(shù)語的識別率較低。在專業(yè)文獻中,有些詞語出現(xiàn)的頻率較低,但卻是合法的專業(yè)術(shù)語。由于這類術(shù)語的出現(xiàn)頻率低,在使用基于統(tǒng)計的方法識別術(shù)語時,這類術(shù)語往往會被錯誤地排除。

(三)混合策略的方法

將基于規(guī)則的方法和基于統(tǒng)計的方法結(jié)合起來使用。在實際的使用中,有的先采用統(tǒng)計方法,后采用規(guī)則方法,有的則相反。[3]

在上述三種方法中,理論上比較理想的方法是混合策略的方法。但有研究表明,這種方法并不是在所有情況下都是最優(yōu)的選擇。[4]本研究擬將基于統(tǒng)計的自動抽取法和人工方法結(jié)合起來使用。具體而言,本研究首先采用基于統(tǒng)計的自動抽取法中的信息熵方法形成初步的術(shù)語集合。然后采用人工的方式,對初步的術(shù)語集合進行分析,形成最終的專業(yè)術(shù)語。之所以采用基于統(tǒng)計的方法而不是基于規(guī)則的方法有兩點原因:一是基于規(guī)則的方法需要建立規(guī)則,而規(guī)則的建立比較復(fù)雜。職業(yè)教育領(lǐng)域術(shù)語規(guī)則的建立需要語言學(xué)家和職業(yè)教育學(xué)者的合作,需要耗費很長的時間。借助已有的相關(guān)詞典(顧明遠教授主編的《教育大辭典》第3卷中收錄有職業(yè)教育方面的術(shù)語)來建立規(guī)則雖然也是可行的路徑,但該詞典出版于20多年前,職業(yè)教育術(shù)語的構(gòu)詞規(guī)則有可能發(fā)生變化。二是因為統(tǒng)計方法的優(yōu)缺點符合我國職業(yè)教育研究的特點。近些年來,我國職業(yè)教育研究水平有了長足的進步,但總的來說存在理論水平不高,理論色彩不夠濃厚的問題。許多研究成果往往就事論事,滿足于對職業(yè)教育現(xiàn)狀的簡單描述。[5]可以說,相對于其他領(lǐng)域,包括普通教育和高等教育領(lǐng)域而言,我國職業(yè)教育研究水平相對落后。這意味著,在職業(yè)教育理論中,不僅概念的科學(xué)性還有待提高,而且科學(xué)的概念在數(shù)量上相對較少。一般來講,科學(xué)的、得到公認的科學(xué)概念使用的頻率相對比較多。基于統(tǒng)計的術(shù)語自動抽取法,高頻術(shù)語的識別較強,低頻術(shù)語的處理較弱,這個特點與目前職業(yè)教育的研究狀況具有很強的適切性。同時,從促進職業(yè)教育理論發(fā)展的角度,在職業(yè)教育研究總體水平有待進一步提高的條件下,不能急于提取尚未成熟的概念,而更應(yīng)該將已經(jīng)得到認可的、被學(xué)者們廣為使用的術(shù)語識別并確定下來。之所以采用信息熵方法,主要是因為它是目前被廣泛認可并使用的信息統(tǒng)計工具。之所以在基于統(tǒng)計方法之后使用人工方法進行進一步分析,主要是因為,統(tǒng)計方法在術(shù)語抽取中存在一大特點,即它不僅能識別文獻中的高頻術(shù)語,還往往會將高頻通用詞匯和其他字符串抽取出來。這些詞語如果不通過規(guī)則的方式予以排除,就需要借助人工的方式去除。

三、中國現(xiàn)代職業(yè)教育理論術(shù)語的收集和概念的識別

在本研究中,“中國現(xiàn)代職業(yè)教育”被界定為中華人民共和國建國后的職業(yè)教育。因此,在術(shù)語收集過程中,應(yīng)該將新中國建國以來的職業(yè)教育研究文獻都囊括進來。但這樣一來,工作量將非常巨大。事實上,也完全沒有必要這樣做。20世紀80年代末90年代初,北京師范大學(xué)顧明遠教授主持編纂出版了《教育大辭典》(12卷),其中第3卷收錄了職業(yè)教育方面的術(shù)語。我們將該詞典收錄的413條術(shù)語全部納入進來(不含人名、具體的學(xué)校名、法律規(guī)范名、會議等專有名詞),作為中國現(xiàn)代職業(yè)教育理論術(shù)語的一部分。[6]如此以來,我們需要收集處理的就是20世紀90年代以來的術(shù)語。具體過程如下。

(一)建立語料庫

以“職業(yè)教育”或“職業(yè)技術(shù)教育”為主題,在中國知網(wǎng)期刊網(wǎng)CSSCI庫搜索職業(yè)教育領(lǐng)域2014年(含)之前的研究文獻(不包含研究綜述、新聞報道、會議綜述、領(lǐng)導(dǎo)講話和政府文件類文章),下載這些文章的題名、關(guān)鍵詞和摘要,以文本文件形式存儲,得到由3 083個文本文件構(gòu)成,共計60余萬字的語料庫。

(二)二次開發(fā)NLPIR分詞系統(tǒng)

NLPIR分詞系統(tǒng)是由漢語詞法分析系統(tǒng)ICTCLA發(fā)展而來。該系統(tǒng)曾獲得錢偉長中文信息處理科學(xué)技術(shù)一等獎等多個獎項,在中文信息處理領(lǐng)域被廣泛認可。目前,該系統(tǒng)在傳統(tǒng)的分詞和詞性標(biāo)注功能之外,又相繼開發(fā)出了許多新的功能?;谛畔㈧胤椒ǖ年P(guān)鍵詞自動獲取就是其新的功能之一?;谛畔㈧胤椒ㄊ腔诮y(tǒng)計方法中的一種,其基本思想是,如果一個詞或短語是術(shù)語或者關(guān)鍵詞,那么它反復(fù)出現(xiàn)并且前后出現(xiàn)不同詞語的概率應(yīng)該非常高。作為NLPIR系統(tǒng)的一部分,該系統(tǒng)的關(guān)鍵詞提取組件采用了靈活的開發(fā)結(jié)構(gòu),可以支持各種不同的計算機操作系統(tǒng)和調(diào)用語言。本研究在win32系統(tǒng)中,采用Java語言,對NLPIR系統(tǒng)進行了二次開發(fā),以實現(xiàn)基于信息熵方法的術(shù)語自動獲取。

(三)術(shù)語的自動提取、選擇與校對

運行術(shù)語提取程序,處理3 083條題錄信息,初步獲得候選術(shù)語24 385條。在此基礎(chǔ)上,采取人工的方式對這些術(shù)語進行選擇和校對,最后獲得職業(yè)教育領(lǐng)域的專業(yè)術(shù)語349條。術(shù)語的選擇和校對遵循“四排除、一合并”原則。“四排除”是指:(1)高頻非通用詞匯予以排除。例如,“發(fā)展殘疾人”就不是術(shù)語。它之所以被抽取出來,主要就是因為結(jié)合比較穩(wěn)定而且出現(xiàn)次數(shù)多。(2)通用詞匯予以排除。如“原因”、“啟示”、“探索”等通用詞匯被排除在術(shù)語之外。(3)專有名詞予以排除。例如,“黃炎培”、“杜威”、“普洛瑟”等人名、“澳大利亞”、“江蘇”、“株洲市”等地名,“浙江金融職業(yè)學(xué)院”、“中華職業(yè)學(xué)校”等特定學(xué)校的校名等都被去除。(4)未體現(xiàn)職業(yè)教育特色的教育術(shù)語予以排除。例如,“教育”、“課程”、“教學(xué)”等雖然是教育術(shù)語,但并未體現(xiàn)職業(yè)教育特點,因此,也被排除在職業(yè)教育術(shù)語之外?!耙缓喜ⅰ笔侵笇⒃诓煌墨I中出現(xiàn)的同一術(shù)語加以合并。

(四)術(shù)語的確定

將《教育大辭典》(第3卷)中收錄的413個職業(yè)教育術(shù)語與運用信息熵方法提取的349個術(shù)語進行比對,取其并集,形成中國現(xiàn)代職業(yè)教育理論的術(shù)語集合,共計733個術(shù)語。兩個來源的術(shù)語集共有29個重復(fù)術(shù)語。應(yīng)該說,重復(fù)的術(shù)語數(shù)量比較少。出現(xiàn)這種狀況的可能原因是,CSSCI期刊即使接收職業(yè)教育方面的論文,一般也不刊發(fā)教學(xué)方面的文章。這就使得基于CSSCI期刊庫獲得的職業(yè)教育術(shù)語很少涉及職業(yè)教育微觀教學(xué)領(lǐng)域。但《教育大辭典》(第3卷)收錄的職業(yè)教育術(shù)語中,涉及職業(yè)教育微觀教學(xué)領(lǐng)域和相關(guān)職業(yè)領(lǐng)域的占比非常高,前者如“案例教學(xué)法”、“示范教學(xué)法”等,后者如“工種”、“成品測量”等。

(五)概念的確認

雖然術(shù)語學(xué)的追求是一個術(shù)語對應(yīng)一個概念,但在我們收集獲得的733個職業(yè)教育術(shù)語卻不是這樣。在這733個術(shù)語中,有些術(shù)語雖然不同,但表達的實際上是同一個概念。例如,“職業(yè)技術(shù)教育”、“職業(yè)教育”、“技術(shù)和職業(yè)教育”和“技術(shù)職業(yè)教育”等四個術(shù)語所指的其實是一個概念?!奥殬I(yè)基礎(chǔ)教育”與“基礎(chǔ)職業(yè)教育”、“職業(yè)教育體系”與“職業(yè)技術(shù)教育體系”也是如此。對于這些術(shù)語,我們將其進行歸并,最終形成了中國現(xiàn)代職業(yè)教育理論的728個概念。

本研究也存在一些不足。其一,限于能力和時間,在語料庫的建設(shè)上,本研究只是將中國知網(wǎng)CSSCI期刊庫論文的題錄信息收集起來,既沒有收集更多論文的題錄信息,也忽視了20世紀90年代以來出版的職業(yè)教育著作。其二,在術(shù)語自動抽取方法上,本研究采取了信息熵方法。這種方法雖然考慮了一個詞或短語外部的邊界自由度,即詞或短語左右兩側(cè)出現(xiàn)不同符號或符號串的可能性大小,但沒有考量詞或短語內(nèi)部結(jié)合的緊密度,即一個詞或短語內(nèi)部各符號間的結(jié)合強度。[4]通常情況下,作為概念的指稱,術(shù)語應(yīng)是一個相對固定的完整語言單位,不僅其左右兩側(cè)的符號和符號串應(yīng)該是變化的,即邊界自由度高,而且其內(nèi)部符號之間也應(yīng)該緊密結(jié)合在一起,即內(nèi)部緊密度高。信息熵方法只考慮了邊界自由度,而忽視了內(nèi)部緊密度,這不能不說是一大缺憾。在后續(xù)的研究中,我們考慮將職業(yè)教育研究領(lǐng)域主流期刊論文的題錄信息涵蓋進來,以擴大語料庫規(guī)模,并將盡可能采取措施改進術(shù)語自動抽取的方法,以對這些缺憾加以彌補。

[1]中華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局.術(shù)語工作:概念體系的建立(GB/T 19100-2003)[Z].北京:中國標(biāo)準(zhǔn)出版社,2003:1.

[2]國家質(zhì)量技術(shù)監(jiān)督局.術(shù)語工作:原則與方法(GB/T 10112-1999)[Z].北京:中國標(biāo)準(zhǔn)出版社,2000:1.

[3]季培培,鄢小燕,岑詠華.面向領(lǐng)域中文文本信息處理的術(shù)語識別與抽取研究綜述[J].圖書館情報工作,2010(16):124-129.

[4]張二艷.術(shù)語自動抽取技術(shù)研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2009:9,18.

[5]徐國慶.職業(yè)教育原理[M].上海:上海教育出版社,2007:12-14.

[6]教育大辭典編纂委員會.教育大辭典(第3卷)[Z].上海:上海教育出版社,1991:227-341.

[責(zé)任編輯曹穩(wěn)]

國家社會科學(xué)基金“十二五”規(guī)劃2013年度教育學(xué)一般課題“中國現(xiàn)代職業(yè)教育理論體系:概念、范疇與邏輯”(項目編號:BJA130096)

王良,男,天津科技大學(xué)教育發(fā)展研究中心助理研究員,主要研究方向為教育理論與政策;梁卿,男,天津職業(yè)技術(shù)師范大學(xué)副教授,教育學(xué)博士,主要研究方向為職業(yè)教育原理與哲學(xué),職業(yè)教育評價。

G710

A

1674-7747(2016)19-0001-04

猜你喜歡
規(guī)則概念理論
Birdie Cup Coffee豐盛里概念店
堅持理論創(chuàng)新
撐竿跳規(guī)則的制定
神秘的混沌理論
理論創(chuàng)新 引領(lǐng)百年
數(shù)獨的規(guī)則和演變
相關(guān)于撓理論的Baer模
幾樣概念店
學(xué)習(xí)集合概念『四步走』
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
主站蜘蛛池模板: 国产在线观看成人91| 国产毛片久久国产| 在线综合亚洲欧美网站| 91久久国产综合精品女同我| 欧美中文字幕第一页线路一| 日韩av在线直播| 精品人妻无码区在线视频| 亚洲欧美不卡视频| 999精品免费视频| 久久精品丝袜高跟鞋| 亚洲天堂在线免费| 精品国产中文一级毛片在线看| 精品一区二区三区中文字幕| 日本亚洲欧美在线| 色综合久久88| 欧美在线视频不卡第一页| 国产女人在线| 国产精品人人做人人爽人人添| 91视频精品| 亚洲综合精品香蕉久久网| 亚洲欧美自拍视频| 欧美一级大片在线观看| 国产成人AV大片大片在线播放 | www.91中文字幕| 啪啪啪亚洲无码| 久久人体视频| 亚洲无码视频一区二区三区 | 国产成人午夜福利免费无码r| 美女无遮挡拍拍拍免费视频| 亚洲高清国产拍精品26u| 亚洲娇小与黑人巨大交| 99re免费视频| 激情综合激情| 亚洲美女一区二区三区| 国产毛片久久国产| 成人日韩视频| 国产va视频| 久久性妇女精品免费| 一本大道视频精品人妻| 精品久久久久无码| 中文字幕av一区二区三区欲色| 真实国产精品vr专区| 毛片基地视频| 香蕉eeww99国产精选播放| 综合五月天网| 免费看的一级毛片| 91精品网站| 天天综合网色| 国产精品午夜电影| 免费又爽又刺激高潮网址| 国产欧美日韩专区发布| 国产精品毛片一区视频播| 日韩精品毛片| 超碰精品无码一区二区| 国产成年女人特黄特色毛片免| 毛片免费试看| 亚洲成人网在线观看| 国产清纯在线一区二区WWW| 99久久亚洲精品影院| 新SSS无码手机在线观看| 日本亚洲成高清一区二区三区| 国产91色| 日韩在线成年视频人网站观看| 久久精品人人做人人爽| 又爽又大又黄a级毛片在线视频| 亚洲天堂视频网| 午夜高清国产拍精品| 尤物午夜福利视频| 毛片免费高清免费| 久久久久无码国产精品不卡| 一区二区自拍| 国产成人区在线观看视频| 欧美天堂久久| 精品视频一区二区观看| 国产精品无码AV片在线观看播放| 九九热这里只有国产精品| 91精品国产一区| 在线观看免费黄色网址| 精品人妻系列无码专区久久| 久久久精品久久久久三级| 亚洲成人高清无码| 免费在线国产一区二区三区精品|