999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學習與教育教學的思考

2015-01-21 23:23:29劉曉薇
經濟研究導刊 2014年35期
關鍵詞:機器學習數據挖掘

摘 要:分析了目前在人工智能領域主要的機器學習算法所蘊涵的知識性質,指出了機器學習與教育理論存在的相似性,同時根據機器學習的特點討論了對教育的啟發,并且對機器學習在教學教育中的應用提出了建議。

關鍵詞:機器學習;知識復雜性;知識默會性;數據挖掘

中圖分類號:G641 文獻標志碼:A 文章編號:1673-291X(2014)35-0107-04

引言

機器學習(Machine Learning,ML)是一門多領域交叉學科,涉及概率論、模糊論、逼近論、凸論、統計學、算法復雜度理論等多門學科[1]。機器學習是根據生理學、認知科學等對人類學習機理的了解,重新組織已有的知識結構,建立人類學習過程的計算模型或認識模型,發展各種學習訓練理論和學習訓練方法,研究適合各種領域的訓練學習算法并進行理論上的分析,建立面向特定任務和應用的學習系統。當前,在人工智能和模式識別領域影響比較深遠并具有代表性的機器學習算法有樸素的貝葉斯算法、ADABOOST算法、SVM支持向量機算法、神經元網絡及其的改進的深度學習算法。機器學習在工業制造、醫療診斷、數據挖掘,尤其是生物識別,如指紋、人臉、虹膜等方面的應用得到快速發展。如指紋自動識別,已經徹底改變了安防工業的發展方向。這里探討這些成功的機器學習算法對教育教學的借鑒意義。

一、機器學習原理蘊含的知識性質

(一)機器學習與知識的默會性

知識的默會性是相對于顯性知識而言的,是指有些知識只可意會卻不可言傳,在生活中經常使用但卻無法清晰表達的知識,這種知識不能通過語言、文字或其他確定意義的表達方式予以直接傳遞。這種知識具有非邏輯、不清晰、前言語等性質特點。著名的兩種意識的理論是波蘭尼默會認識論的一塊基石,是把握默會認識的結構的基本出發點[2]。“默會知識包括兩種意識,附屬意識(subsidiary awareness)集中意識(focal awareness)。”[3] 認知者把各種細節、關聯線索作為輔助對象整合進集中對象,在附屬意識和集中意識之間建立起動態轉換關系,這就是波蘭尼所理解的默會認識的基本結構。在波蘭尼的理論中,默會認識不僅要依賴于來自認知對象的各種信息,還要依賴于我們,即認知主體本身的諸項機能,還要依賴各種經驗和理論等以往的背景知識,只有在整合了各方面的附屬意識的基礎上,才有可能產生認知的質的飛躍,達到對研究主題的集中認識[4]。

機器學習具有默會知識相類似的初步基本結構,樣本及其提取的特征相當于默會知識的經驗和理論,而學習機器,也就是分類器,相當于認識者,而訓練后的分類器的結構及參數就是集中的認識。在默會知識理論中,波蘭尼認為主體的意向性只有統合了主體的存在,比如以往的個人經驗知識、身體活動等,才有認識的活動過程。他認為,人的認知建構并非先天范疇,而是一種意會的統合能力,包括以往的經驗、知識、情感、價值等因素。而機器學習中,不管是哪種分類器,都需要大量的充分樣本。目前看,還沒有一種分類器能夠適應所有的分類,都需要根據不同的物體,提取最顯著的特征點,然后再根據特征點的特性選擇合適的分類器。比如目前在人臉檢測中成功應用的Adaboost分類器和HAAR特征結合的應用,在其他領域的分類效果就遠不如在人臉檢測中那么成功。

(二)機器學習與知識的復雜性

知識的復雜性包含了3個方面的內容:(1)自然科學知識的復雜性。在現代科學研究的歷史進程中,人們不斷發現,無論是生命的進化、社會的發展以及宇宙的起源,都存在著當前思維模式、科學工具所無法企及和解決的復雜現象。彭家勒指出,“基本現象的簡單性是隱藏在可觀察得到的總現象的復雜性下面,但是這種簡單性就其本身來說只是表面的,它隱藏著極其復雜的機制。”[5] 莫蘭認為,世界的存在不可能是純粹有序的,因為在一個絕對有序性的世界里事物不會有質的突變,也就不會有新的事物產生,但也不可能是絕對無序的,因為一個純粹無序的世界任何事物都將化為虛無,而不可能存在[6]。所以,世界的基本性質是有序和無序的交錯混和,而這正構成了事物“復雜性”的基礎。(2)人文社會的復雜性,人文社會的發展同樣是有序性與無序性相結合,存在理性與非理性相結合的混沌性特征,具有偶發性、不可逆性、非線性等特點[7],使得人文社會科學領域作為無機系統(物質、材料)、有機系統(生物、生命)和社會系統(社會的結構、組織、文化、制度、意識等)的混合系統更具有復雜性的機理和特質。(3)認知過程的復雜性,在認知客體的外部環境一定的前提下,認知客體的描述過程還要受到認知主體諸多因素的影響,比如認知主體的記憶力、認知主體的邏輯分析能力,認知主體的應變能力,認知過程的環境影響因素等,這些因素最終都會對主體的認知能力造成一定程度的影響,從而導致認知困難,即產生復雜性。我們把這種由于主體認知能力自身因素以及環境因素影響所導致的復雜性,叫做主觀復雜性,又叫認知復雜性。認知過程是一種自組織的過程,是一種有序和無序的有機結合。有序是指在認知過程中的意圖、步驟和策略,無序是指認知過程中的偶然性[8]。

機器學習在復雜性方面表現出的特征是:(1)分類器的非線性,許多客觀事物都無法用線性分類器進行分類,當前多數傳統分類、回歸等學習分類方法為淺層結構算法,其局限性在于能夠得到的樣本有限,對復雜函數的表示能力有限,使得針對復雜分類問題其泛化能力受到制約。對于這種情況,SVM(支持向量機)采用的辦法就是首先在低維空間中完成計算,然后通過核函數轉換,將輸入特征空間映射到高維特征空間,在高維特征空間中構造出最優分離超平面,從而把二維平面上無法區分的非線性數據分開[9-10]。深度學習可通過學習一種深層非線性網絡結構,實現復雜函數逼近,表征輸入數據分布式表示,并展現強大的從少數樣本集中學習數據集本質特征的能力[11-12](隱含層多的好處是可以用相對少的參數表示復雜的函數)。(2)分類器的多元性,面對事物的復雜性,采用單一的分類器很難取得實際效果,Adaboost算法針對不同的訓練集訓練同一個單元分類器,即弱分類器(實際應用中不同的訓練集是通過調整每個樣本對應的權重實現的),然后把這些在不同訓練集上得到的分類器通過并聯或串聯的方式集合起來,構成一個更強的分類器,即強分類器。數學理論證明,只要每個弱分類器分類能力比隨機猜測要好(即概率大于0.5),當弱分類器的個數趨向于無窮個數時,強分類器的錯誤率將趨向于零。深度學習的實質,是通過構建具有很多隱含層的神經元網絡機器學習模型,以及海量的訓練數據,來學習訓練更有用的特征,從而最終提升分類或預測的準確性。區別于傳統的淺層神經元網絡學習,深度神經元網絡學習的不同在于:一是強調了神經元網絡模型結構的深度,通常有5層、6層,甚至10層以上的隱含層節點;二是明確突出了每層特征自學習的重要性,通過逐層特征變換,將樣本在原空間的特征表示變換到一個新特征空間,使得分類或預測更加智能化。與之前構造特征的方法相比,利用大數據來學習特征,更能夠刻畫數據的豐富的內在信息和特征。endprint

(三)機器學習與知識的不確定性

知識的不確定性主要指:(1)知識的情境性,即任何知識都具有一定的境域性與條件性,(2)知識具有社會文化的制約性。一個人處于不同的社會、歷史位置上,他認識事物的“視角”以及對同一事物的理解都會有所不同,這種差異不僅構成了個體思維的先決條件,而且深刻影響到個體的思維方式,影響到個體提出問題的類型與方法等。(3)認識理論本身的不確定性,一切理論本質上都是猜測性、試探性或假說性的,理性的批判是獲得知識增長的惟一途徑,只有通過不斷的“猜想、反駁、實證”,這樣才能逐步排除錯誤,接近客觀真理。所有科學知識都是觀察與實驗的結果,有一定的時空限制,并不具有絕對的確定性與必然性,而是具有一定的偶然性、或然性[13-14]。

在面對知識的不確定方面,機器學習或者專家系統提出了的可能性理論、主觀Bayes方法等傳統方法以及粗糙集理論、灰色系統理論、概念圖等新方法。灰色系統理論認為,盡管客觀系統表現復雜,數據離亂,但是這些系統內在隨機變量都是在一定幅值和一定時區內變化的灰色量,一般都具有總體的功能,這些變化的灰色系列變量可以通過某種生成弱化其隨機性,從而顯示其蘊含的內在某種規律。粗糙集利用使用屬性及屬性值的約簡,去除導致事物不可分的冗余信息,從而對數據進行分析和推理,從中發現隱含的知識和潛在的規律。這些算法在語音識別、文本分類、故障診斷、工業監控、醫療等方面獲得了許多成功的應用。

二、機器學習對教育的啟示

從以上分析可看出,機器學習蘊涵了知識學習中的默會性、復雜性以及不確定性等多種特征。本文試圖從機器學習中積累的許多成功經驗來探討這些經驗在教學實踐中的應用。

1.一個高效的分類器,一定要針對具體事物提取最有效的特征點,樣本要廣泛,涵蓋面廣,訓練要充分。這些理論應用對教育教學的啟示是:(1)教師在教學過程中,要試圖找到適合學生理解某種知識的獨特闡釋框架。(2)要擴大學生的閱讀范圍,一個人閱讀的范圍越寬廣,就像訓練的樣本越廣泛,得到的信息量越大一樣,其緘默認識的潛在范圍也就越大,各種類推與觀念以及新的觀察方法就愈可能從中涌現出來,這樣,新理論或新發現的出現機會也就越大。(3)在機器學習中,只有通過訓練,才能發現事物的顯著特征,就像默會知識,學生只有通過實踐的方式或親身參與的方式,去學習和獲取對他們的成長與發展極為重要的個人實踐知識,即隱性的知識,講解式教學設計的再好,即便是啟發式的教學,也不能代替學生的實踐。(4)機器學習不是樣本越多越好,而是充分考慮的泛化能力,對于教育也是一樣,并不是考題越多越好,考題要有代表性,要能夠培養或者啟發舉一反三的能力。

2.現在大熱的深度學習算法已經引起全球各大公司高度重視,香港中文大學發表的論文表明基于深度學習的人臉識別系統的識別率已經超過了人的識別率。深度學習就是多層次的神經元網絡、具有非線性、復雜性的等特點,深度學習和支持向量機帶給我們的啟示:(1)教育革新要加強多學科的協同合作,教學理論的創新,首要的是加強不同層次的、多學科的共同分工協作,廣泛吸取教育學、心理學、哲學等人文社會學科的研究成果,借鑒自然科學的方法論和研究成果。克服狹隘的學科邊界意識,通過多方面、多層次的研究主體的共同參與,形成一種高效運行的教學理論創新共同體。(2)要堅持開放的態度。受多因素、多種變量影響的教學現象,是一個非線性的、動態的、不可逆的教學過程,這就決定教學理論研究不能是封閉的,而應該是開放的、多元的。從知識的復雜性可以看出,企圖從復雜的教學過程中抽象歸納出一個本質的東西,如課程教學的本質、藝術教學的本質、德育教學的本質等類似研究,都易于陷入還原論的思維中,難以得到創新性的觀點。因此,在教學理論和模式的探討中,堅持開放理論價值取向,堅持多元化的思維方式,是教學理論研究創新的內在要求。

3.概率論、模糊算法以及粗糙集理論在機器學習和專家系統的成功應用表明,面對知識的不確定性,我們在教學過程中應著重培養學生批判性的思維能力,培養問題意識、懷疑意識,破除學生對知識的確定性盲目崇拜,使學生意識到人類所有的知識或多或少都是不確定的、未終結的。意識到知識的社會性、實效性、情境性和模糊性,意識到所有的真理都是相對的、有條件的。具體到實踐中,就是要重視模糊分類、價值差異等方法,嚴格限制標準化考試與測驗在整個考試結構的比重成分,鼓勵學生提出自己的獨特見解,大力倡導以對話、討論或自主探究為基礎的互動教學方式,學會以開放的、批判的眼光看待知識,鼓勵學生對問題反應與解釋的多樣化、異質化,而不是同一化,這樣才能培養更有創造力人才。

三、機器學習在教育教學中的應用

機器學習經驗應用于教育,或者將機器學習當成工具應用于教育教學,側重在要求教育的開放性、多元性、非線性。然而在信息社會跨向大數據時代,盲目追求開放性的松散結構的教學教育方法,可能與教學教育的初衷背道而馳。因此,要秉承嚴謹的科學態度,建立積極有效的科學評估系統和數學模型。而目前基于開放型網絡的教育還是停留在基于數據(包括多媒體、文字)共享的教學方法上,如當前火爆的翻轉課堂、MOOC(大規模開放在線課程)主要還是側重視頻共享的信息積累的基礎上,這種類型的在線教育本身很難改變學習的本質,在這場教育革命的浪潮中,由在線教育引發的教育由數據共享到過程數據行為的變化監控(教育環境、實驗場景、時空變化、學習變化、教育管理變化),才有可能引起教育改革的質的變化。 通過數據挖掘和機器學習,分析每個學生的學習行為、興趣以及老師的教學行為基礎上,通過數學建模找出適合每個學生的學習內容和教學方式,讓社會科學領域的發展和研究從宏觀群體逐漸走向微觀個體,讓追蹤每一個人的數據成為可能,從而讓研究每一個個體成為可能,成為未來教育發展的主要方向。

1.通過數據實時反饋和機器學習來研究適合學生的學習模式,及時修正學生的課程內容和教學模式。大數據與傳統數據的本質區別在于數據的過程性、個性化,比如我們現在不僅僅通過測驗了解學生階段性的學習成果,并且通過在線系統檢測到學生在學習過程中花費的時間、理解程度、參與度、對知識點的偏好等實時數據;如根據學生鼠標停留時間和點擊次數來判別學生有沒有回頭復習和主要問題處理,統計學生在網上提問的次數和參與討論的多少來判斷學生學習的積極性并進行誘導和評價,而不是基于自己的教學經驗,夾雜主觀因素來分析學生的共同點、學生的學習偏好、學習遇到的難題等。只要通過分析整合學習的行為記錄,就能輕而易舉得到學生學習過程中的規律,結合更詳細的學生背景和操作細節,我們還能觀測到不同學生族群在學習上更多的相關元素。機器學習和數據挖掘能夠分析出同樣是80分的學生,哪個是通過邏輯思維能力得出,哪個是依靠良好的記憶力獲得的,然后我們根據這些反饋信息找出學生能夠接受的教學模式。對于教育研究者來說,我們將比任何時候都更接近發現真正的學生,以獲得更進一步改善的機會。endprint

2.通過機器學習和數據分析預測教學模式的效果,通過分析教師發表的論文、選用的教材、制作的課件、參與的課題、學生的成績、學生對老師的評價等各種信息的評價分析,可以預測出當前老師采用的教學模式可能產生的影響。老師的一言一行,從課題到教室,出考題、改考卷、引導討論、回答學生問題、進行個別輔導等等,都可留下重要且值得分析的數據。這些種種數據的收集,在交叉比對學生的學習與考試記錄,從而能提供教育管理者及一線老師許多有用的信息。比如說,老師在學習平臺上改考卷、提供評語的方式,都有可能與改進學習的成績緊密相關。同時,參考同類型教學資源以及授課的環境和實際需求,利用大數據的分析模型,通過機器學習和數據挖掘,可以找到學生、老師、教學模式之間最佳的匹配方式。這樣,既可避免無效和負面的教學方法造成的資源浪費,更能夠增加老師教學的能力和效率。

3.通過機器學習和專家系統、數據挖掘等算法來處理海量數據帶來的學習困擾,蘇迦特分析,只有三種最基本的東西在今后的大數據時代是學生用的到和必須學的東西:“第一是閱讀,第二是搜索,第三是辨別真偽”,在信息泛濫的社會,學生和老師很難抵擋各種信息的誘惑,怎么處理好有用信息獲取和個人隱私之間的平衡,是困擾當前互聯網開發教育教學面臨的比較重要的問題。大數據未被妥善處理會對用戶的隱私造成極大的侵害,同時偽造或刻意制造的數據,以及在傳播中被歪曲的信息,往往會導致錯誤的結論,誘導分析者得出不客觀的結論。基于目前很多專家系統,通過各種知識信息的處理方法再經過學習和訓練,我們可以去除很多不真實的數據,自動分析信息的價值,并自動提供推薦,從而幫助提供給我們最有價值的數據,甚至直接幫我們設定好教學模型和各種教學素材。

結語

機器學習一直是科學家在研究人類思考、決策的過程中總結的多元化、綜合性知識的成功應用,而這些人工智能領域內的成功應用對我們當前的教育教學也帶來深刻的啟示作用。知識爆炸性的成長、多學科的交叉、新媒體的應用,對我們的教育及教育工作者也是全新的挑戰,大數據的到來以及機器學習、數據挖掘對當前教育理念的更新將是革命性的。人與機器的主流社會關系也將產生質的改變,轉向人與數據之間的關系。今后社會的競爭的核心將是服務和創新。從大數據挖掘中成功應用的機器學習算法原理中來反思當前的教育理念,同時將機器學習用來分析當前的海量數據,及時反饋更新我們的教學模式,不失為一種新的嘗試和啟示。

參考文獻:

[1] Bishop,C.M.模式識別與機器學習,Springer?ISBN 978-0-387-31073-2,(2006).

[2] Michael Polanyi.Knowing and Being,The University of Chicago Press,Chicago,1969:138.

[3] Michael Polanyi.Personal knowledge,Routledge,London,1958:70-78.

[4] Michael Polanyi.Study of Man,The University of Chicago Press,Chicago,1958:25.

[5] 普里戈金.從混沌到有序[M].上海:上海譯文出版社,1987:26.

[6] 陳一壯.埃德加·莫蘭的“復雜方法”思想及其在教育領域內的體現[J].教育科學,2004,(4).

[7] 劉曉薇,神經元學說對教育理論研究的啟示[J].教育學術期刊,2009,(10).

[8] 普利高津,等.從混沌到有序[M].曾慶宏,等,譯.上海:上海譯文出版社,1987:10.

[9] Corinna Cortes and V.Vapnik,Support-Vector Networks,Machine Learning,20,1995.

[10] Nello Cristianini and John Shawe-Taylor.An Introduction to Support Vector Machines and other kernel-based learning methods.

Cambridge University Press,2000.ISBN 0-521-78019-5 .

[11] Hinton,G.E.,Osindero,S.and Teh,Y.,A fast learning algorithm for deep belief netsNeural Computation 18:1527-1554,2006.

[12] Yoshua Bengio,Pascal Lamblin,Dan Popovici and Hugo Larochelle,Greedy Layer-Wise Training of Deep Networks,in J.Platt et al.

(Eds),Advances in Neural Information Processing Systems 19 (NIPS 2006),pp.153-160,MIT Press,2007.

[13] 波普爾(Popper K·R·).客觀知識[M].舒煒光,等,譯.上海:上海譯文出版社,1987.

[14] 波珀(Popper K·R·).科學發現的邏輯[M].查汝強,邱仁宗,譯.北京:科學出版社,1986.

Thinking about machine learning and education teaching

LIU Xiao-wei

(School of mathematics and computer science,Jiangxi Science & Technology Normal college,Nanchang 330013,China)

Abstract:Analysis of the current in the field of artificial intelligence machine learning algorithms mainly contained the nature of knowledge,has pointed out the similarities of the machine learning and education theory,at the same time,according to the characteristics of machine learning is discussed enlightenment to education,and suggests the application in education and teaching of machine learning.

Key words:machine learning;knowledge complexity;knowledge is tacit;data mining

[責任編輯 仲 琪]endprint

猜你喜歡
機器學習數據挖掘
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
基于詞典與機器學習的中文微博情感分析
數據挖掘技術在中醫診療數據分析中的應用
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
機器學習理論在高中自主學習中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 在线人成精品免费视频| 精品国产aⅴ一区二区三区| 国产高清无码麻豆精品| www亚洲天堂| 中文字幕 欧美日韩| 色婷婷综合在线| 亚洲大尺度在线| 女人18毛片一级毛片在线| 99久久免费精品特色大片| 久久精品无码一区二区国产区| 国产美女自慰在线观看| 免费无遮挡AV| 国产区福利小视频在线观看尤物| 国产十八禁在线观看免费| 免费看的一级毛片| 国产精欧美一区二区三区| 免费不卡视频| 人妻无码一区二区视频| 欧美色图久久| 欧美丝袜高跟鞋一区二区 | 亚洲天堂日韩av电影| 久热中文字幕在线| aa级毛片毛片免费观看久| 亚洲日韩AV无码一区二区三区人| 四虎永久免费网站| 天天综合色天天综合网| 欧美日韩在线国产| 亚洲日韩精品无码专区97| 国产高清无码麻豆精品| 日本色综合网| 久久毛片基地| 欧美黑人欧美精品刺激| 97人妻精品专区久久久久| 亚洲码在线中文在线观看| 中国精品自拍| 亚洲国产综合自在线另类| 一级黄色欧美| 国产精品嫩草影院av| 亚洲免费黄色网| 波多野结衣爽到高潮漏水大喷| 天天色天天综合网| 精品人妻一区二区三区蜜桃AⅤ| 特级毛片免费视频| 日本成人精品视频| 99精品免费在线| 免费国产不卡午夜福在线观看| 试看120秒男女啪啪免费| 高清不卡一区二区三区香蕉| 久久亚洲精少妇毛片午夜无码 | 91小视频在线观看| a级毛片网| 99福利视频导航| 国产三级韩国三级理| 五月婷婷伊人网| 亚洲美女高潮久久久久久久| 婷婷成人综合| 亚洲综合日韩精品| 国产精品微拍| 麻豆AV网站免费进入| 欧美一级在线看| 激情综合网激情综合| 欧美日韩精品一区二区视频| 国产日韩欧美视频| 国内精品伊人久久久久7777人| 色综合久久久久8天国| 国产精品爆乳99久久| 国产午夜无码片在线观看网站| 91午夜福利在线观看| 免费国产一级 片内射老| 成人福利在线视频免费观看| 2021精品国产自在现线看| 四虎亚洲国产成人久久精品| 蜜桃臀无码内射一区二区三区| 国产综合在线观看视频| 18禁黄无遮挡免费动漫网站| 在线毛片免费| 色精品视频| 5555国产在线观看| 国产视频只有无码精品| 天堂亚洲网| 国产在线观看第二页| 国产精品久久久久久久伊一|