999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向計算機軟件工程的機器學習技術研析

2023-08-26 19:27:39吳子玥
電腦知識與技術 2023年21期
關鍵詞:機器學習技術研究

吳子玥

關鍵詞:機器學習;計算機軟件工程;技術;研究

中圖分類號:TP311 文獻標識碼:A

文章編號:1009-3044(2023)21-0055-03

0 引言

計算機軟件工程是一門快速發展的學科,隨著人工智能、云計算、大數據等技術的快速發展,軟件工程也將不斷地向著智能化、自動化和高效化的方向發展??梢哉f現代化技術的應用,為計算機軟件工程的發展注入了新的動力,也為軟件工程帶來了更多的機遇和挑戰。

1 面向計算機軟件工程的機器學習技術概述

1.1 機器學習概念

基于人工智能技術下的機器學習技術主要是利用算法、統計模型來處理計算機系統內部數據,并在數據中學習與改進,且機器學習無須顯式進行編程。簡言之,機器學習是利用資料和運算法則,來訓練電腦系統,讓它能自動辨識,分類,預測,做出決定。目前在計算機軟件工程現代化技術的發展下,機器學習在自然語言處理、圖形識別以及風險管理等方面運用頻繁。

在此,筆者提出了簡單的機器學習應用案例:在電子郵件自動分類郵件,可將垃圾郵件放入垃圾郵件文件夾,將重要郵件放入主文件夾,在此通過使用機器學習算法訓練模型,使其自動分類郵件。訓練模型的過程通常涉及輸入一組已經分類好的郵件數據,讓算法從這些數據中學習如何分類郵件。一旦模型被訓練好,用戶則可使用其來自動分類新的郵件,將其放入適當的文件夾中。該方式屬于常見的機器學習應用場景,但需明確的是機器學習可以應用于許多領域,例如推薦系統、自然語言處理、預測和決策等。

1.2 機器學習技術的分類

機器學習技術屬于人工智能重要的分支,該分支理論主要可包含的內容為:

1)機器學習(傳統):包括線性回歸、Logistic回歸、決策樹、支持向量機、貝葉斯模型、神經網絡等。

2)深度學習:以分析數據為基礎的運算法則。

3)強化學習:重點在于在所處的情境下如何產生最大的預期利益,與有指導的標準學習的不同之處是:其不要求產生正確的輸入/輸出對,或者要求對亞最優的行為進行準確的修正。加強學習更多地關注網上計劃,必須在(未被開發的領域)與(已有的知識)之間尋求一種平衡。

在現實生活中,機器學習技術主要體現在以下幾個部分:計算機視覺(CV) :讓機器了解世界;自然語言處理(NLP) :使機器能夠閱讀文本;語音識別(SpeechRecognition) :讓機器聽懂的關系;數據挖掘(Data Min?ing):在數據之間找到關聯。

2 面向計算機軟件工程的機器學習技術改進模型策略

2.1 比較不同算法

在機器學習技術中,主要的學習改進模型包括比較不同算法,該算法可針對提高模型性能,并由此產生不用的算法以及不同的類型數據集。對多種算法進行對比,可以很容易地改善模型的性能,例如:

1) 線性回歸:線性回歸是一種用于解決回歸問題的算法。它假設自變量和因變量之間存在線性關系,并嘗試通過最小化預測值與真實值之間的差異來擬合一條直線。線性回歸簡單易懂,并且在數據集較小且特征數量較少的情況下表現良好。

2) 支持向量機:支持向量機是一種常用的分類和回歸算法,它嘗試在數據集中找到最大間隔分離超平面,以最大化分類的準確性。支持向量機可以處理高維數據集,并且在數據集較小且特征數量較多的情況下表現良好。

3) 神經網絡:神經網絡是模擬人類大腦中神經元的結構而設計的一種算法。神經網絡因其對圖像、語音等高維數據的描述能力而被廣泛應用。但是,人工神經網絡對算法的要求很高,對算法的訓練也要求很高。

4) 決策樹:決策樹是一種用于分類與回歸的非線性算法。該方法對數據進行連續的分類器,形成了一個樹形結構。決策樹是一種簡單易懂、可視化的方法,但是它的適合度較高,需對其進行處理。

5) 邏輯回歸:Logistic回歸作為一種線性模型被廣泛應用于分類問題。它輸出一個代表某一類發生的可能性的數值。Logistic回歸方法對二級分類有很好的效果,但是對于非線性可分性的資料,其不適用于非線性可分的數據。

在選擇機器學習算法時,需要考慮數據集的大小、特征數量、問題類型和算法的復雜度等因素,并根據這些因素選擇最合適的算法來改進模型。

2.2 超參數調優

超參數調優是指,在機器學習模型中,主要基于機器學習開始部分,并在開始部分選擇出一些參數,而此階段被選擇的參數為超參數。如,決策樹所能容許的最大深度,隨機森林所能容納的樹木數目等。超量參數對學習效果有顯著影響??梢哉f通過超參數調優的機器學習可使其在學習過程中快速獲得有關的結果。以下是一些常用的超參數調優方法:

1) 貝葉斯優化:貝葉斯最優算法是以概率為基礎的一種全局最優算法。在此基礎上,利用貝葉斯優化方法,對目標函數建立概率模型,提高求解效率,提高求解效率。

2) 遺傳算法:遺傳算法是模擬生物演化的一種最優解。該方法利用隨機變異、交叉和選擇等運算,能夠在大規模的超參空間內尋找到最優解。

2.3 用召回率換精度

在分類問題上,一般從兩個方面來評價:準確度和回歸率。因所問的問題而異,一般會需要召回率和精確度進行優化。對于這兩項衡量標準,筆者提出了快速修正模型的辦法。該方法通過對標簽分類的可能性進行預測,從而可以通過對可能性門限的調節來實現對標簽分類的修正。

例如,若我們能建立一種模式,預測泰坦尼克號失事事件中,旅客能否幸存,則可預測其存活或死去的概率。當發生事故的可能性大于50%時,模型將預測乘客會幸存,反之乘客死亡。若要提高準確度,則可增大概率門限。在此該模型將預測較少的乘客幸存,但會更精確。

2.4 刪除數據泄露(data leakage) 特征

如上所述,有一種情況為該模型表現得“很好”。但當它們被部署到產品中時,性能就會下降。這一問題的起因可能在于“數據泄露”,而這正是模型訓練中普遍存在的缺陷。所謂“數據泄露”,就是利用某些特性,這些特性在目標變量出現后,并包含目標變量的信息。但實際情況的預測則不會存在數據泄露的特性[1]。

如,為預測用戶會不會打開一封郵件,那么這個特性可以包含他會不會點擊一封郵件。模型一旦看到用戶點擊了它,那么就預測用戶 100% 會打開它。然而在現實生活中,無法知道是否有人在打開電子郵件之前沒有點擊它,在此利用 SHAP值來測試數據泄露,并利用 SHAP庫來繪制曲線圖,來展示哪些特性對模型的影響最大。若特性和目標變量的相關性具有很高的權重時因此,這些特征會出現數據泄露特征,在此可把這些特征從訓練樣本中剔除掉。

3 機器學習中的雙層規劃模型與算法

雙層規劃(Bi-level Programs) 是近年來發展起來的一種有效的機器學習方法。不同之處在于,可以用層次結構來描述學習模型。將雙層規劃引入到機器學習領域具體研究內容包括:面向機器學習中的復雜問題的雙層規劃模型構建思想;基于雙層規劃的模型構建方法研究等。

3.1 基于元學習的小樣本圖像分類雙層規劃模型

元學習期望能夠幫助模型獲得“學會學習”的能力,從而能夠根據所獲得的“知識”迅速地學習新的任務。深度學習作為一種新興的機器學習方法,其被引入到機器學習中,是為了更好地實現人工智能這一初衷。目前深度學習已有很多的研究成果[2]。但是,要想成功地使用深度學習算法,必須依靠大量的訓練數據,所以其存在著明顯的缺陷。例如,在小樣本集上(圖1) ,深度學習算法很容易陷入過擬合的狀態,從而導致其不能進行訓練;另外,深度學習算法無法直接使用現有的“知識”,需從頭完成新的訓練模型。元學習是指從多個相關任務中獲取“經驗”,并將這些“經驗”用于提升新任務中的學習效果的一種新方法?;谠獙W習算法可模擬出人類的學習能力,在此其可將所學到的東西歸納成多個概念,并從中學習。可以說,元學習可以產生一種可以完成多種任務的通用人工智能模型。元學習的這個特性使其在學習過程中具有很多顯著的優勢,如,它能更好地使用數據,使其在小樣本學習任務中具有更好的學習效果;對于內部差異較大或者數量較多的問題,能夠迅速地對新問題進行調整,再次達到了提升學習效率與質量的效果[3]。

3.2 超參數優化雙層規劃模型

超參數優化是機器學習中的經典問題。在機器學習的算法中,包含了很多參數,其中一些參數可基于數據內學習得到,如常見的神經網絡權重以及支持向量機中的支持向量等,這些成為模型參數,但一部分參數無法依靠數據學習得出,其中包括學習速率、批量樣本數等,這些參數被稱作超參數。這兩類參數之間最大的差別在于,它們是否需要利用數據來進行估計和學習(圖2) 。也就是說,模型參數是從數據中自動學習出來的,而超參數則是事先手工設置的,并對模型的更高級別進行了定義[4]。

3.3 基于梯度的高效機器學習

正如前面提到的,雙層規劃模型雖然具有很強的建模能力,但是其上、下兩層變量間的相依性使得雙層規劃問題的求解非常困難。這主要是因為它存在著一些不良的特性,例如:非光滑、奇異、有間斷等,使得傳統的雙層規劃方法難以適用于實際問題[5]。

通過筆者所查閱的大量資料表明,在最優領域內傳統雙層規劃算法一般采用 KKT條件對底層問題進行重新描述,并將其轉化為平衡約束的二層規劃問題。但是,引入乘子會給問題的分析與求解帶來很多困難。尤其是對于具有海量數據規模的機器學習領域涌現的雙層規劃問題,如果引入了太多的乘子,會對計算性能造成很大的影響,這就導致了均衡約束的數學規劃問題再定式方法在復雜的機器學習任務中很難得到有效的應用[6]。另外,還可以通過交互算法,根據較低層次的最優值函數或較低層次的最優性條件和解決方法進行學習,如圖3。

4 面向計算機軟件工程的機器學習技術模型應用場景——算法交易中的應用

4.1 機器學習和算法交易的結合

機器學習是人工智能領域的熱點方向之一機器學習在語言、文本以及自動化方面均取得了一定商業成就。自20世紀30年代以來,機器學習已形成了一個相對獨立且成熟的研究領域,到現在為止,已經有一百多種算法被提出。在傳統的時間序列預測中,一般使用自回歸移動平均模型、自回歸模型等方法來處理線性時間序列,對于非線性的時間序列,業界采用的是移動平均模型(Moving-Average, MA),然而,在金融時間序列的復雜性和高級結構中,還需合理分析金融時間序列的不確定性與穩定性,同時業主也可將AR和MA模型進行結合,由此提高其線性和非線性的預測效果。在面對受多種復雜因素影響的時序數據時,一般情況下都會表現出一種非線性的變化規律,與以上提到的傳統模型方法相比,在機器學習下可針對非線性時間序列進行預測,且目前主流的神經網絡、決策樹、貝葉斯、隨機森林等方法,都與此相關。在這一領域,最先進的方法,則用組合模型來進行預測。將傳統建模與機器學習相結合,將兩者有機地融合在一起,以提升預測的準確率。例如:使用近鄰傳播(AP) 算法和支持向量機(SVM) 算法,對具有同樣變化模式的資料進行相關性分析,在此基礎上,將所獲得的更多信息輸入支持向量機,由此產生良好的預測結果[7]。

4.2 關于機器學習的可解釋性

人工智能在其實質上仍然是一種樣本匹配,結合智能化分析最近幾年,學術界已經提出了很多機器學習的模型解釋方法。其中,ICE、PDP、SDT、LIME、SHAP等都是打開機器學習模型黑箱的強有力工具。由于機器學習算法的高復雜度,以及較低的可解釋性,很多情況下無法被人腦理解掌握。資管行業的特殊性在于,針對資產管理與交易來說,需明確投資策略或交易風險內容,在此階段中所產生的模型可解釋性也較為突出關鍵,另外,交易算法還需要符合 Mi?FID II (歐盟最新金融工具市場指南)等規定和“最優實施”的思想。所以,在編制算法時,必須要考慮到“不斷發展的市場條件和結構”“管制限制”和“顧客的多目標和多偏好”等內容[8]。

5 結束語

如上主要分析了計算機軟件工程機器學習算法、應用場景,通過研究可以看出,機器學習分類算法在現代社會中有著廣泛的應用,它能夠幫助人們更好地理解和分析復雜的數據。通過對不同類型的數據進行分類,我們可以更好地了解數據的特征和規律,為后續的決策提供有力的支持。對此,我們有理由相信,在各方的共同努力下,計算機軟件工程將會不斷地向著更加智能化、自動化和高效化的方向發展,最終為人們的生活和工作帶來更多的便利和創新。

猜你喜歡
機器學習技術研究
FMS與YBT相關性的實證研究
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
淺談鋼筋混凝土結構建筑應用外包粘鋼加固技術
探討電力系統中配網自動化技術
科技視界(2016年21期)2016-10-17 20:00:58
移動應用系統開發
科技視界(2016年21期)2016-10-17 19:38:30
北京市中小企業優化升級
商(2016年27期)2016-10-17 04:13:28
主站蜘蛛池模板: 久久精品国产国语对白| 亚洲成人免费在线| 91久久偷偷做嫩草影院电| 欧美天堂久久| 伦伦影院精品一区| 国产成人精品免费av| 人人妻人人澡人人爽欧美一区| 精品午夜国产福利观看| 亚洲av成人无码网站在线观看| 韩国福利一区| 欧美中文字幕一区| 欧美激情视频一区| 亚洲欧美日韩另类在线一| 国产主播一区二区三区| 亚洲香蕉伊综合在人在线| 国产国拍精品视频免费看| 国产91特黄特色A级毛片| 高清久久精品亚洲日韩Av| 欧美激情福利| 激情网址在线观看| 动漫精品中文字幕无码| 高清免费毛片| 中文字幕在线一区二区在线| 亚洲欧洲日本在线| 67194成是人免费无码| 一级毛片中文字幕| 精品三级网站| 狠狠操夜夜爽| 精品一区二区三区无码视频无码| 香蕉久久国产超碰青草| av无码一区二区三区在线| 无码日韩人妻精品久久蜜桃| 中文字幕精品一区二区三区视频 | 欧美日韩中文国产va另类| 伊人91视频| 色婷婷综合激情视频免费看| 巨熟乳波霸若妻中文观看免费| 永久免费无码日韩视频| 人妻一区二区三区无码精品一区 | 伊人精品成人久久综合| 99久久精品免费视频| 2024av在线无码中文最新| 亚洲另类第一页| 日本高清有码人妻| 99久久国产综合精品女同| 日本精品视频一区二区| a亚洲视频| 国产91色| 国产免费人成视频网| 国产午夜无码专区喷水| 久久精品人妻中文视频| 亚洲av综合网| 亚洲国产综合自在线另类| 九九久久精品国产av片囯产区| 亚洲综合久久成人AV| 色亚洲成人| 免费无码网站| 五月婷婷丁香色| 九九线精品视频在线观看| 亚洲美女久久| 女人一级毛片| 国产精品极品美女自在线网站| 色婷婷在线影院| 国产成人精品18| 久久久久国产精品免费免费不卡| 亚洲色欲色欲www网| 欧美天天干| AV天堂资源福利在线观看| 伊人色婷婷| 国产精品天干天干在线观看 | 亚洲 日韩 激情 无码 中出| 国产理论精品| 看av免费毛片手机播放| 久久青草视频| 亚洲最新网址| 亚洲无码精品在线播放| 国产精品短篇二区| 操美女免费网站| 久久综合国产乱子免费| 国产三级视频网站| 午夜不卡视频| 久久婷婷人人澡人人爱91|