999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的航班四維軌跡預測

2020-06-11 09:26:44王凱馮翔
電子技術與軟件工程 2020年1期
關鍵詞:模型

文/王凱 馮翔

(中國民用航空中南地區空中交通管理局通信網絡中心 廣東省廣州市 510405)

1 前言

隨著云計算、大數據等技術的發展,海量數據的存儲和計算已經不再是制約數據分析和處理的主要因素了。據統計,中國民用航空中南地區空管局及下屬十二個分局站所管轄的航班量每日約為10000 多架次,其中中南地區起降的航班約為5000 架次。而每個航班所產生的航班軌跡數據每日約為幾百GB。以往由于硬件和技術的制約,航班歷史飛行軌跡數據未能得到充分的利用,隨著技術的發展,尤其是大數據處理技術的發展,使得海量的歷史航班軌跡數據的分析成為可能。

機器學習是當今發展最熱門的技術之一,它屬于計算機科學與統計學的交叉學科,是實現人工智能的核心。在近些年被廣泛運用于各大領域,解決了許多以前無法解決的現實問題。機器學習可通過對算法的優化,在大量訓練數據集中選擇最接近最優解的算法模型,模型建立后,可通過模型對實際中可能發生的結果進行預測。例如機器學習中的監督學習可通過大量數據集的訓練完成對圖像內容的識別。通過機器學習對歷史軌跡數據的分析,能完成以前想做而做不了的事情,對實際工作具有重要意義。

近年來,與軌跡相關的技術陸續被提出與應用,例如軌跡預處理、軌跡數據管理等。國內外學者在軌跡預測研究方面均取得了相應的成果。如陳志杰[1]將航班飛行過程分為多個飛行階段,通過在各個階段建立運動學和動力學方程并求解完成航班軌跡的預測。張軍峰等[2]提出一種基于飛行基礎性能參數(Base of Aircraft Data, BADA)和航空器意圖的航班軌跡預測方法。Hansen[3]等提出基于混合系統理論對航班爬升階段軌跡預測方法,并利用協方差自適應調整的進化策略對模型進行優化。雖然這些方法都取得了一定研究成果,但是存在飛行過程階段并非理想模型、飛機性能參數選擇偏差大等因素的局限,從而導致預測結果不太理想。本文提出了基于歷史飛行軌跡和機器學習的航班軌跡預測算法,歷史軌跡是考慮了飛行過程中真實環境因素產生的,已被證明是可行高效的飛行路徑。提出算法的主要思想是以K 臨近算法的數學理論為基礎。并通過提取的特征值和真實軌跡數據進行模型訓練,并比較多個K 參數下的模型準確度,得到最優參數模型。與傳統方法相比,基于真實軌跡數據能得到較高的預測精度。

2 大數據平臺介紹

目前大數據的處理平臺主要分為兩類,一類是由Alibaba、Amazon 等云服務提供商提供的大數據處理服務,如Alibaba 的MaxCompute,Amazon 的EMR服務。另一類是基于Apache 基金會的頂級開源項目Hadoop 生態提供的大數據處理組件,例如MapReduce、Hive、Pig 等。

圖1:大數據處理平臺網絡圖

圖2:KNN 算法示圖

圖3:歷史軌跡數據結構圖

本文所使用的大數據處理平臺是Apache 基金會提供的基于Hadoop 生態的大數據處理組件。其中底層數據存儲采用HDFS(Hadoop Distributed File System),它是一種分布式的文件存儲系統,主從結構,其中主節點(NameNode)主要用于記錄每個文件所在的從節點的信息。從節點(DataNode)是實際保存數據文件的位置。它將大文件以128M 為間隔分割成多個數據塊(Block)存儲在多個從節點上,從而提高數據的訪問速度,然后利用數據塊的冗余度提高數據的高可用性,默認冗余數是3。任務調度采用Yarn平臺。它是一種分布式的任務調度系統,也是主從結構,主節點(ResourceManager)作用是接收客戶端的任務請求和資源的分配。從節點(NodeManager)主要是得到資源并執行相應的任務。數據庫采用HBase,它是基于HDFS 之上的列存儲的數據庫產品,相比傳統RDBMS,缺點在于它不支持事務和索引,優點在于它基于廉價的硬件設備能通過集群擴展而存儲大量數據(TB、PB 級)且獲得較好的訪問速率,它主要由行鍵(Rowkey)和列族(CulumnFamily)組成。行鍵相當于一條數據的唯一標識,列族可由多個屬性值組成,用于存放實際需要存放的信息。

表1:不同K 值下預測值和實際值的誤差比例

表2:各航路點預測值和實際值誤差對比

本文采用四臺CentOS7操作系統,內存8GB,CPU 為2*2GHz,硬盤100G,搭建一套全分布式的大數據處理平臺。其主要結構如圖1 所示。

3 模型介紹

機器學習是一門多領域交叉學科,主要用于通過計算手段,基于大量數據構建數據模型,利用經驗來改善系統自身的性能。目前機器學習按學習的方式分類主要包括監督學習、非監督學習、半監督學習、強化學習。按算法類似性分為:回歸算法、基于示例的算法、決策樹算法、神經網絡算法、深度學習算法等。

本文將航跡預測看作一個分類問題。因為對某個特定航班的航跡的預測,可通過將此航班的部分特征提取出來,從歷史航跡中找到與此航班特征最相似的航跡數據,并將此航跡數據近似看為此航班的飛行軌跡。具體做法是選擇一批樣本數據,提取與軌跡相關的重要特征值,建立特征值與實際結果的數學模型,通過模型,將特征值將新數據與樣本數據進行計算,找到歐式距離最近的K 個值。

其公式表示如下:

目前提取的主要特征值為航路點間的距離、飛行的起始高度、飛行的起始速度,預測的值為航路點間的飛行時間、下一個航路的點速度、下一個航路點的高度。即每一次輸入數據代入樣本空間進行計算,選擇距離最近的分類,如圖2 所示。

從歷史中找到最接近的K 個軌跡數據,并將K 個軌跡數據劃分同一類。分類的多少并不與模型的正確率成正比關系,正確率主要跟實際的情況和特征值的選擇有關。通常的做法是取n 個K 值,進行訓練,將正確率最大的K 值設為模型最優參數。或者加大訓練集,不斷進行調優,從而得到準確率最高的參數模型。

4 設計與實現

傳統的機器學習任務一般流程為:獲取數據、數據預處理、訓練模型、模型評估、預測和分類幾個步驟。此部分也將從以上幾個步驟介紹模型的實現。

4.1 數據預處理及導入

本文的數據集為航班信息處理系統所記錄的航班歷史過點時間數據。主要包括航班的起飛時間、落地時間以及航班通過重要航路點的時間。首先通過航路點的名稱關聯到航路點信息表,找到航路點的經緯度信息。根據經緯度信息,可使用SQL SERVER 自帶的Geography 對象及其內置函數計算出航路點之間的距離(單位:米)。通過過航路點的實際時間差計算出實際飛越兩點之間的時間差(單位:秒)。對無效數據(無實際過點時間、繞飛等情況)進行過濾處理。處理完成后的數據結構如圖3 所示。

其中第一列為記錄的為數據量序號、第二列為航班的ID,第三列及第四列分別為起飛機場和落地機場、第五列為飛行執行時間,第六列、第七列、第八列分別為飛行的高度(m)、速度(km/h)、距離(km)。第九列、第十列、第十一列分別是前一個航路點到下一個航路點的飛行時間、實際飛行高度和實際飛行速度。

圖4:訓練數據預測值與訓練數據實際值時間差

圖5:訓練數據預測值與訓練數據實際值高度差

圖6:訓練數據預測值與訓練數據實際值高度差

數據預處理完成后,通過Sqoop 工具,將數據導入到Hbase 中。使用Sqoop 的好處是可將數據導入轉換成一個MapReduce 任務,調用Hadoop的集群底層任務調度系統將數據保存在各個子節點中。相比較其他ETL 工具,Sqoop 對Hadoop 生態具有良好的兼容性,并且MapReduce 任務無需考慮數據量大小問題,比較適合數據量較大的應用場景。

4.2 模型訓練

本文采用了基于python 的機器學習庫Sickit-Learn,它支持包括分類、回歸、聚類、降維四大機器學習算法,還包括了特征提取、數據處理、模型評估三大模塊。本文采用了2019年10月中南區域所有航班的歷史過點時間。經過數據的預處理后的有效數據一共二百多萬條數據。采用Python 的數據分析基礎包Numpy 及Pandas將數據轉換成數組對象,將其中80%作為訓練數據,將20%作為預測數據。在訓練模型中將參數特征值中距離、起始高度、起始速度作為輸入數組,將下一點的飛行時間、高度、速度作為輸出結果進行訓練。然后通過取不同的K 值來建立不同的訓練模型。比較在不同的K 值下訓練模型的準確率,將比較結果通過Python 的matplotlib 庫進行圖形化展示。

4.3 模型評估

通過不同K 值訓練出的模型,將訓練數據的輸入值通過模型可算出的預測值,然后將預測值與訓練數據的實際輸出值進行比較,將比較的誤差值作為模型的評估標準,當K=1 時,其預測的飛行時間、飛行高度、飛行速度與實際的飛行時間、飛行高度、飛行速度誤差值(飛行時長30s 內、飛行高度100m 內、飛行速度50km/h內)比例分別如圖4、圖5、圖6 所示。

同理分別算出K 取值1 到10 的訓練數據的預測值和實際值的,以及預測數值與預測數值的實際值的比較結果表1 所示。

通過訓練值和預測值的結果來看當K=1 時,預測的時間、距離、高度準確率最高,即可知對于此數據集,K=1 是最優參數模型。

4.4 模型預測

基于K=1 模型,從歷史數據中選擇一條完整航跡,將實際飛行的時長、高度、速度分別表示為實際值,將初始點與下一點的距離、高度、速度作為初始輸入值,即可得到下一點的預測飛行時長、高度值、速度值,依次計算可得到整條航跡數據如表2 所示。

由表2 可知,航班在此航路段的飛行總時長為2004s,預測結果為2186s,預測與實際飛行總時長相差182s。在速度和高度的對比中,高度誤差最大達到了1074 米和74Km/h,出現這種情況的原因可能與選擇的訓練集有關,在數據集中與實際預測的輸入值得特征值相差較大的情況下,部分預測值可能偏差也較大。

5 總結與展望

航班軌跡預測是空中交通管理系統的基礎技術,針對現有航班計劃軌跡預測方法的不足,在已有的歷史軌跡數據的基礎上,提出了一種基于歷史軌跡數據和機器學習方法的軌跡預測算法。運用K臨近算法對歷史軌跡數據進行建模,利用機器學習算法評估模型參數,得到了最優參數模型。通過預測值和實際值得比較證明了此算法的正確性和精度。

同時,為提高航跡預測的準確度,下一步研究的重點是:

(1)增加其他相關的特征值、例如機型、氣象數據等。

(2)增加訓練數據量,將訓練數據提高到半年或一年數據,從而建立更高精度的算法模型。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 一本大道香蕉久中文在线播放 | 成人国产精品一级毛片天堂| 国产人成在线视频| 狠狠操夜夜爽| 欧美不卡二区| 国产成人高清精品免费| 在线色国产| 欧美国产日韩在线观看| 97超碰精品成人国产| 亚洲第一香蕉视频| 亚洲色图欧美视频| 少妇被粗大的猛烈进出免费视频| 久久久精品国产亚洲AV日韩| 99爱在线| 91在线播放国产| 亚洲国产成人超福利久久精品| 亚洲精品卡2卡3卡4卡5卡区| 免费人成在线观看成人片| 97一区二区在线播放| 国产经典在线观看一区| 亚洲第一色网站| 毛片久久网站小视频| 国产手机在线ΑⅤ片无码观看| 99re热精品视频中文字幕不卡| 国产亚洲视频免费播放| 国产人成在线观看| 国产午夜无码专区喷水| 在线视频亚洲色图| 高清大学生毛片一级| 国产不卡国语在线| 国产日本一线在线观看免费| 97在线免费| 青青草原国产| 国产美女人喷水在线观看| 成人国产精品网站在线看| 最新国产精品第1页| 玩两个丰满老熟女久久网| 欧美一级特黄aaaaaa在线看片| 久综合日韩| 国产三级视频网站| 欧美日一级片| 成人小视频网| 日韩AV手机在线观看蜜芽| 亚洲人人视频| 国产91蝌蚪窝| 98精品全国免费观看视频| 亚洲大尺码专区影院| 98精品全国免费观看视频| 色婷婷久久| 九九精品在线观看| 成人在线观看不卡| 美美女高清毛片视频免费观看| 麻豆国产精品一二三在线观看| 亚洲第一区欧美国产综合| 99精品免费欧美成人小视频| 永久天堂网Av| 一级一级一片免费| 91极品美女高潮叫床在线观看| 亚洲不卡影院| 热99re99首页精品亚洲五月天| 亚洲欧美另类中文字幕| 一级全免费视频播放| 中文字幕调教一区二区视频| 国产91在线|日本| 亚洲天堂视频网站| 亚洲精品欧美日本中文字幕| 综合色亚洲| 日本少妇又色又爽又高潮| 99re视频在线| 久久香蕉国产线看观| 在线观看免费黄色网址| 在线播放国产99re| 999精品视频在线| 高清视频一区| 在线日韩日本国产亚洲| 国产在线视频福利资源站| 免费在线成人网| 午夜国产精品视频| 91美女视频在线| 特级aaaaaaaaa毛片免费视频| 无码中文字幕加勒比高清| 欧美午夜视频在线|