999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的聊天機器人自動化平臺設計

2023-09-25 17:13:22肖俊輝冉國翔朱榮清陳鏡宇張天乙
現代計算機 2023年14期
關鍵詞:模型系統

肖俊輝,孫 麗,冉國翔,朱榮清,陳鏡宇,張天乙

(東南大學成賢學院電子與計算機工程學院,南京 210000)

0 引言

本項目的靈感來源于QQ群中的群聊機器人小冰,其功能包含入群歡迎、提醒打卡、簡單的游戲交互等,那么我們能否創造一個功能更加完善、更加類似人類、更加貼合特定群聊特色的(個性化的)機器人加入群聊之中呢?一個對計算機編程了解甚少的人又如何能夠在群聊中擁有自己所需要的機器人呢?于是我們便計劃開發一個平臺,使得更多的人能夠通過低代碼甚至無代碼的簡單方式獲取和培養個性化的聊天機器人,旨在將本技術簡單化、日常化,帶入人們的日常生活。

經過多方渠道考察,從1950 年開始,隨著聊天機器人相關研究的不斷發展,已有眾多聊天機器人產品相繼面世,目前的熱點便是2022年11 月30 日由美國OpenAI 公司發布的聊天機器人程序ChatGPT,其為人工智能技術驅動的自然語言處理工具,能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣來聊天交流。這一里程碑式的技術革命便是深度學習應用越來越廣泛,技術越來越成熟的體現,其核心通過機器來模仿人類的對話內容和習慣,對聊天輸入的內容做出決策和判斷,給予相應的回應。

現如今國內外雖已出現眾多的聊天機器人產品,但都在個性化和簡便性方面有所不足,導致目前大部分聊天機器人還是需投入到客服環境中使用,因此如果實現了聊天機器人個性化和簡便性的突破,便可走進普通人的日常生活,小到供人消遣娛樂、排憂解難,大到協助公司部門進行人事管理、甚至能夠做到24 小時不間斷提供高質量人性化服務等,以其個性化程度進軍各行各業,將擁有巨大的市場潛力。

本項目計劃開發一個基于深度學習的聊天機器人自動化搭建平臺的軟件產品,試圖在上述技術方面有所突破,彌補現階段QQ小冰在群聊趣味性、個性化上的不足,以低代碼甚至無代碼形式對機器人進行操作。本項目產品與QQ小冰的功能對比見表1。

表1 本項目與QQ小冰功能對比

1 總體設計

軟件總共分為三個系統,如圖1所示,包括聊天數據收集系統、聊天回復系統和自動化訓練系統。

圖1 總體架構

2 詳細設計

2.1 軟件設計

2.1.1 聊天數據收集系統

通過Mirai框架,運用Http技術[1],使得QQ能與軟件連接,可以自動將聊天記錄生成一個“問—答”的詞庫,其中對數據集過濾方式包括:用戶自定義策略、常用的無用語句、敏感隱晦字眼分析。最后根據詞庫鏈生成訓練用語料集。

2.1.2 聊天回復系統

同樣通過Mirai 框架,讓QQ 群或者私聊作為一個聊天室的載體,可以收集數據的同時,使用訓練的模型給出特定的回答,并回復在群聊中,系統功能架構如圖2所示。

圖2 收集/回復系統功能架構

2.2 模型訓練設計

2.2.1 數據預處理

因為群聊內的聊天有時候會出現上文不接下文的情況,此時如果直接將聊天內容原封不動地生成對話場景模型,將會使得模型上下文邏輯混亂。我們設計詞庫鏈的初衷就是為了能更好地生成對話場景。

每個回答均是上一個“問題”的“答案”和下一個回答的“問題”,“問題”和“答案”均有一個“出現頻率”的屬性,據此可以較好地模擬聊天的對話場景,生成對話模型。

2.2.2 進行tokenize(標記化)

在文本分割的步驟上,我們從傳統的詞向量[2]轉而使用了同為Transformer的BERT框架[3-4]的tokenize,能很好地應對一詞多義的問題,從而提高模型對語言的理解能力,如圖3所示。

圖3 tokenize示意圖

2.3 模型訓練

2.3.1 切分訓練集和測試集

讀取上一個步驟生成的預處理數據,將它們按照一定比例劃分為訓練集和測試集。

2.3.2 讀取預訓練模型

群聊語料集對于訓練一個模型來說還不夠龐大,所以本文使用GPT-2 預訓練模型[5-6]來訓練我們的模型。

2.3.3 自回歸訓練

在強大的GPT-2 模型基礎上,我們采用自回歸訓練方式,讓模型輸出能更加符合語料集的聊天場景,加強連續聊天能力,如圖4所示。

圖4 自回歸概念圖

2.4 訓練結束指標

2.4.1 模型訓練指標(loss)計算

在每一批次的訓練中,通過前向傳播計算出模型的預測輸出和實際輸出,使用反向傳播算法計算出損失函數值(loss)以及對應訓練模型參數的梯度,同時進行梯度裁剪[7],防止發生梯度爆炸,進行一定次數的梯度積累后,根據梯度下降算法,更新模型的參數,完成一輪訓練。

2.4.2 生成困惑度最低模型(Perplexity)

困惑度可以被看作是一個語言模型中預測的不確定性大小的加權平均。在相同的測試數據集上,一般來說,困惑度越低,模型的性能就越好。

在一次訓練中,通過對每個批次的loss值進行加權平均就可以得到一次訓練的loss值,在測試集上使用同樣的算法得出測試loss值后,與最佳測試loss 值進行比較,低于最佳測試loss 值的將保存,在每輪訓練中不斷更新與迭代困惑度最低模型,如圖5所示。

圖5 生成困惑度最低模型邏輯

在本文的多次測試中,有時候困惑度低,模型的生成效果不一定會越好,所以最后采用loss 收斂來判斷訓練結束,loss 值穩定且不再下降則訓練完成,如圖6和圖7所示。

圖6 訓練初期loss值變化

圖7 訓練后期loss值變化

3 軟件測試

3.1 軟件操作說明

軟件操作流程如圖8所示。

圖8 軟件操作流程

圖9 功能列表

3.2 軟件流程測試

首先進行收集系統測試,添加群聊“add learning”,開始記錄“learning”,如圖10 所示,收集一段時間后得足量數據,進行數據預處理,如圖11所示。

圖10 收集系統測試

圖11 數據預處理測試

將生成的語料集置于訓練環境進行模型訓練,如圖12 所示,注意關注loss 值浮動幅度,等待訓練結束,如圖13 所示。訓練完成后將模型重新加載至機器人內部,如圖14所示。

圖12 模型訓練測試

圖13 訓練Loss可視化測試

圖14 訓練模型加載測試

4 結語

本文詳細介紹了一個基于深度學習的聊天機器人自動化平臺,該平臺旨在為普通用戶提供一個親民簡單的方式來構建個性化的聊天機器人,從而將這項技術更廣泛地應用于日常生活。所設計的平臺分為“收集系統”“回復系統”“訓練系統”三個模塊,三個模塊相互分離,方便用戶根據需求靈活地選擇和使用。

“收集系統”負責連接群聊,自動收集聊天記錄并生成相應的問答詞庫。經過過濾無用信息和敏感內容后,將收集到的聊天數據用于訓練語料集。而“回復系統”則負責在群聊中使用訓練好的模型或收集的詞庫進行智能回復。“訓練系統”模塊則包括數據預處理、模型訓練和模型優化等環節。

通過這一設計,本文為普通用戶提供了一個易于操作、個性化的聊天機器人搭建平臺。這不僅有利于推動人工智能技術在日常生活中的應用,還能滿足各種不同場景的需求。在未來的研究中,我們將不斷改進和優化本平臺的功能和性能,以滿足用戶不斷增長的需求,推動聊天機器人領域的發展。

猜你喜歡
模型系統
一半模型
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产成人h在线观看网站站| 国产综合无码一区二区色蜜蜜| 激情无码视频在线看| 亚洲无码视频一区二区三区| 中文国产成人久久精品小说| 丰满的熟女一区二区三区l| 亚洲av无码片一区二区三区| 伊人久久精品亚洲午夜| 亚洲免费成人网| 亚洲V日韩V无码一区二区| 九九久久99精品| 国产青榴视频| 国产麻豆91网在线看| 成年片色大黄全免费网站久久| 日韩视频免费| 久久鸭综合久久国产| 亚洲欧美一区二区三区蜜芽| 国产精品视频久| 亚洲国产成人麻豆精品| 毛片视频网| 国产美女在线观看| 亚洲精品第五页| 亚洲成人播放| 久久久久青草线综合超碰| 久久婷婷国产综合尤物精品| 成人免费网站久久久| 国产成人免费视频精品一区二区 | 一级毛片免费不卡在线| 欧美精品亚洲精品日韩专| 国产成人精品男人的天堂| 91一级片| 在线观看视频一区二区| 四虎影院国产| 亚洲成aⅴ人片在线影院八| 免费人成视网站在线不卡| 欧美在线一二区| 国产亚洲欧美日韩在线观看一区二区| 欧美日韩第三页| 99视频精品全国免费品| 999精品视频在线| 国产视频大全| 国产新AV天堂| 秋霞午夜国产精品成人片| 99热这里只有精品免费| 毛片网站在线看| 国产精品亚洲五月天高清| 国产乱人伦偷精品视频AAA| 五月激激激综合网色播免费| 国产一区在线视频观看| 最新亚洲人成无码网站欣赏网 | 精品一区二区三区波多野结衣| 亚洲综合在线网| 在线国产91| 国产美女无遮挡免费视频| 国产亚洲视频免费播放| 91尤物国产尤物福利在线| 性激烈欧美三级在线播放| 2048国产精品原创综合在线| 国产高清免费午夜在线视频| 欧美福利在线播放| 一级毛片在线播放| 人人澡人人爽欧美一区| 国产呦精品一区二区三区下载 | 色综合天天操| 免费人欧美成又黄又爽的视频| 亚洲不卡av中文在线| 免费高清毛片| 韩国福利一区| 一级黄色网站在线免费看| 亚洲av中文无码乱人伦在线r| 精品少妇人妻无码久久| 青青草原国产免费av观看| 亚洲精品大秀视频| 国产福利影院在线观看| 波多野结衣无码AV在线| 青青草国产在线视频| 自拍偷拍欧美日韩| 无码专区国产精品一区| AV在线麻免费观看网站| 在线看国产精品| 久久久久久尹人网香蕉| 99在线免费播放|