



關鍵詞:生成式人工智能;AICG;CiteSpace;知識圖譜
0 引言
生成式人工智能(AICG) 的興起標志著數字技術創新領域的新浪潮。這場浪潮以人工智能為核心,通過融合機器學習和自然語言處理等技術,賦予計算機獨立生成文本、圖像、音頻和視頻的能力[1]。這不僅代表了從決策型AI向生成型AI的技術轉變,也推動了從時空革命到知識革命的演進。近年來,隨著其全球快速發展,生成式人工智能被視為頂級戰略技術,引領了技術創新的前沿。代表性的模型如OpenAI 的GPT、DALL-E和谷歌的LaMDA,在多方面展示了卓越性能,同時也帶來了數據安全、隱私保護、知識產權等一系列挑戰[2]。
1 數據來源與研究工具
1.1 數據庫的來源和數據的規范化處理
本研究采用的數據來自中國知網(CNKI) 數據庫,選取“AICG”“生成式人工智能”“生成式AI”作為關鍵檢索詞。通過設定檢索條件,包括文獻的主題、題名、關鍵詞和主題詞,確保全面覆蓋該領域的相關文獻。從1989年到2023年,共檢索到關于生成式AI的文獻1 315條。經過篩選,選取了2017年到2023年9月18 日之間的751條文獻作為有效數據,這一時間范圍內的文獻最具代表性和時效性,能夠反映生成式人工智能領域的最新研究動態和發展趨勢。
1.2 研究工具
為確保對生成式人工智能領域的研究現狀、核心熱點和發展趨勢進行客觀和精確的可視化分析,本研究采用了從中國知網(CNKI) 數據庫導出的數據。數據導出格式被設置為Refworks,隨后在CiteSpace軟件中進行了導入、處理和轉化。為了初始化CiteSpace的分析設置,選定了2017年至今為時間范圍,從主題、摘要、關鍵詞及關鍵詞Plus中提取詞匯,以確保數據的全面性。分析節點包括合作作者、機構、國家、關鍵詞和學科,以揭示該領域的學術網絡和研究聚焦。鏈接的強度通過Co?sine算法計算,選擇了在時間切片內的范圍,并采用了Top N%的節點篩選方式。為優化可視化效果,啟用了Pathfinder精簡選項和靜態聚類視圖。通過這一系列詳細的設置,CiteSpace的初步配置完成,旨在深入探索生成式人工智能領域的學術脈絡和關鍵趨勢。
2 實證分析
2.1 生成式人工智能發文量概況
在生成式人工智能領域,發表論文量的統計揭示了其發展動態與趨勢。自2008年起至2023年,研究文獻數量持續攀升,特別是在2023年,發文量急劇增長至444篇,較2022年增長了約8.5倍(圖1) 。這一躍升不僅標志著生成式人工智能研究熱度的顯著提升,也映射出學術界對此技術興趣的高度關注和技術自身的快速進展。
2.2 主要主題和研究層次分析
在生成式人工智能(AICG) 的研究領域中,涉及的主題廣泛而多樣,體現了學術界對該技術深入探索的熱情。以人工智能為核心,共有366篇文獻,顯示了其作為研究的基石和廣泛應用的基礎。ChatGPT作為研究熱點主題,有161篇文獻聚焦于對話式AI和自然語言處理,凸顯了對交互式智能系統的興趣。生成式人工智能研究領域主題的多樣性和研究數量的豐富性,一方面凸顯了該技術的多維度發展特性,另一方面也揭示了學術界積極應對新興技術挑戰的態度。
生成式人工智能領域的研究呈現出多層次的分布,其中應用研究與技術研究占據主導地位,分別擁有74條和64條相關文獻。這表明當前研究重點不僅聚焦于技術的實際應用和創新,也深入探討技術本身的發展和優化。開發研究、應用基礎研究以及與行業和管理研究的結合,雖然文獻數量相對較少,但凸顯了基礎理論研究和針對特定行業或管理問題的深化探索同樣是該領域不可或缺的一環。
2.3 高產作者、高產機構分析
在生成式人工智能(AICG) 領域,一批高產作者及其緊密的合作網絡在推進科學研究和技術創新方面發揮了核心作用。王飛躍作為發文量最高的作者,憑借5篇重要論文在該領域確立了領軍地位,與之緊密合作的包括喻國明、孫山、張欣等杰出學者。這些合作網絡不僅加快了研究成果的產出,而且加深了領域內的知識交流和理論創新,為生成式人工智能的發展奠定了堅實的基礎。這些高產作者和他們之間的合作網絡是生成式人工智能研究活躍度和成熟度的重要標志,預示著未來有著更加廣闊的發展空間。
在生成式人工智能(AICG) 的研究領域,多個高等教育和科研機構通過其豐富的研究成果顯著貢獻于該領域的發展。華東政法大學以27篇發文量位居榜首,成為研究活動最為活躍的中心,緊隨其后的分別是北京師范大學和清華大學,凸顯了這些頂尖學府在AICG研究中的領先地位。位于學術交叉點的機構如北京師范大學新聞傳播學院、南京大學法學院、華東政法大學知識產權學院等,突出了跨學科合作在推動技術創新及其應用研究方面的重要性。
這種跨學科、多機構的合作模式不僅推進了生成式人工智能技術的研究,也為該領域帶來了新的思維和方法論,為未來的創新發展奠定了堅實基礎。
3 研究熱點與發展趨勢分析
3.1 關鍵詞共現與詞頻統計
關鍵詞共現與詞頻統計揭示了生成式人工智能領域的研究焦點及其發展趨勢(表1) 。人工智能作為最頻繁出現的關鍵詞,反映了該技術的迅猛發展及其對社會各領域的深遠影響。生成式技術、獨創性、著作權等詞匯的高頻出現,指向了技術創新與法律倫理問題的交織,尤其是在AI生成內容的版權歸屬和獨創性認定方面的挑戰。數據安全、風險管理、人機交互等關鍵詞的出現,強調了隨技術進步而來的新型法律和倫理問題,以及對數據保護和隱私權的重視。專利法、算法治理、技術倫理等關鍵詞的出現,進一步展現了對AI技術發展邊界、創新成果保護及其社會影響的深入探討。這些關鍵詞不僅反映了生成式人工智能領域的研究熱點,也反映了技術進步帶來的復雜法律、倫理和社會問題。
3.2 關鍵詞聚類分析
關鍵詞聚類分析展現了生成式人工智能(AICG) 領域的研究熱點與發展趨勢,揭示了該領域的多維度探索路徑(表2) 。這些聚類覆蓋了從技術創新到社會應用,再到法律倫理等多個方面,體現了生成式人工智能研究的復雜性和多樣性。
聚類一:技術與應用交匯
以“人工智能技術”“深度學習”和“大模型”為代表的聚類,凸顯了生成式人工智能技術的核心和前沿,包括其在倫理困境、新范式、生產力和應用場景中的探討,展現了技術自身的進步及其在教育、職業等領域的應用潛力。
聚類二:法律與倫理框架
“獨創性”“可版權性”和“可專利性”聚類揭示了隨著技術進步,特別是在作品創造、版權歸屬及其法律保護方面所面臨的新挑戰。這些討論指向了對現有法律框架的更新需求,以及在保護創新成果的同時,確保技術發展的合理性和公平性。
聚類三:社會治理與風險管理
聚類如“教學”“基層治理”和“風險治理”反映了生成式人工智能技術對社會治理模式的影響,以及在實現技術應用的過程中對風險的識別、評估和應對策略的需求。教學是一個相對獨立的主題。在聚類中,教學與職業和教育等概念相關聯。這表明教學是教育領域中的一個核心問題,同時也是一個需要關注的重要領域,教學質量的提高和教育改革的推進對于培養高素質人才和推動社會進步具有重要意義。
聚類四:創新與交互
“人機協同”“人機合作”和“交往行為”聚類顯示了人機交互技術的發展趨勢和挑戰,強調了在技術設計和應用中人本思想的重要性,以及對技術與社會、技術與個體之間相互作用的深入理解。
聚類五:技術未來與潛能
“元宇宙”“多智能體”和“AI生成”聚類探索了生成式人工智能在未來可能開拓的新領域和新應用,從虛擬空間到智能創作,展示了技術潛能的廣闊前景。
這些聚類不僅為我們提供了一個全面了解生成式人工智能當前研究和未來方向的窗口,也強調了跨學科合作在解決技術、社會和法律倫理問題中的關鍵作用,為未來的研究和實踐提供了指導。
3.3 熱點變化趨勢分析
通過對生成式人工智能(AICG) 領域的關鍵詞突現表進行深入分析,我們可以觀察到該領域自技術哲學向技術實踐的轉變,進而迎來了人工智能研究的新時代(表3) 。從最初對創造性、作者身份以及對抗學習等概念的探索,到版權、深度學習、數據安全等核心議題的關注,研究熱點的演變反映了技術發展的深刻影響和社會法律倫理的應對挑戰。
1) 研究初期。這一階段見證了科學哲學向技術哲學的轉變,工程哲學也應運而生。這是人工智能技術從“決策式AI”向“生成式AI”的重大技術躍遷的初始階段。2018—2019年,研究重點集中在獨創性、作者、對抗學習、平行智能、作品、圖像識別、生成模型、對抗網絡、對抗訓練、圖像生成等方向。此類研究在2019年后逐漸減退。在研究初期,關注點集中在技術的基礎理論和方法上,如對抗學習和平行智能等,這些都是推動“決策式AI”向“生成式AI”演變的關鍵技術。
2) 研究發展階段。這個階段發生了許多標志性的事件,如GPT的誕生。自2019年起,可版權性、創造性、發展趨勢、大數據、著作權、生成內容、鄰接權、著作權法成為新的研究熱點。2020年后,只有可版權和著作權延續了研究熱度,其他研究熱度減退。整體來說,進入研究發展階段,隨著GPT等劃時代技術的出現,生成式AI的應用范圍顯著擴大,引發了對版權、創造性以及發展趨勢的深入討論。這些討論不僅涉及技術自身的進步,也觸及了技術應用所帶來的社會、法律和倫理問題。
3) 研究整合期。2020年,深度學習、權力歸屬、專利、主體資格、合理使用、可專利性成了新的研究熱點。研究的整合期見證了生成式AI技術與社會法律倫理規范的深度融合。新興技術如ChatGPT的廣泛應用,不僅促進了領域內的創新和發展,同時也帶來了數據安全、個人隱私以及知識產權侵犯等新挑戰。這要求政府、學術界和產業界共同努力,構建更加完善的法律倫理框架,以促進生成式AI技術的健康發展和廣泛應用。
生成式人工智能領域的研究熱點及其變化趨勢,不僅揭示了技術進步和社會應用的密切聯系,也強調了面對新技術挑戰時,跨學科合作和全社會共同參與的重要性。
4 挑戰與建議
4.1 面臨的挑戰
隨著生成式人工智能的普及和應用,媒介環境中數據流動形式、信息獲取狀態、人機合作模式三個方面將迎來革命性轉變[3]。這一過程將帶來新的知識產權侵害問題、偏見和歧視問題等多方面的社會影響和挑戰,需要人類社會審慎思考和應對。政府和相關組織需要制定相應的政策和法規,加強監管和管理,以確保生成式人工智能的健康發展。
生成式人工智能的出現將人類帶入了一個全新的語言維度,這種技術有可能改變人類對世界的認知和思考方式。對于政府、企業和個人來說,如何在充分發揮生成式人工智能的優勢的同時,控制其可能帶來的風險和危害,是一項需要重視和解決的重大課題。
4.2 建議
為了促進生成式人工智能(AICG) 的健康發展并有效應對挑戰,可以通過國家、社會、公眾等多層面提供制度政策的保障,形成多方參與的協同治理局面,從而全面提升公眾的數字素養。
1) 加強跨國合作與全球治理。生成式人工智能技術需推動國際合作,共同制定全球統一的倫理和法律標準,確保全球治理體系的公平性和有效性,避免監管套利和競爭不公。
2) 重視對弱勢群體的保護。明確識別和響應生成式AI技術可能對弱勢群體帶來的負面影響,如數據偏見、隱私侵犯和就業影響等,通過制定特定政策和技術措施確保所有社會成員均能公平受益于AI技術的發展。
3) 增強技術創新的社會責任意識。鼓勵開源共享和技術審查機制的建立,以增加技術發展的透明度和社會的參與度,確保技術創新在倫理和法律框架內進行。將倫理考量整合入生成式AI的研發和部署全過程,確保技術開發者在追求技術進步的同時,也承擔起其社會責任,促進技術創新的同時確保社會穩定和公眾利益的保護。
4) 建立風險管理體系。通過風險評估和管理體系,對生成式人工智能技術進行持續的安全性、可靠性評價,識別并預防潛在風險,保障技術安全可控[4]。
5) 形成多方參與的協同治理局面。除了政府監管,還需企業的自我約束、學術界的引導和公眾的參與,共同構建多元共治的局面。考慮設立獨立的倫理審查機構或委員會,監督AI應用的倫理實踐。
6) 培養公眾的數字素養。在生成式AI日益普及的背景下,需加大對公眾的教育投入,提高他們的數字識讀能力,幫助公眾正確理解和使用AI技術,同時增強對虛假信息的辨識能力和對個人數據的保護意識。
生成式人工智能成為學術界焦點,預示著未來廣闊的探索領域。然而,數據安全、隱私保護和知識產權侵犯等問題亦隨之而來,呈現出緊迫的監管需求和倫理考量。為應對這些挑戰,加強跨學科合作、更新法律框架和建立規范標準、推進技術開放性和透明度、建立全面的風險管理體系、加強公眾教育,通過這些策略,可以推動生成式人工智能技術的健康發展,并確保其在帶動社會進步的同時,有效避免潛在的負面影響[5]。這要求我們在推動技術創新的同時,通過持續研究和討論,有效管理伴隨而來的風險和挑戰,確保技術進步與社會倫理和法律框架的和諧共進,促進人類社會在AI時代的健康發展。