代一方



[摘要]隨著社交媒體的興起,微博作為一種廣泛使用的社交平臺,吸引了大量用戶參與討論。本研究通過對微博ChatGPT話題數據進行主題分析和情感分析等,以識別公眾在該話題上的觀點和態度。本研究成果可以為政府、企業等提供有價值的信息,幫助其更好地理解公眾對ChatGPT的態度,從而根據這些信息來制定相應的策略。
[關鍵詞]ChatGPT;微博話題;LDA主題模型;公眾態度
一、研究背景
當今時代,人工智能飛速發展,逐漸被應用于各個領域,人類生活、經濟社會變得越來越智能化。涂良川認為,人工智能定義了新的科技時代,其具有強大的能力和廣泛的影響,擁有高階自動化邏輯的人工智能繼承并超越了機器自動化邏輯的技術[1]。
目前,關于公眾對人工智能的態度的研究大多通過案例研究或問卷調查的方式進行,刁生富和馮桂鋒的研究指出,媒體的宣傳和報道可以幫助公眾更好地理解和接受人工智能,從而影響他們的思維模式和價值觀念[2]。張海等構建了影響ChatGPT用戶使用意向因素的研究模型,探討了ChatGPT用戶的行為特征[3]。此外,方旭等基于期望—確認理論和信息系統成功模型,探索影響中學生持久性使用人工智能技術的因素,其目的在于研究如何進一步提高中學生對人工智能技術的滿意度和感知效用[4]。
盡管問卷調查具有一定的代表性,但由于樣本量的限制,其可靠性仍然有待提高。此外,從心理學的角度來看,問卷調查的結果可能與人們的真實情況和想法存在一定的出入。相對而言,網絡評論的數據更能夠反映客觀真實的情況。學者們正在努力利用網絡文本大數據分析來深入探究公眾的觀點。徐紅霞等采用文本篩選、情感分析、關鍵詞篩選、主題模型等多種技術,以知乎社區為例,結合社區特征和交互數據,構建出一個能夠準確反映觀點對抗性的分析模型,從而更好地收集和分析公眾對人工智能Alphago的觀點[5]。
為了彌補問卷調查存在的缺點,獲得更加真實可靠的數據,本研究收集微博ChatGPT話題的帖子和評論,并進行輿情分析,研究大數據環境下公眾對人工智能產品的態度,從而為政府、企業等提供有價值的信息。
二、數據處理與主要研究方法
(一)數據處理
筆者使用Python爬蟲算法,從微博ChatGPT話題中提取有價值的評論文本。微博ChatGPT話題下共有19.4萬條評論,筆者從中爬取2022年12月20日到2023年4月7日的一級評論,共11395條數據,并對數據進行篩選,去掉重復項、空白項等無關數據,最終得到10400條數據。
(二)主要研究方法
1.語義網絡分析
語義網絡分析是一種分析和理解文本或語言數據的方法,基于語義關系構建圖結構,并通過對圖結構的分析來揭示語義信息的關聯性。在語義網絡分析中,文本中的單詞或短語表示為節點,而它們之間的語義關系表示為邊。這些語義關系可以是同義關系、上下文關系、關聯關系等。通過構建語義網絡,我們可以捕捉到文本中的關鍵概念、主題以及它們之間的關聯性。語義網絡分析的目的是提取出文本的重要信息和關系,并以可視化的方式呈現,揭示文本中隱藏的模式、主題和結構,幫助人們更好地理解文本內容。
2.LDA主題分析
LDA主題分析是一種文本分析方法,通過對文本數據進行統計、計算和建模來確定文本中的主題或話題。LDA主題分析對理解大量文本數據中的關鍵主題和話題,并揭示它們之間的關系起到重要作用。LDA主題模型是一種統計模型,通過分析文本中詞語的共現模式,自動發現主題。我們將LDA主題模型用于輿情分析,可以了解熱門話題和輿論動態,揭示網民的偏好和需求,從海量文本數據中提取有用的信息,從而為決策制定提供支持。
三、研究發現
(一)語義網絡分析
從語義網絡分析圖中(圖1),我們可以得到以下信息,“技術”和“人工智能”是最核心的概念,它們之間的連線數量最多,這從側面說明網民對人工智能產品ChatGPT的基本認知是“一種技術的進步”。“應用”“人類”“學習”“機器人”等處于次核心位置,表明網民對ChatGPT的進一步認識包括其在各個領域的應用、技術對人類生活和學習的影響等。核心和次核心概念詞匯的外圍詞匯包括“全球視角”“人才培養”
“未來發展”等,這些詞匯與核心概念和次核心概念詞匯之間有一定的關聯,進一步完善和補充了對ChatGPT的解釋。筆者通過語義網絡分析,發現ChatGPT作為一個人工智能產品,在技術領域具有重要地位,同時也在新技術應用、人類生活和學習等方面產生廣泛影響。此外,“全球視角”“人才培養”和“未來發展”也是與ChatGPT相關的重要話題。
(二)主題分析
筆者對文本數據進行整理和分詞,得到評論詞集合,然后利用LDA主題模型進行主題分析。筆者通過使用中文分詞工具Jieba,得到一個包含所有評論詞的詞匯集,然后對此詞匯集內的詞匯做主題聚類。筆者主要運用LDA主題模型方法,將篩選后的文檔詞集合作為模型輸入,調整參數并對其進行1000次迭代,從而獲得四個主題的占比和主題特征詞。其中:人才培養主題占比41.3%(主題特征詞:教育、搜索、方式、學生、論文);產業生態主題占比24.7%(主題特征詞:市場、馬斯克、服務、學習、行業);人類生活主題占比18.4%(主題特征詞:對話、影響、思考、生活、失業);投資決策主題占比15.6%(主題特征詞:消息、大漲、震蕩、風險、股票)。人才培養主題評論數最多,一方面,因為其涉及教育、就業、社會發展等方面的問題,對大多數人來說都具有直接的利益關系;另一方面,微博作為一個社交媒體平臺,學生、教育從業者用戶數量龐大,導致輿情導向傾向于此主題,而投資決策主題需要用戶具備專業的知識背景才能發表有主見的內容,因此評論較少。
(三)對抗性情感分析
對抗性觀點指積極傾向文本和消極傾向文本之間的對立性,這種對立性可以從海量信息中挖掘出來,本研究使用情感分析方法和主題模型分析方法,具體的技術流程如圖2所示。
對網絡輿情進行情感分析,能夠幫助我們更好地了解公眾對ChatGPT的正負面情感及其背后的原因。筆者利用百度智能云情感分析平臺提供的“情感傾向分析”API對微博ChatGPT話題評論數據進行分析,得分越靠近1,表示該評論越積極,得分越靠近0,表示該評論越消極。筆者將得分大于0.5的評論設置為積極傾向評論,小于0.5的設置為消極傾向評論,最終獲得4538條消極傾向數據,占比約為43.6%;5862條積極傾向數據,占比約為56.4%,在數量方面,積極傾向評論占比更高。隨后筆者在積極傾向評論集合和消極傾向評論集合內分別利用LDA主題模型進行主題分析,進而得到主題分布,在經過參數調整后,發現主題數量為3時效果最佳,具體的主題特征詞與示例如表1所示。
綜合來看,支持ChatGPT和反對ChatGPT兩種態度的觀點對抗性顯著,筆者結合各主題下的具體文本,可以大致總結出兩種態度的對立特征。
第一,對ChatGPT與人類的關系,積極態度認為ChatGPT的出現標志著人工智能的一次重大突破,為人們提供了一種全新的與計算機交互的方式,期待ChatGPT未來能夠產生更多令人興奮的成果。消極態度認為核心技術掌握在國外,這會使中國的科技發展面臨巨大的挑戰,對中國是否能夠在這股科技浪潮中占據主導地位的不確定性感到擔憂。
第二,對ChatGPT的發展,積極態度認為ChatGPT的學習能力日益增強,可以對大量的數據進行分析,并根據問題或需求生成相應的回復或建議,能夠從各種來源的數據中提取關鍵信息,幫助企業快速洞察市場動態、了解客戶需求、預測趨勢變化等。消極態度認為一些傳統工作可能會受到ChatGPT的沖擊,導致部分人員失去工作,ChatGPT的應用可能引發失業高峰等問題。
第三,對ChatGPT的應用,積極態度認為ChatGPT不僅可以提供一種快速、準確、高效的方法來處理大量文本數據,還能幫助諸多公司提高工作效率。消極態度認為ChatGPT的功能還沒有被人們充分挖掘,目前生成的某些回復依舊不符合人們預期,對學生來說,將ChatGPT作為輔助學習工具也會引發一系列負面問題,這需要引起教育界的重視。
四、討論
(一)增強用戶體驗和加強隱私保護
在信息時代,用戶體驗和數據安全是ChatGPT發展的兩個重要方面。一方面,為了提高用戶滿意度,ChatGPT需要關注用戶體驗,并改進對話流程。這包括增強對話內容的豐富性、準確性和實用性,以確保用戶能夠獲得滿意的交互體驗。此外,為了提高競爭力,ChatGPT還可以考慮增加更多的服務和功能,以滿足用戶多樣化的需求。另一方面,隨著數據泄漏和隱私泄露事件的頻發,數據安全和隱私保護問題成為用戶關注的焦點。在這方面,ChatGPT需要采取切實可行的措施來加強數據安全和隱私保護。這包括建立健全的數據保護機制,確保用戶的個人信息得到妥善處理和保護,采用加密和安全傳輸技術來防止未經授權的數據被訪問和泄露。同時,ChatGPT也應該明確隱私政策,并與用戶建立信任關系,使用戶對其數據的安全性和隱私保護有信心。
(二)加大投資力度和加強監管
在人工智能快速發展和廣泛應用的背景下,政府在引導、推動技術研發和創新方面扮演著關鍵的角色。政府應積極履行職責,確保人工智能技術符合公眾利益和社會價值。首先,政府可以通過資助研究機構和高等教育機構,支持人工智能領域的研發和創新,鼓勵科學家、工程師和創業者對前沿技術進行探索,推動人工智能技術的不斷進步和應用領域的不斷拓展。其次,政府應加強對人工智能領域的監管,確保人工智能的發展和應用符合公眾對隱私、安全和倫理等方面的需求。政府還可以設立專門的機構或部門來監督人工智能技術的應用,確保其規范運作。最后,政府應加強人工智能領域的國際合作和交流,與其他國家和組織共同制定國際標準和規范,推動人工智能技術的全球發展和治理,實現共同繁榮和可持續發展。
[參考文獻]
[1]涂良川.人工智能的發展與青年人格的時代建構[J].青年探索,2023(01):34-42.
[2]刁生富,馮桂鋒.媒體傳播與公眾的人工智能態度[J].長沙理工大學學報(社會科學版),2018(05):1-6.
[3]張海,劉暢,王東波,等.ChatGPT用戶使用意愿影響因素研究[J].情報理論與實踐,2023(04):15-22.
[4]方旭,許磊,竇慧敏.中學生人工智能技術使用持續性行為意向影響因素研究[J].信陽師范學院學報(哲學社會科學版),2023(03):79-87.
[5]徐紅霞,于倩倩,錢力.基于主題模型和情感分析的話題交互數據觀點對抗性分析[J].數據分析與知識發現,2020(07):110-117.