999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“大數據+人工智能技術”助力文化館藝術普及

2024-12-31 00:00:00雒續源
文化產業 2024年20期
關鍵詞:群眾用戶藝術

當前,互聯網技術快速發展,人民生活水平不斷提高,以智能手機為代表的智能終端設備廣泛普及,隨著各類互聯網短視頻平臺的革新,群眾對線上藝術普及提出了更高的要求。然而,承擔群眾藝術普及工作的文化館由于經費不足、人才短缺以及服務方式老舊等問題,沒有抓住時代的紅利。現以“大數據+人工智能技術”為抓手,助力文化館藝術普及。大數據技術可以全方位收集公眾的各種活動信息從而形成海量數據,進而運用相關技術對數據進行多維度分析,從而有的放矢地開展藝術普及工作;人工智能技術用于線上系統的智能化提升。例如,可以運用自然語言處理(NLP)技術實現人機智能交互,讓不善于使用智能設備的群眾可以完成資源的快速搜索以及人機對話,再使用深度學習技術實現圖片識別功能,可以讓群眾通過拍照掃描的方式獲取相關信息。借助上述技術手段,可以精準地為群眾提供藝術普及服務,并滿足群眾個性化需求,從而真正為文化館藝術普及工作助力。

隨著移動互聯網技術的快速發展以及人民生活水平的不斷提高,以智能手機為代表的智慧終端設備廣泛普及,帶來了巨大的發展紅利。字節跳動、嗶哩嗶哩等新經濟企業先后崛起,憑借短視頻模式的創新以及先進技術的研發投入快速占據大量市場份額,并改變了用戶上網習慣。同時,也在一定程度上提高了用戶的審美、使用需求,在此背景下,過去的藝術普及方式已經不能滿足當下的需求。

文化館是開展群眾文化工作、并給群眾文娛活動提供場所的機構,其中,群眾藝術普及是其主要的職責。然而,在移動互聯網快速發展的同時,文化館的發展卻受到阻礙。首先是經費不足,除了少數沿海城市以及經濟發達城市外,大部分文化館都面臨該問題。除去日常運轉以及群眾活動的資金投入,能夠用于數字化建設的經費少之又少。其次是科技人才的短缺,在經費不足時更需要專業人才進行全局謀劃才能高效使用經費,而互聯網公司吸引了大部分科技人才,造成文化館數字部門技術人才短缺,間接影響了數字經費的使用效率。最后是群眾藝術普及方式老舊,根據過往經驗安排各種展覽、培訓活動,事前沒有經過科學的數據分析,導致群眾參與度不高,造成資源的浪費,并且場館的線上系統不注重用戶體驗。例如,查找資料和信息問詢是群眾最常用的功能,卻只能通過鍵盤文字輸入,無法通過圖片識別來獲取相關信息,從而降低了用戶黏性。上述三個因素導致文化館在群眾藝術普及工作上進展緩慢。

為了解決上述問題并讓群眾藝術普及工作高效地開展,本文以“大數據+人工智能技術”為抓手,其中大數據是人工智能的基礎,為智能模型的訓練、調優提供了強有力的數據支持,而人工智能又是大數據的導向,為數據存儲類型、范圍指明了方向,二者緊密結合缺一不可。

大數據在文化館藝術普及的應用

大數據技術是一系列技術的總稱,包括數據采集、數據存儲、數據分析處理等技術,并要求數據要具備四個的特性,即大量化﹑多樣化﹑快速化、價值化。

藝術普及下大數據的四“V”特性

1.大量化

大量化是基礎,沒有海量的數據就不能稱之為大數據。文化館在數據收集方面有著先天的便利性,其每年要舉辦多場線上線下活動,可以通過技術手段輕松獲取相關信息數據。以中山市文化館為例,2021年全年開展了演出116場、展覽65場、培訓69場、公益講座12場、非遺活動26場,以及大量的線上數字化體驗活動,經過統計,市區線上線下總服務人次達446萬,23個鎮區的總服務人次達200萬,這是一個巨大的數據寶庫。

2.多樣化

多樣化強調數據要包括結構化數據、非結構化數據以及半結構化數據。其中,半結構化數據和非結構化數據包括了圖片、文本、音頻、報表等。隨著技術的發展以及實際業務需要,文化館已經可以輕松獲取該類數據,每場活動都會進行視頻的錄制和活動照片的拍攝,只要加以整理便可以獲取上述信息,之后便可以將這些數據作為OCR圖片識別、NLP自然語義分析建模的訓練語料。

3.快速化

快速化強調數據的時效性,因為過時的數據不但失去了指導性價值,而且還會對業務的開展造成誤導,因此要確保數據的時效性。值得慶幸的是,在科技發達的今天,有多種技術可以保證數據的快速同步獲取。其中,應用最為廣泛的是Kafka消息隊列技術,可以在保證千萬級系統并發的同時快速讀寫數據,有這些技術的支持,便可以在群眾參與活動或線上訪問時高效地記錄相關數據。

4.價值化

價值化強調數據要有甄別地進行獲取,因為數據的存儲和處理都是有成本的,包括時間成本和經濟成本,而系統能夠獲取海量數據,其中存在著大量無效數據。因此,需要在數據獲取前由業務人員和科技人員一起根據當前業務場景以及后續的發展需要進行梳理,從而確定數據獲取的范圍以及格式。

大數據在文化館藝術普及的實現路徑

1.數據采集

數據的獲取途徑有兩種,分別是互聯網數據和內部數據庫數據。

互聯網數據是指互聯網平臺上的公開信息。例如,北京市某區文化館就在網上公布其2021年年報,其中詳細闡述了其在2021年的各項服務數據,又如某數字文化館線上展示的非遺照片等。這些數據包括半結構化數據以及非結構化數據,其可以為后續的圖像識別以及自然語義分析提供大量的訓練樣本。例如,非遺圖片可以進行圖像識別模型的訓練,得到可以快速識別不同非遺項目門類的模型,而年報可以進行自然語義分析訓練,從而快速從文字中獲取關鍵信息,上述數據的獲取可以使用網絡爬蟲技術,定期對指定網站的相關欄目進行掃描并拉取文字、圖片等數據,然后進行數據的清洗、轉換,再存入數據庫供以后使用。

內部數據庫數據是指通過文化館自身業務系統所獲取的群眾數據,如文化館網站、公眾號H5、小程序、視頻號等。這些系統詳細記錄了用戶瀏覽的全流程,如用戶點擊了哪些資訊、觀看了哪些藝術視頻、報名了哪些活動等。當前,業務系統進行優化后基本可以滿足上述要求,而難點在于無需報名的線下活動,線下活動群眾流量較大,且很多群眾為初次參加,沒有關注過文化館線上系統,不愿意花費時間進行線上信息填寫。同時,傳統的紙質登記在效率和準確性方面都不盡人意,因此一定要選擇簡單便捷的方式來獲取群眾信息。筆者推薦使用微信API獲取用戶授權來收集信息,只需要現場放一個可以請求用戶授權的微信二維碼供群眾掃描即可。這樣做的原因是絕大多數的群眾都使用微信App,而其API支持在用戶授權時獲取用戶相關信息,對文化館掌握活動舉辦情況以及根據性別、地區分析人員喜好有很重要的意義。

2.數據存儲

數據存儲分為持久化數據存儲和非持久化存儲,其中保存在服務器硬盤上且斷電后數據不會消失的為持久化存儲,而將數據保存在內存中且具有較高速讀寫效率的方式則稱為非持久化存儲。

持久化存儲分為數據庫系統和文件系統,代表技術分別為HBase數據庫和HDFS文件系統,其中,后者給前者提供高可靠性的底層存儲支持,通過上述技術可以高效地存儲訪問海量數據。非持久化存儲的代表技術為Redis,該技術支持在緩存中高效地對數據進行處理,處理后的數據再進行持久化存儲,這樣可以降低服務器的響應頻率,減少運行壓力。目前,各地文化館的服務器都由市政府統一運營、免費管理,因此,文化館在創建大數據存儲系統時只需要說明使用依據便可以向政數局提出申請,獲得上述資源。

3.數據分析處理

數據分析處理是由HBase數據庫使用Hive工具來響應業務人員的查詢操作。例如,業務人員想查詢某地區過去3年來,不同性別、鎮區、活動類別的人員參與情況并按照順序進行排列,這種在海量數據中進行的查詢操作,普通數據庫是無法快速響應的,很可能造成數據庫宕機或查詢過慢,但使用Hive工具卻可以輕松應對,只需要提前設置好查詢條件便可以離線運行,短則2小時、長則24小時便可以生成相關結果。

大數據技術對文化館的后續發展至關重要,因此需馬上著手部署。首先,要加快當前地區的群眾數據采集,以中山地區為例,可以由市館牽頭,23個鎮區共同參與,利用同一個業務系統來實現活動報名、線上藝術普及等,并在系統中增加相關程序,記錄用戶瀏覽數據。為了更好地進行推廣,業務系統的設計一定要便捷,如支持微信快速登錄等,降低群眾的使用成本。同時,線下活動使用微信API掃碼授權的方式來獲取用戶信息。其次,通過網絡爬蟲技術合法獲取互聯網公開信息,向當地政數局申請服務器資源,構建HDFS文件系統和HBase數據庫,并使用Kafka消息存儲技術完成數據存儲。最后,定期通過各維度來對當前數據進行分析,從而科學地指導下一步工作,高效開展群眾藝術普及工作。

人工智能在文化館藝術普及的應用

本文所介紹的人工智能包括NLP自然語言處理以及深度學習。其中,NLP在信息檢索、文本分類以及自然語言推理方面有著很廣泛的應用,人機對話、機器客服便是基于該項技術完成的。而深度學習是學習樣本數據的內在規律和表示層次,從而讓機器具備人類識別圖片、文字的能力,前者在某種程度上使用后者的相關方法來完成語言處理。當前,用戶使用文化館的線上系統查詢檢索的體驗較差,滿意度不高,因此可以基于上文的大數據平臺完成以下內容。

NLP在文化館自然語言處理的應用

NLP主要通過建模配合大量的樣本訓練來實現對用戶輸入語句的分析處理。當前,全國大多數文化館的線上資源搜索還只是選擇下拉框或關鍵字模糊查詢,這種方法只適合對鍵盤操作較為熟練以及清楚了解查找資源種類的群眾,如果是老人或兒童就無法很好地進行操作。因此,如果系統支持群眾輸入日常用語即自然語言或通過話筒輸入聲音,再使用第三方軟件轉換為自然語言來進行搜索就會極為便利,而從自然語言中提取關鍵詞語的這一過程就要交給NLP來實現。

1.準備樣本

此處的樣本就是用戶進行資源搜索的樣本數據,如“我想找三鄉茶果的制作視頻”,樣本的準備通常可以使用下述方法進行收集。首先是問卷調查,通過大范圍地向群眾發放調查問卷來收集,其次是暫時使用第三方的NLP程序,使用時記錄用戶的搜索語句,最后是程序通過代碼批量生成樣本。其中,比較推薦前兩種方法,因為第三種方法生成規律是固定的,會導致模型過擬合,即在訓練時模型表現很好,但在實際使用時效果很差。

2.樣本處理

這里通過人工標注的方式對收集到的樣本進行處理,首先要確定如下的標注規則。B,即Begin,表示開始;E,即End,表示結尾;S,即Single,表示單個字符;O,即Other,表示其他,用于標記無關字符;P,即Place,表示地名;C,即Category,表示種類;A,即Article,表示物品。如上例中“我想找三鄉茶果的制作視頻”可以輸入如下,“B我S想S找S三鄉P茶果A的S制作O視頻CE”,通過類似的格式將收集到的所有樣本進行處理。

3.模型訓練

首先,將70%的樣本數據作為訓練集,30%的樣本數據做測試集,然后使用深度學習Keras框架搭建模型,該框架可以在創建的模型中直接調用各種算法,且全部開源。模型使用BiLSTM+CRF命名實體算法來實現,其中BiLSTM是Bi-directional Long Short-Term Memory的縮寫,CRF指的是條件隨機場。整個模型分為三層,第一層為Embedding層,該層將訓練集中的離散向量轉換為連續向量;第二層為BILSTM層,計算發射矩陣,以此來判斷當前屬性關鍵詞屬于哪個標簽;第三層為CRF層,該層引入當前屬性的上下文信息,由此增加模型成功率。設置完成后使用訓練集進行模型訓練,并根據訓練數據對模型進行不斷調優,最后使用測試集進行驗證,通過上述方法最終得到滿意的模型。

4.模型應用

模型訓練成功后便可以投放到線上進行實際調用,群眾在線上系統搜索心儀資源時,只要錄入自然語言便可以調用模型進行文字解析并完成查詢、返回結果。以上文樣本為例,當用戶輸入“我想找三鄉茶果的制作視頻”,系統將其作為入參傳遞給模型,模型經過解析后分析出當前語言中含有P樣本(三鄉)、A樣本(茶果)以及C樣本(視頻),并將該結果返回給系統進行查詢,繼而給用戶展示其想要的結果,人機對話也是建立在上述模型解析的基礎上進行的。

深度學習圖像識別在文化館資源檢索的應用

圖像識別原理和NLP自然語言處理原理相同,都是對樣本進行標注后在深度學習平臺上調用相關算法進行模型訓練,并將訓練好的模型設置在系統上供群眾調用。不同點在于,NLP是針對文字進行處理的,而圖像識別是針對圖片、視頻。因此,所調用的算法也不相同,模型的訓練算法在Keras上全部開源可以直接調用,其性能以及使用場景在相關學術論文都已經進行闡述,只要選擇適合當前業務場景的即可。上線該功能后,群眾可以在看展覽時或者日常生活中對感興趣的事物拍照,并將照片上傳系統,通過模型進行檢索獲得想要的信息進行學習,通過該功能群眾可以自主地利用文化館的線上資源開展藝術的學習。

當文化館應用大數據及人工智能技術后,海量的、有價值的群眾活動數據便可以源源不斷進行收集,并通過大數據分析得到每個活動在不同地區的參加情況以及不同時間哪類活動更受群眾歡迎。這時,文化館再以上述分析結果為依據,有針對性地、科學地安排各種活動,便可以發揮活動的價值,最大限度地增加受益群眾。同時,群眾在操作線上系統時,也可以更加智能化、更加人性化地檢索藝術資源或進行信息問詢,用戶的滿意度和黏性會大幅提高,從而更好地開展群眾藝術普及工作。文化館以“大數據+人工智能技術”為抓手,便可以直擊當前業務痛點,順應技術發展潮流,助力打造數字文化館。

猜你喜歡
群眾用戶藝術
始終和群眾融為一體
當代陜西(2021年6期)2021-07-22 06:48:48
多讓群眾咧嘴笑
當代陜西(2021年1期)2021-02-01 07:18:22
紙的藝術
“群眾來求助”等十六則
為群眾美好生活執著追求
人大建設(2018年1期)2018-04-18 11:29:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
因藝術而生
Coco薇(2016年2期)2016-03-22 16:58:59
藝術之手
讀者(2016年7期)2016-03-11 12:14:36
主站蜘蛛池模板: 婷婷久久综合九色综合88| 国产欧美中文字幕| 久久国产精品无码hdav| 国产无码在线调教| 无码AV日韩一二三区| 五月天久久婷婷| 国产靠逼视频| 亚洲黄色网站视频| 多人乱p欧美在线观看| 日本亚洲国产一区二区三区| 国产黄网永久免费| 婷婷伊人久久| 天天色综合4| 婷婷丁香色| 2021最新国产精品网站| 国产精品亚洲日韩AⅤ在线观看| 91视频99| 国内精品视频| 亚洲中文字幕97久久精品少妇| 婷婷综合缴情亚洲五月伊| 国产精品浪潮Av| 青草精品视频| 日韩免费成人| 亚洲无码电影| 亚洲狠狠婷婷综合久久久久| 精品亚洲国产成人AV| 999精品视频在线| 成人va亚洲va欧美天堂| 亚洲精品高清视频| 欧美精品成人一区二区视频一| 尤物国产在线| 国产精品黑色丝袜的老师| 婷婷六月综合| 国产一区二区福利| 视频在线观看一区二区| 毛片久久久| 久久永久免费人妻精品| 欧美色图久久| 久久综合丝袜日本网| 六月婷婷激情综合| 噜噜噜久久| 99精品福利视频| 日韩第一页在线| 亚洲国产第一区二区香蕉| 亚洲国产中文精品va在线播放| 好久久免费视频高清| a亚洲天堂| 免费可以看的无遮挡av无码| 亚洲成人网在线观看| 国产福利小视频高清在线观看| 毛片大全免费观看| 久久无码免费束人妻| 五月婷婷激情四射| 国产精品视频系列专区| 激情六月丁香婷婷| 老司机精品99在线播放| 国内精品一区二区在线观看| 欧美色图第一页| 国产午夜人做人免费视频| 国产第一页亚洲| 久久无码av三级| 欧美日韩国产在线播放| 婷婷综合缴情亚洲五月伊| 久久国语对白| 99er精品视频| 欧美a√在线| 国产日韩欧美在线视频免费观看| 亚洲一区二区三区国产精品| 国产99视频在线| 精品视频一区在线观看| 波多野结衣一区二区三视频| 免费在线色| 国产成人无码综合亚洲日韩不卡| 九色综合视频网| 国产精品一区二区久久精品无码| 国产女人在线视频| 国产成人久久综合777777麻豆 | 国产自视频| 国产专区综合另类日韩一区| 国产精品爆乳99久久| 日韩欧美国产成人| 久久久久人妻一区精品|