999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

云端結合的書法大數據平臺

2020-08-17 07:54:58楊頤李國清王健王海軍翟翊辰黃衛星
浙江大學學報(理學版) 2020年4期
關鍵詞:書法創作智能

楊頤 ,李國清 ,王健 ,2,王海軍 ,翟翊辰 ,黃衛星 ,2*

(1.中國科學院自動化研究所,北京100190; 2.中科君勝(深圳)智能數據科技發展有限公司,廣東深圳518000)

書法創作、書法教育和書法交流等已成為書法文化發展和普及過程中的重要需求。由于書法愛好者分布在不同的地域,傳統孤島式的書法創作、交流和教學方式已不適應現代社會信息聯通共享的模式。隨著互聯網的發展和大數據技術的逐漸成熟,數字書法技術與互聯網和大數據技術的結合愈加緊密。為了實現傳統與現代書法創作的協同體驗,打通書法愛好者之間的信息鴻溝,書法作品數字化創作、書法作品集協同共創和書法作品智能評估等已成為當前書法行業的重要需求。

本文提出了云端結合的書法大數據平臺,將線下智能書法臺終端、線上網站前端與云平臺相結合,通過人工智能技術,提供資源共享、協同創作、經驗交流和可視分析等智能化服務,實現了書法創作的傳統模式與現代模式的有效結合。

下文安排如下:第1 節介紹相關研究成果;第2節介紹云端結合的書法協同體驗;第3 節介紹書法大數據平臺的功能、設計和技術;第4 節介紹平臺所提供的智能服務;第5 節展示書法大數據平臺的典型應用案例;第6 節對書法大數據平臺進行實驗和評估;第7 節為結論與展望。

1 相關研究

大數據平臺是一種基于云計算和大數據技術[1-2]的軟件平臺系統,通常會集成分布式數據庫、大規模并行處理、算法庫等核心功能子系統,能夠對快速產生的海量數據進行數據管理、計算、分析和展示。

文化大數據平臺面向文化領域,通過大數據技術,為用戶提供數據采集和管理、分布式計算和智能服務等技術。

漢字文化數字化平臺[3-4]是基于云計算的漢字文化綜合體驗平臺,對漢字文化數據進行存儲、管理和分析,具有為用戶提供交互式體驗之功能。

數字圖書館是各國都非常重視的文化大數據平臺,聯機計算機圖書館中心(online computer library center,OCLC)(http://www.oclc.org)是世界著名的文獻信息服務系統,用戶可以檢索文獻、查找文獻所在地以及享受借閱服務。中國高等教育文獻保障系統(http://www.calis.edu.cn/)是受政府資助的全國教育文獻大數據平臺,平臺信息共享,助力高等教育發展。

在公共文化領域,用于公共文化大數據平臺構建的技術也有進展。如公共文化資源推薦技術[5-8]、公共文化知識圖譜技術[9]等。

在線數字博物館系統也屬于文化大數據平臺。谷歌推出在線藝術平臺(google art project)(http://www.googleartproject.com/),與全球著名藝術館合作,通過虛擬現實技術和高分辨率圖像技術,展示藝術作品。百度與我國知名博物館合作,推出了百度百科數字博物館(http://baike.baidu.com/museum),利用虛擬現實等技術提供視頻和音頻講解,使用戶身臨其境地欣賞。

智能書法臺[10-11]是基于毛筆筆式的人機交互智能書法體驗設備,能夠對毛筆書法書寫過程數字化,允許用戶使用真實毛筆在大屏幕數字書法臺上進行創作、臨摹、學習、保存和分享,既保留了傳統的書寫方式,又加入了現代科技元素,彌補了傳統書法的不足。智能書法臺實時采集用戶書寫行為數據,并傳輸至書法大數據平臺。

上述相關研究在文化資源數字化、數字資源共享、用戶數字化體驗等方面已經做出了顯著貢獻,但仍然存在一些有待解決的問題。首先,數字化資源雖然通過互聯網得以共享,但因用戶之間缺乏有效的溝通,從而限制了文化的交流;線上的虛擬體驗和線下的實體體驗都極大地提高了文化的數字化體驗水平,然而,很少有將線上與線下打通的系統或平臺,使得文化體驗的多維度和整體性受限;數字化工程將著名的文化資源數字化,但很少關注普通用戶創造的數字化文化資源,制約了文化的多樣性發展。

針對上述問題,筆者研發了書法大數據平臺,通過與智能書法臺結合,形成線上線下的全維度用戶體驗模式,將用戶的數字化作品作為資源進行管理,同時,可提供面向用戶作品的線上交流途徑。

2 云端結合的書法協同體驗

書法大數據平臺包括前端的書法體驗網站和后端的云平臺,如圖1 所示。書法體驗網站將智能書法臺的創作、學習和分享等體驗環節相結合,形成書法體驗的線上線下模式,組織和引導用戶間的協作,進行集體創作、社群交流和共同學習。云平臺可為智能書法臺和書法體驗網站提供書法資源大數據和智能服務,包括書法字體識別、用戶興趣分析、精準推薦以及為文化研究者提供智能可視分析等服務。

圖1 書法大數據平臺框圖Fig.1 The diagram of Chinese calligraphy big data platform

傳統書法創作與交流的特點是獨立創作、獨享(或者小范圍共享)作品,而信息時代注重協作與共享。協同體驗,即將書法創作、學習和交流的傳統方法與互聯網思維相結合,實現創作協同化、學習高效化、交流全局化和作品共享化。書法大數據平臺,通過充分挖掘書法大數據和用戶行為大數據,進一步增強書法協同體驗效果。協同體驗包含:傳統書法與科技方法的協同、線上與線下的協同以及個人用戶與群體用戶之間的協同。

傳統書法與科技方法的協同,體現在用傳統的毛筆書寫形式在數字化、智能化的書法臺上書寫,既保留了傳統的書寫方式,又融合了由現代科技支持的高效資源利用和創作信息存儲。

線上與線下的協同,體現在線下智能書法臺和線上體驗網站的O2O 模式,線下創作的作品可以保存在書法大數據平臺,供書法體驗網站使用。同時,后端云平臺也為智能書法臺提供海量書法資源和智能服務。

個人用戶與群體用戶之間的協同,主要體現在用戶可以自由參與作品集的創作和編寫,發揮用戶集體智慧的優勢,形成書法的協同創新模式。在此基礎上,將單一的書法創作行為演化為群體參與的、具有群體智能的協同創作模式,形成書法創作服務的新業態。

總之,本文應用示范的目標是提供數字化書法創作、書法作品集協同創作、在線書法作品競技等服務,將文化休閑與文化傳播有機結合,從而增強書法的可玩性、趣味性與共享性。

3 書法大數據平臺

3.1 平臺總體架構

書法大數據平臺總體架構如圖2 所示。

3.1.1 數據生產層

書法資源數據主要由智能書法臺和書法體驗網站產生。智能書法臺產生用戶創作的書法作品和用戶行為數據,如搜索和使用的資源數據等。書法體驗網站產生用戶參與創作的作品集、用戶書法競技數據、用戶對作品的評價等行為數據,以及用戶之間的社交數據。書法作品和書法資源等數據生成的速度雖然不快,但每項數據的容量都較大且格式不盡相同,有圖片格式、視頻格式、文本格式、音頻格式等。用戶行為數據的特點則與之不同,更多的是以日志形式傳輸和保存每條記錄,由于生成速度快,同樣可在短時間內產生海量數據。這2 種數據使得書法大數據具有海量、多源、異構等特點。目前書法大數據平臺已有的圖片格式書法字典資源、高清圖片格式書帖資源、高清格式書法教學資源、高清名作圖片、多媒體集字創作作品等,數據已達TB 級。每周產生的用戶行為數據也在GB 級。因此,書法大數據平臺的數據具有高復雜性和大容量等特點。

圖2 書法大數據平臺總體架構Fig.2 System architecture of Chinese calligraphy big data platform

3.1.2 數據采集與存儲層

從智能書法臺和書法體驗網站采集相應數據,并保存在云平臺的數據庫中,包括用戶數字書法資源數據、用戶數字書法作品數據、用戶行為數據和用戶社交數據等。

3.1.3 數據處理層

將采集到的數據進行預處理,包括數據清洗、數據消重、數據對齊以及數據融合等。

3.1.4 數據計算層

數據計算層提供書法協同體驗所必需的核心智能計算支撐。用模式識別法對書法資源和作品內容進行識別;通過分析用戶行為數據,建立興趣模型;用用戶社交分析算法,分析用戶對其他用戶作品的評價和對書法比賽等的互動情況,挖掘隱性好友;將用戶創作信息構建為知識圖譜,以支撐檢索和進行推薦。

3.1.5 智能服務層

基于數據計算層,為書法體驗網站提供用戶體驗所需的關鍵功能服務:

· 書法作品集協同創作與競技:書法作品集的內容結構管理和檢索、作品發表時序結構管理和檢索;書法競技作品對比評估等;

· 書法創作的可視分析:通過數據可視化與機器學習相結合的方式,對書法活動進行多層次、多維度的數據分析,發現創作特點和趨勢;

·書法資源與作品的共享:智能選取合適的書法資源和作品,進行展示和共享;

·書法資源與作品的評估:結合用戶對書法作品的群體評價,進行綜合計算和智能評估;

·書法資源與作品的多模態搜索:提供關鍵字搜索和以圖搜圖等高級搜索功能;

·書法資源與作品的個性化推薦:為用戶推薦可能感興趣的書法資源和其他用戶的作品。

3.1.6 用戶訪問層

提供訪問功能,包括注冊、登錄等權限控制以及通過的接口技術。

3.1.7 數據管理

書法大數據平臺的數據管理,包括數據安全管理(如數據加密)、數據質量管理(如規范數據格式)、元數據管理、用戶數據管理以及書法作品數據的版權保護(如數字水?。┑?。

3.1.8 平臺管理

進行用戶管理、訪問管理、性能監控和安全管理。用戶管理模塊,主要管理用戶數據,同時,為用戶分配角色,根據用戶的角色控制用戶的訪問權限。訪問管理模塊,結合基于角色的權限控制方法,定義分級訪問權限,包括訪客用戶、一般用戶、高級用戶、管理員用戶。性能監控模塊,主要通過研發的可視化界面對平臺性能和主要模塊進行監控。由于每個模塊都有各自的可視監控系統,將這些監控系統的監控頁面集成到一個web 網站上,以便進行統一監控。集成的監控系統和工具有:Zabbix 對平臺應用性能的監控工具、PHPMyAdmin 的MySQL 監控系統、Hadoop 和HBase 自帶的圖形監控系統、MongoDB Compass監控工具 、Ceph自帶的圖形監控工具,以及使用Ganglia 對平臺的監控,實時查看虛擬機集群中的各項性能指標。安全管理模塊,依靠Kerberos 技術和反向代理服務器技術實現安全管理。為保證平臺虛擬主機之間對文件的安全訪問,采用Kerberos+SSL 方案,實現機器級別的安全防護,未經認證的主機無法訪問數據,從而有效防范偽裝虛擬主機惡意破壞數據。反向代理服務器能起防火墻作用,如NginX 服務器可隱藏服務器IP 地址,從而實現對平臺的保護。

3.2 平臺技術堆棧

書法大數據平臺技術框架如圖3 所示。

3.2.1 基礎層:管理數據庫、計算框架和平臺系統

數據庫:管理結構化、半結構化和非結構化數據,以及索引數據和元數據。各類數據庫系統的性能和特色各不相同,已有研究對其進行了科學評估[12-16],本文根據研究成果進行技術選型。結構化數據管理采用MySQL Cluster 分布式關系型數據庫集群,主要負責存儲系統的主數據,如用戶數據及各模塊中的關系數據;半/非結構化數據管理,HBase數據庫和MongoDB 分布式數據庫以及HDFS 分布式文件系統主要用來存儲和管理日志數據;索引數據管理,用MySQL 存儲非結構化數據的索引,如將視頻和圖片存放在Ceph 系統,地址存放在MySQL,以方便檢索;元數據管理,存儲各類數據的元數據信息,MySQL 主要負責有明確Schema 的元數據,MongoDB 負責 Schema 不確定或者無 Schema 的元數據,HDFS 系統主要用于大容量塊文件的存儲和管理,對于海量小文件,如視頻資源、高清圖片等數據,HDFS 的效率非常低,可用Ceph 文件系統管理海量高頻訪問的小文件。

計算框架:基于Tensorflow 的深度學習計算框架、基于Hadoop MapReduce 的海量數據批處理技術、基于Apache Spark 的內存計算框架和實時計算技術。

平臺系統:對主要功能提供支撐,對平臺提供管理,包括緩存系統、安全系統、負載均衡和日志系統管理。

圖3 書法大數據平臺技術框架Fig.3 The technical framework of Chinese calligraphy big data platform

3.2.2 服務支撐層:為體驗層提供智能計算支撐和服務。

智能服務:整合創作知識圖譜和智能算法庫,構建智能方法并通過API 為書法體驗網站用戶提供智能服務。

書法創作知識圖譜:通過分析用戶的創作數據,挖掘用戶與作品之間的關系,構建圖譜。

算法庫:基于計算框架,根據協同體驗的需求構建算法庫,主要用于書法字識別、自然語言處理、智能信息檢索和時間序列分析等。

3.2.3 體驗層:面向終端用戶

終端用戶包括線下的智能書法臺和線上的書法體驗網站。

3.3 數據流

書法大數據平臺的數據流分為數據采集階段數據流和書法協同體驗階段數據流。

3.3.1 數據采集階段數據流

數據采集階段數據流主要從智能書法臺和書法體驗網站流向書法大數據平臺。智能書法臺的數據輸入模塊通過RESTful HTTP 接口將書法作品和用戶行為數據上傳至書法大數據平臺的臨時數據庫;臨時數據庫由MySQL 構建,用戶作品圖片以二進制對象的方式存入MySQL 數據表;用戶行為數據則以日志文件形式存放在Linux 的文件系統中。同理,書法體驗網站也通過RESTful HTTP 接口將采集到的用戶創作數據存放在臨時數據庫。隨后,平臺的數據預處理層對臨時數據庫中的數據進行預處理:提取圖片作品的元數據,將元數據存放在MySQL 或者MongoDB 數據庫,將圖片數據存放在Ceph 系統;讀取并清洗日志文件中的信息,按照平臺定義的用戶行為數據格式進行格式轉換,并將其存儲于由HDFS 和HBase 組成的數據庫中,完成數據采集。

3.3.2 書法協同體驗階段數據流

在數據應用階段,也就是書法協同體驗階段,數據流主要從書法大數據平臺后端支撐平臺的數據庫和計算系統流出。智能服務系統需要具有整合書法創作知識圖譜和智能算法庫的功能。書法創作知識圖譜基于數據庫中的用戶作品元數據構建,將作品和元數據定義為節點,作品節點通過元數據節點連接,構成異構的書法創作知識圖譜數據,采用RDF三元組數據結構描述圖譜;智能算法庫主要由提供智能算法函數的Apache Mahout 框架構成。在知識圖譜數據上對智能算法庫中的算法進行分析,最終形成智能服務,供書法體驗網站的終端用戶使用。

3.3.3 書法創作可視分析工作流

書法創作可視分析工作流如圖4 所示,通過智能書法臺將創作的作品圖片和相關信息傳輸到服務器,經過請求、解析等預處理,將一部分數據保存到數據庫中,用于分析用戶的歷史行為;將另一部分保存到緩存系統中,用于實時分析作品。對用戶作品進行交互式可視分析:通過調整算法參數進行歷史數據分析;通過調整實時數據的過濾參數進行多維度實時作品創作行為分析;通過調整可視化視圖的視角進行多視角數據分析。其中的關鍵技術包括:

· 基于流數據處理的實時數據監控技術:使用流數據處理技術,實時采集智能書法臺的書法數據,通過微服務接口傳輸至消息隊列,并通過前端實時更新瀏覽器端數據。

· 基于語義縮放的多尺度時空數據可視化技術:面向時間維度和空間維度,使用多尺度可視化技術,進行多尺度分析,通過語義縮放技術,實現概觀和細節的平滑切換。

· 基于書法字識別的高維數據可視分析技術:涉及用戶書寫行為數據、時間數據、位置數據、作品語義數據等高維異構大數據,提供高效的人機交互,實現易用、易懂和快速的可視分析。

3.4 數據源

書法大數據主要包括書法資源數據(存量數據)和用戶的書法創作數據(增量數據)。書法資源數據包括超高分辨率字帖和碑帖圖片、高清書法視頻、書法百科等。書法創作數據則是用戶在智能書法臺和書法體驗網站進行書法作品創作和作品集創作的數據,包括作品數據和用戶創作過程中的行為數據。用戶在智能書法臺的創作數據通過網絡傳輸至書法大數據平臺,書法體驗網站的用戶創作數據則通過日志系統進行實時采集。

圖4 可視分析工作流Fig 4 Workflow of visual analytics

3.5 數據安全

書法大數據平臺用反向代理服務器作為防火墻。用SSL、HTTPS 和Kerberos 等技術保障數據傳輸安全;基于角色的訪問控制,實現數據訪問的安全控制。SSL(secure sockets layer)是一種網絡傳輸安全協議,使用非對稱的公鑰加密算法,對傳輸數據進行加密,防止在網絡傳輸過程中被篡改和竊取。HTTPS 協議即HTTP+SSL,可保證用戶前端所發送數據的安全性。平臺還部署了Kerberos 服務器,并且在每個節點和Kerberos 服務器之間都建有共享密鑰,實現集群節點之間的安全訪問。使用Kerberos+SSL 策略實現平臺集群級別的數據安全傳輸。

由于安全性能測試較復雜,本文主要通過所用技術提供的安全理論來評估平臺的安全性能。

4 智能服務

4.1 云端結合的數字書法創作與學習服務

智能書法臺是線下終端,其中用到的字帖、碑帖等書法資源由書法大數據平臺管理。智能書法臺采集用戶創作數據,通過互聯網將作品等重要數據傳輸至書法大數據平臺,平臺通過分析這些數據,提供多種智能服務,如用戶作品智能評價、書法資源語義檢索、書法資源推薦等。

4.2 數字書法作品集協同創作服務

書法體驗網站是書法大數據平臺的線上前端,提供群體協同創作服務。用戶在書法體驗網站創建書法作品集創作組,如《李白詩集》書法創作組,并允許其他用戶參與符合主題的數字書法作品的創作,形成作品集。創作組成員可以在智能書法臺續寫書法作品集并上傳,以擴充作品集。線上網站結合線下設備,借助智能協同創作算法實現協同書法創作,多人多用戶合作完成一部書法作品。

4.3 在線書法作品競技及交流服務

書法體驗網站提供在線書法作品競技服務,允許用戶對其他用戶創作的書法作品發表評論,并展示自己創作的相同內容或相同風格的作品,供對比討論。書法體驗網站提供作品資源推薦服務,通過分析用戶的創作和行為數據,為用戶推薦競技交流的作品。

4.4 數字書法創作的可視分析服務

書法大數據平臺通過基于流計算模型的實時數據流分析技術,實時處理高維數據;使用基于地圖的動態顯示技術,實現對智能書法臺等設備的實時監控和分析。用戶可以通過基于交互式機器學習的可視分析技術,對時間序列數據和地理空間數據進行多層次、多尺度的聚合分析,根據海量歷史數據進行多維度統計分析和趨勢分析。使用基于目標檢測的圖像分割算法和基于深度學習的毛筆字手寫識別算法,分析書法大數據平臺的書寫內容,識別數字書法作品內容,并統計分析書寫熱詞。同時,通過對基于循環神經網絡的用戶活躍度,包括時間、地點和書寫內容等數據進行分析,識別用戶創作行為模式,分析用戶活躍度,挖掘潛在用戶。

5 應用案例

5.1 基于協同創作模式的數字書法作品集創作

首先,建立數字化共享書寫模式,在社區、文化館、圖書館、火車站、機場、博物館、文化館、高校、文化機構、文化展廳投放智能書法臺,為數字書法創作提供便利。在書法集字和集書活動中,鼓勵分布在不同地點的用戶共同參與創作。例如,某一用戶在書法體驗網站發起《李白詩集》書法創作活動,參與用戶可分別在不同的智能書法臺進行創作,最后匯集到書法大數據平臺,平臺自動進行集書內容結構構建?;顒咏Y束后,數據進入分析系統,形成智能化的評分和評價,也可以在網站、移動APP 等終端進行人工評價,人工評價內容可反饋到分析模塊,形成最終評分。完成眾創作品《〈李白詩集〉書法創作》后,可以下載、打印甚至出版,也可用于制作文化創意小禮品等,如圖5 所示。

該模式的優勢和亮點在于,第1,融合大數據和人工智能支持的書法文化休閑與傳播的全新模式。第2,與大數據技術緊密結合,為用戶提供書法知識、書法作品和交流伙伴的個性化推薦服務。第3,基于大數據的智能評價體系,通過計算機視覺技術和美學計算方法,結合用戶的評價和評估,研究綜合評價指標和算法,實現對書法作品的智能量化評價,使書法作品可量化、可比對、可訂制、可分享、可結集,使其成為一種經濟、環保、便利的集文化旅游、休閑和社交于一體的新模式。

圖5 群體書法集創作Fig.5 Crowd-based calligraphy collection

5.2 基于協同評估模式的共享學習和數字書法競賽

在書法教學過程中,對參賽作品的點評是其中的一個重要環節。書法老師可以在書法體驗網站創建課程組,邀請學員加入,學員可在智能書法臺進行書寫練習,并將作品上傳至書法大數據平臺,書法老師可在書法體驗網站,對作品進行點評和指導,其他學員也可就作品進行交流討論。如果書法老師或其他學員認為該作品存在不足,并希望親自重寫示教或交流比較,則可在智能書法臺進行創作,將其發布在書法體驗網站,并與原作品做比對。當眾多學員分別書寫書法作品并進行比較時,會形成書法作品比賽,書法老師可以對比賽進行點評和打分,學員也可以參與評分和討論。

該模式的優勢在于:第1,省去了一般性書法比賽煩瑣的征稿、匯總、評選等環節,可以隨時隨地發起比賽,由系統自動處理,效率成倍提高,且不受時間、空間的限制,節省了大量的比賽成本。第2,作品比賽結果既可以提交給書法專家進行評價,也可以由書友投票評選。此外,書法體驗網站具有的書法作品智能協同評估功能,可綜合各方評價,對作品進行綜合評價和排名,保證評選的公正性和合理性。第3,鑒于書法類競賽的特殊性,在大數據的支持下,可以兼顧文化知識、詩詞等相關方面的競賽,使書法回歸傳統文化大道。第4,通過對書寫動態過程的數據采集和軌跡分析,了解用戶書寫動作的基本狀態,進而分析書寫者興趣、書法技能等,形成對個人綜合修養、文化素質等多維評價結果。

5.3 數字書法創作行為的可視分析

文化研究者或社會研究者,通過書法大數據平臺提供的可視分析功能,對數字書法創作行為進行多層次、多維度分析。

書法大數據平臺的可視分析界面如圖6 所示,中間部分是地圖視圖,展示了智能書法臺的地理空間分布,其中,紅色圖標代表智能書法臺所處的位置。研究者通過觀察圖標跳動情況,實時了解活動動態和活躍程度。在智能書法臺前端向云平臺發送的實時創作數據中,包括了智能書法臺所在地的相關信息,如智能書法臺的IP 地址、人工標注的智能書法臺部署地點等。此外,書法創作可視分析還可提供多層次的統計分析和預測。通過統計分析作品的歷史數據,可以發現書法創作活動的時間性信息和空間性信息,這些信息有助于分析社會文化活動規律。分析者可根據需求,通過交互,調整時間和地理空間參數,實現不同尺度的時空數據分析。圖6左側展示了年、月、日、小時等不同時間尺度信息,右側則展示了省級、市級等不同空間尺度信息。除了進行統計分析外,平臺還提供對未來一段時間用戶創作活動趨勢的預測。

圖6 可視分析界面Fig.6 GUI of visual analytics

書法創作可視分析具有內容識別功能,用戶創作的書法作品可以圖片格式保存,通過筆者研發的書法字識別算法實現對圖片中書法字的識別。

構建了基于VGG 神經網絡模型的深度學習模型,使用TinyMind 第一屆漢字書法識別挑戰賽的數據進行訓練,數據包含100 個常用漢字,每個漢字有400 張圖片。經過模型優化,楷書和行書的識別率達到93%,隸書的識別率約為85%,但草書和篆書的識別率較低,低于50%。對楷書和行書的書法字內容識別基本達到了可用的程度。將被識別出的書法字保存在數據庫中,可作為作品的元數據。

6 實 驗

對書法大數據平臺進行了實驗和分析。實驗重點聚焦于平臺整體的有效性和擴展性。書法大數據平臺是基于云計算架構的分布式系統,相比傳統集中型架構系統,其優勢更多體現在擴展性上。本實驗擬驗證:相對于傳統的集中型架構系統,書法大數據平臺能夠在保證良好性能的前提下,提供更強的擴展能力。

6.1 書法大數據平臺性能實驗

本實驗使用的指標是并發請求量、平均響應時間和平均吞吐量。并發請求量是指同一時刻向服務器發送請求的數量。響應時間是指從發出請求到返回結果所耗費的時間。平均響應時間是指在一定時間周期內批量請求響應時間的均值。平均吞吐量為每秒處理請求的數量。

6.1.1 實驗設計

將書法大數據平臺與傳統架構系統分別部署在相同云環境的Linux 虛擬機上。基本配置如表1 所示。2 個實驗系統的軟件均采用默認配置,未進行特定優化。傳統架構系統的虛擬機共4 臺,分別部署了 Tomcat 服務器、MySQL 服務器、MongoDB 服務器、Linux 文件服務器。書法大數據平臺包含1臺NginX服務器 、2 臺 Tomcat服務器、2臺部署MySQL Cluster集群、1臺 MongoDB 服務器、3 臺部署 Hadoop和HBase系統、2臺部署在 Linux 上 的Ceph 文件服務器。

6.1.2 實驗工具及方法

使用Apache JMeter,通過多線程以線性增長的方式分別向2 個系統發送500 個請求,記錄并統計吞吐量和平均響應時間。請求的類型包括主頁訪問、訪問MySQL 數據庫以及磁盤文件訪問的http請求。

表1 實驗環境Table 1 configuration

6.1.3 實驗結果及分析

實驗結果如表2、圖7 和圖8 所示。

由表2 可知,書法大數據平臺的起始平均吞吐量略微低于傳統架構系統,這是由分布式系統的消息通信特性所造成的。傳統架構系統在并發請求量達到150 后,平均吞吐量增長減緩,并逐漸接近峰值;在并發請求量為300 時出現瓶頸。書法大數據平臺在并發請求量為400 時達到峰值,之后平均吞吐量大幅下降。所以,書法大數據平臺比傳統架構系統有更好的吞吐能力,且每秒處理請求的能力是完全可以接受的。2 個系統的平均響應時間在并發請求量在300 以內時都是可以接受的。但傳統架構系統在并發請求量高于300 時,平均響應時間明顯增長,說明系統性能已到瓶頸,而書法大數據平臺因采用分布式結構,當并發請求量高于400 時,平均響應時間才明顯增長,系統性能開始下降。這與平均吞吐量實驗結果一致。

圖7 為2 個實驗系統平均吞吐量的實驗結果??傮w來說,2 個系統的平均吞吐量變化趨勢都是正常的,在請求發送初始階段,并發請求量還未達到系統的吞吐飽和量,平均吞吐量呈增加趨勢。隨著并發請求量的增加,需要系統處理的量越來越大,逐漸達到飽和,此時,系統剛好能處理發來的全部請求,平均吞吐量達到頂峰。當并發請求量繼續增加時,系統不足以處理發來的請求,出現瓶頸,平均吞吐量開始下降。

圖8 為2 個試驗系統平均響應時間的實驗結果??傮w來看,2 個系統平均響應時間都隨并發請求量的增大而變長,但書法大數據平臺的平均響應時間略長于傳統架構系統,原因為書法大數據平臺的分布式消息傳遞造成延時。

表2 實驗結果Table 2 Experimental results

圖7 平均吞吐量實驗Fig.7 Experiment of average throughput

圖8 平均響應時間實驗Fig.8 Experiment of average response time

綜上,書法大數據平臺的系統性能在并發請求量不大時與傳統架構系統的性能相差不大,隨著并發請求量的增加,其性能優勢漸顯,同時,書法大數據平臺的絕對處理能力符合Web 應用系統的性能要求。

6.2 書法大數據平臺性能魯棒性實驗

從書法大數據平臺的平均響應時間實驗看,當并發請求量為400 時出現拐點,之后出現瓶頸,性能開始下降,同樣的情況出現在平均吞吐量實驗上。在出現瓶頸的情況下,對書法大數據平臺進行水平擴展,分析其性能是否能夠穩定在合理水平。實驗擬證明書法大數據平臺可以通過水平擴展增大并發處理能力,保證平臺的魯棒性。

6.2.1 實驗設計

書法大數據平臺由多種子系統構成,為了降低實驗的復雜度,采用簡單方式進行擴展性實驗。共進行了4 組實驗,每組實驗平臺都在前一實驗的基礎上進行水平擴展,記錄并分析每組實驗的平均吞吐量瓶頸。實驗使用的虛擬機節點量如表3 所示。

表3 書法大數據平臺擴展性實驗配置Table 3 Setup of experiment of expansibility單位:臺

6.2.2 實驗結果及分析

實驗結果如圖9 所示。由圖9 可知,隨著書法大數據平臺的擴展,平均吞吐量呈增長趨勢,系統性能得到增強。因此,書法大數據平臺能夠通過水平擴展增強其并發處理能力。實驗驗證了書法大數據平臺是有效的,也驗證了此前的猜想。

綜上,書法大數據平臺的架構在性能上符合應用要求,并具有較好的水平擴展能力,可根據實際需要擴展和增強系統性能。

圖9 書法大數據平臺擴展性實驗結果Fig.9 Experiment of expansibility of the platform

7 結論與展望

隨著互聯網、大數據和人工智能等技術的突破性進展,書法作為中國傳統文化的瑰寶,亟須將傳統方式與信息化和智能化技術相融合。

提出的書法大數據平臺,通過云平臺與線上線下的終端相結合,在共享、交流、創作和分析等方面,為用戶提供智能化服務。運用大數據、機器學習、可視分析等智能化技術,實現了書法體驗的傳統與現代相結合、書法資源的線上與線下相結合、作品創作的個體與群體相結合,有助于發展和創新傳統書法的創作、交流和學習的手段和途徑,有效促進書法文化的發展,提高群眾的書法文化素養。

本文提出的書法大數據平臺,尚有一些亟待解決的問題。在平臺擴展性方面,雖然實現了對已有節點請求處理的負載均衡,但在節點自動擴展方面仍未實現智能化,下一步需要通過機器學習優化自動彈性擴展策略,實現平臺利用最大化。在平臺安全性方面也存在不足,雖然平臺使用了當前的前沿技術,但并未進行嚴格的安全測試,在安全漏洞定位和預防性安全控制方面,仍需進一步加強。由于平臺集成了大量異構數據,這些數據存在語義關聯,是很好的共享和分析資源,然而,由于其異構特點,目前還沒有打通異構數據資源之間的關聯性,下一步將聚焦異構數據集成,通過定義數據語義模型和接口,將異構數據進行集成。此外,在版權保護方面也存在不足,在資源共享過程中存在被盜版風險,未來將聚焦此問題,重點研究數字水印技術和區塊鏈在用戶協同創作中的應用,鎖定用戶版權。另外,為更好地分析書法作品的內容數據,需研究更加精準的書法字識別算法。

猜你喜歡
書法創作智能
書法
大江南北(2022年9期)2022-09-07 13:13:48
書法欣賞
求知(2022年5期)2022-05-14 01:28:58
書法
娘子關(2022年1期)2022-03-02 08:18:42
書法
娘子關(2021年3期)2021-06-16 10:56:32
創作之星
創作(2020年3期)2020-06-28 05:52:44
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
《一墻之隔》創作談
主站蜘蛛池模板: 91久久国产综合精品| 欧美一区二区丝袜高跟鞋| 亚洲日韩国产精品综合在线观看| 欧美乱妇高清无乱码免费| 亚洲天堂久久新| 在线五月婷婷| 亚洲AV电影不卡在线观看| 色婷婷狠狠干| 成人韩免费网站| 久久久久久久久18禁秘| 欧美精品不卡| 久久国语对白| 国产精品区网红主播在线观看| 伊人91视频| 色妞www精品视频一级下载| 国产日韩欧美成人| 国模视频一区二区| 国产波多野结衣中文在线播放| 色AV色 综合网站| 亚洲综合婷婷激情| 国产区福利小视频在线观看尤物 | 国产国拍精品视频免费看| 九色在线视频导航91| 手机成人午夜在线视频| 99久久婷婷国产综合精| 天天躁夜夜躁狠狠躁躁88| 国产成人精品午夜视频'| 免费女人18毛片a级毛片视频| 国产JIZzJIzz视频全部免费| 看av免费毛片手机播放| 小蝌蚪亚洲精品国产| 日本国产在线| 久一在线视频| 久久久精品无码一区二区三区| 国产在线精彩视频论坛| 欧洲免费精品视频在线| 最新国产成人剧情在线播放| 亚洲天堂免费在线视频| 成人夜夜嗨| 2021天堂在线亚洲精品专区| 欧美综合区自拍亚洲综合绿色| 国产一区二区网站| 亚洲AV无码乱码在线观看代蜜桃 | 亚洲天堂伊人| 亚洲色图欧美| 国产另类乱子伦精品免费女| 伊人久综合| 99久久精品国产自免费| 亚洲欧美一级一级a| 亚洲伊人天堂| 国产视频一区二区在线观看| 久久人妻系列无码一区| 四虎永久免费地址| 久久久国产精品免费视频| 老色鬼欧美精品| 国产精品综合色区在线观看| 亚洲日本中文综合在线| 激情综合图区| 国产女人爽到高潮的免费视频 | 欧洲欧美人成免费全部视频| 久久综合九九亚洲一区| 日韩a级片视频| 性激烈欧美三级在线播放| 成人看片欧美一区二区| 久久综合结合久久狠狠狠97色 | 黄色三级网站免费| 中文字幕2区| 999在线免费视频| 国产成年女人特黄特色大片免费| 亚洲精选无码久久久| 亚洲三级网站| 久久精品人人做人人爽电影蜜月| 精品福利国产| 国产呦视频免费视频在线观看 | 国产91在线免费视频| 免费高清毛片| 国产精品所毛片视频| 中文字幕自拍偷拍| 欧美成人a∨视频免费观看 | 99re热精品视频国产免费| 综合色天天| 国产中文一区二区苍井空|