李欣妍
不過,穩(wěn)定的流通就要確定數(shù)據(jù)的權利歸屬,才有可能產生交易的價值,并且保證安全可追溯。當前,國家層面正在加速這一方向的發(fā)展,數(shù)據(jù)相關的上市公司有持續(xù)關注的價值。
從二級市場看,截至6 月15 日收盤,人工智能板塊指數(shù)連續(xù)第三個交易日創(chuàng)年內新高。從中期維度看,AI板塊的投資人氣仍可能維持較高熱度。在整個AI 領域中,市場非常關注算力和算法,AI 芯片、光模塊、服務器、PCB 龍頭股在6 月以來的上漲中率先反彈。隨著行情不斷演繹,數(shù)據(jù)確權相關板塊股價出現(xiàn)異動,截至6月15 日,相關板塊指數(shù)過去一個月漲幅11.02%。
通過國有企業(yè)搭建的平臺,國內的數(shù)據(jù)確權服務得到推動和支持。隨著數(shù)字經濟快速發(fā)展,這些平臺有望在數(shù)據(jù)確權領域發(fā)揮更重要的作用,推動數(shù)據(jù)產業(yè)繁榮和創(chuàng)新。而以ChatGPT 為代表的人工智能加速發(fā)展,數(shù)據(jù)要素市場需求爆發(fā)。
拆分來看,數(shù)據(jù)要素產業(yè)鏈包括數(shù)據(jù)生產、流通和使用三大環(huán)節(jié)。數(shù)據(jù)是以ChatGPT 為代表的人工智能進一步發(fā)展不可或缺的基礎。數(shù)據(jù)相當于AI 算法的“飼料”,用于AI 的數(shù)據(jù)越多,AI 的算法能力則越強。作為數(shù)據(jù)的一大需求方,未來人工智能領域的加速發(fā)展,有望驅動數(shù)據(jù)需求的爆發(fā),同時有望增加數(shù)據(jù)要素交易,促進數(shù)據(jù)要素市場建設。
據(jù)國家工信安全中心測算數(shù)據(jù),2020 年我國數(shù)據(jù)要素市場規(guī)模達到545億元,“十四五”期間,這一數(shù)值將突破1749億元,整體進入高速發(fā)展階段。隨著數(shù)據(jù)要素相關政策進一步落地,技術發(fā)展使得數(shù)據(jù)要素交易易于實現(xiàn),數(shù)據(jù)要素相關公司將迎來較大的機會。
從投資細分的角度來看,數(shù)據(jù)要素產業(yè)鏈及數(shù)據(jù)交易所,數(shù)據(jù)存儲、采集、處理、運營、確權及安全環(huán)節(jié),數(shù)據(jù)所有者等幾類參與者。
例如浙數(shù)文化位于經濟及信息發(fā)達省份,目前持有浙江大數(shù)據(jù)交易中心48.2% 股份。易華錄經營重點由數(shù)據(jù)湖建設轉向數(shù)據(jù)要素運營;云賽智聯(lián)以云服務與大數(shù)據(jù)、行業(yè)解決方案及智能化產品三大板塊為核心業(yè)務,布局數(shù)據(jù)要素產業(yè)鏈多個環(huán)節(jié)。上海鋼聯(lián)植根大宗商品數(shù)據(jù)服務業(yè)23 年,對大宗商品幾乎全覆蓋,目前公司已在上海數(shù)據(jù)交易所掛牌相關數(shù)據(jù)產品。深桑達中國電子云為中國電子旗下惟一云平臺。
實際上,高質量數(shù)據(jù)對模型性能提升至關重要,預計大模型廠商將加大高質量數(shù)據(jù)需求,擁有高質量數(shù)據(jù)庫的相關公司,價值有望提升。當前時點,就AI 驅動下的數(shù)據(jù)要素而言,短期有望迎來做多窗口,但對結構牛市來說,勝負手的關鍵在于主線選擇和篤定追隨。
從ChatGPT 面世以來,AIGC 產業(yè)迎來爆發(fā)式發(fā)展,國內企業(yè)加快擁抱大模型時代,百度、360、阿里等互聯(lián)網公司以及商湯、科大訊飛等人工智能企業(yè)相繼發(fā)布自研大模型,大模型軍備競賽拉開序幕。
今年4 月,國家互聯(lián)網信息辦公室發(fā)布了《生成式人工智能服務管理辦法(征求意見稿)》,公開征詢管理建議,這是國家首次向生成式人工智能領域發(fā)布產業(yè)規(guī)范性政策文件,其把數(shù)據(jù)安全、數(shù)據(jù)確權、數(shù)據(jù)隱私等數(shù)據(jù)有關內容放在較為重要的篇幅。由此,我們能明確看到其利好數(shù)據(jù)確權細分賽道。從文件發(fā)布以來,截至6月14 日,AIGC 指數(shù)漲幅達到10.28%。
實際上,對于AI 大模型而言,數(shù)據(jù)為貫穿其全身的血脈,對AI 發(fā)展影響重大;除通用數(shù)據(jù)外,行業(yè)數(shù)據(jù)也是各垂類模型的關鍵。在整個AI 貫穿的領域里面,算力和算法關注度最高。毋庸置疑,單純比拼算力,我國尚且存在一定差距,但是投資者不應忽視我國的數(shù)據(jù)資源優(yōu)勢,這是我們的長板所在。
關于數(shù)據(jù),坊間有一種觀點認為AI文本生成較高質量的數(shù)據(jù)來源于學術論文、專業(yè)書籍、專業(yè)新聞、專業(yè)的全球數(shù)據(jù)庫、各細分領域龍頭數(shù)據(jù)庫以及高質量的論壇,而目前高質量數(shù)據(jù)庫仍以英文為主,給中文大模型訓練提升了難度。其實這是狹義的定義數(shù)據(jù),中國互聯(lián)網數(shù)據(jù)龐大,沉積下來全球最大的數(shù)據(jù)量,海量優(yōu)勢無可比擬。
根據(jù)《國家數(shù)據(jù)資源調查報告(2021)》,我國2021 年數(shù)據(jù)產量6.6ZB,同比增加29.4%,其中個人數(shù)據(jù)產量為1.4ZB,各類行業(yè)機構產生數(shù)據(jù)5.2ZB。從行業(yè)分布看,數(shù)據(jù)產量排名前五位的行業(yè)分別為政府、互聯(lián)網、媒體、公眾服務及專業(yè)服務、交通,前五大行業(yè)數(shù)據(jù)產量占全國行業(yè)機構數(shù)據(jù)總產量的65%。
從具體架構來看的話,不僅有頂層制度設計,各地也紛紛成立數(shù)據(jù)交易所。面對各級政府在數(shù)據(jù)大開發(fā)上面的發(fā)力,未來或許有可能先于其他國家挖掘出更深的數(shù)據(jù)價值。
從邏輯關系上看,AI 訓練的核心資源是數(shù)據(jù),AIGC 想要取得好的生成結果,離不開基于海量數(shù)據(jù)的訓練,而數(shù)據(jù)確權應該是人工智能能夠持續(xù)發(fā)展的基石之一。嚴格意義上講,確定數(shù)據(jù)的權利屬性即做好數(shù)據(jù)確權,一方面可解決AIGC 作品的知識產權保護或規(guī)避侵權等問題;另一層面其不僅影響和制約著數(shù)據(jù)流通環(huán)節(jié),還涉及到數(shù)據(jù)資產的入表問題。
結合二級市場看,從事數(shù)據(jù)確權的相關公司并不多,目前國內的數(shù)據(jù)確權服務工作主要由一些國有企業(yè)搭建的平臺承擔,比較典型的平臺包括人民網旗下的人民數(shù)據(jù)確權流通平臺和人民數(shù)保平臺,自2019 年起,人民網就開始積極研究和創(chuàng)新應用區(qū)塊鏈技術,并將其運用于數(shù)據(jù)確權業(yè)務的探索中。
具體說來,人民數(shù)據(jù)資產服務平臺是我國首個數(shù)據(jù)確權平臺。它作為國家隊具有先發(fā)優(yōu)勢,不過數(shù)據(jù)確權目前尚屬較新的數(shù)字產業(yè),我們能看出相關業(yè)務自2019 年布局后,2020 年在財報中已經有所體現(xiàn),但具體能給公司帶來多少產出目前還無法得知。從年報數(shù)據(jù)及信息服務相關財務指標中,可以看到相關營收過去三年均有下降,分別為3.31 億元、2.82 億元、2.56 億元;然而毛利率有所攀升,分別為47.03%、47.44%、49.02%。
無獨有偶,新華網通過持有新華智云(與阿里合資)39% 的股份來推動數(shù)字資產中心的建設,并利用區(qū)塊鏈技術提供數(shù)據(jù)確權服務。對此有券商預計2022-2023 年,公司歸母凈利潤分別為2.52 億元/2.90 億元,同比增長19.61%/15.02%,6 月15 日收盤價對應PE 分別為78.71/67.31x。(作者為深圳某基金公司基金經理。文中觀點僅代表作者個人,不代表《紅周刊》立場。本文提及個股僅做分析,不做投資建議。)
