999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文本中隱含的跨境資金流動信息
——基于文本大數據分析構建跨境資金流出壓力指數

2022-06-24 03:01:20孫希昀侯駿王淼楊磊
中國外匯 2022年3期
關鍵詞:資金文本情感

文/孫希昀 侯駿 王淼 楊磊

一、引言

測度跨境資金流動壓力的傳統方法主要依賴于經濟增長率等宏觀經濟指標以及購售匯數據等微觀主體行為指標,此類數據在更新頻率、獲得時效等方面存在一定局限。近年來,隨著微博、微信等新媒體的興起,信息傳播的速度越來越快,各類專家、學者通過自媒體平臺發表其對經濟形勢、金融市場、國際關系的觀點,其中隱含的情緒往往對市場主體的跨境資金擺布行為產生潛在影響。在此背景下,借助機器學習對自媒體上的大數據文本進行分析,為衡量跨境資金流出壓力打開了一扇新窗口。通過對網絡上海量非結構化文本數據進行文本分析,構建高頻跨境資金流出壓力指數,有助于刻畫市場主體擺布跨境資金的特征,在一定程度上反映市場預期、情緒變化對跨境資金流動的影響,與傳統的跨境資金流出壓力測度方法形成相互補充。

二、分析經濟金融領域中非結構化文本數據的情感傾向

文本分析技術多應用于市場情緒度量、市場情緒指數的構建。例如,通過對博客、股吧、貼吧的留言進行語義分析,探究文本中所表達的投資者情緒、觀點和看法等。近年來,部分研究開始將文本大數據分析引入宏觀經濟領域,使用機器自動統計各類媒體新聞中同時包含經濟(economic/economics)、不確定(uncertain/uncertainty)和政策(policy)三類詞語的月度文章數量,構建衡量經濟政策不確定性的指數。本文嘗試將這一方法引入跨境資金流動分析,通過將詞法分析和機器學習相結合,對微信上的非結構化文本進行語義分析,并對文本所隱含的正負情感傾向進行快速標注。

第一步,清洗數據并建立經濟金融中文語料庫。選取微信公眾號上經濟金融領域相關研究機構和專家學者所發表的觀點明確的文章,通過收集、整理、去重,得到4萬余個文本數據,以此形成經濟金融中文語料庫。每條文本數據包含發布時間、閱讀量等結構化數據,也包含標題、正文等非結構化數據,時間跨度從2014年10月到2021年9月。

第二步,對文本主題進行聚類。首先,對所有文本進行分詞,并標注詞性,提取文本統計特征TF-IDF值(詞頻-逆向文件頻率),將文本轉化為聚類模型可以處理的特征向量,為了盡量減小特征矩陣的維度,只使用文本中的名詞類詞匯(包括名詞、名動詞、名形詞)參與聚類,根據每類文本中統計特征最明顯的五個關鍵名詞類詞匯(見表1)來確定此類文本的主題。然后,使用K-means無監督算法對文本進行聚類,并使用截斷奇異值分解(Truncated SVD)降維方法,將每篇文章的特征向量映射到二維和三維空間中,每個點代表一篇文本,以直觀展現文本聚類的效果。如圖1所示,本文所選取的文本數據在每一類別上的邊界較為清晰,說明聚類是有效的。

圖1 文本聚類分析的可視化

表1 文本聚類的結果

第三步,建立經濟金融領域情感詞表。常用的情感和語義詞典包括知網情感詞典(HOWNET)、臺灣大學簡體中文情感詞典(NTUSD),但這類情感詞匯多應用于生活中,難以適用于經濟金融領域。鑒于經濟金融領域的負面情感是出于對不確定性和風險的厭惡,本文先通過人工方法從程度、詞性、態度三個維度列出反映經濟金融領域情感特征的核心關鍵詞(見表2),然后借助詞向量工具word2vec,利用上述經濟金融語料庫訓練一個詞向量模型,以此找出與核心關鍵詞相似度較高的詞匯,得到一個包含114個正面詞匯以及164個負面詞匯的經濟金融領域情感詞表。

表2 經濟金融領域情感詞表構建

第四步,使用詞頻統計方法對文章情感傾向進行打分。對文本內容中正面詞匯和負面詞匯出現次數進行統計,出現正面詞匯加一分,出現負面詞匯減一分,選取特征明顯(打分大于等于10分以及小于等于-13分)的文本,分別標注正面情感和負面情感。

第五步,使用特征明顯的文本訓練分類器模型。使用詞向量工具doc2vec將已標記情感的文本轉化為特征向量,并以70%和30%的比例將文本分為訓練集和測試集,使用訓練集訓練一個隨機梯度下降分類器(SGD分類器),其可以用于預測二分類問題,對剩余特征不明顯的文本正負情感進行預測。分別選取交叉熵損失函數(Cross Entropy Loss)和調整后的Huber損失函數(Modified Huber Loss)作為分類器的損失函數,用測試集來測試不同損失函數的分類器性能,若分類器的AUC值越大,表明分類效果越好。如表3所示,兩種損失函數的分類器AUC值分別為0.96、0.92,說明使用交叉熵損失函數的分類器效果更好。

表3 各種分類方法性能指標評估

第六步,使用分類器對剩余文本情感進行預測。將剩余文本(得分在-13分和10分之間)轉化為特征向量,并使用訓練得到的SGD分類器模型完成對所有文本正負情感傾向的標注。

三、使用負面情感文本構建跨境資金流動壓力指數

鑒于跨境資金的流出壓力與負面情感具有更多的聯系,因此本文選取五類表達負面情感的文本來構建跨境資金流出壓力指數(見表4)。同時,由于文本需要被閱讀后才能向閱讀者傳遞情感,因此本文使用文本對應的閱讀量來刻畫各類文本信息對市場情緒的潛在影響程度大小,以此作為影響跨境資金流動的權重。

表4 表達負面情感的五類文本

具體而言,將五類文本主題中同一天內所有表達負面傾向的文章的閱讀量直接加總(數據時間為2015年5月至2021年9月),得到每日負面情感文本閱讀量數據,在此基礎上,將該日度閱讀量數據變頻為月和周,rmt表示所有負面傾向文本在第t月的閱讀量數據,rwt表示所有負面傾向文本在第t周的閱讀量數據。接著,對閱讀量的時間趨勢作標準化處理,采用移動平均的方法(月度數據采用6期的移動平均,周數據采用24期的移動平均)分離出閱讀量的增長趨勢rm0t和rw0t。rmt/rm0t即為剔除時間趨勢后的月度跨境資金流出壓力指數(見圖2)。可以看出,該跨境資金流出壓力指數較好地體現了2015年“8·11”匯改、2018年中美經貿摩擦以及2020年新冠肺炎疫情下市場負面情緒上升對跨境資金流出壓力的影響。為進一步提高數據頻度,使用同樣的方法分離出周閱讀量增長趨勢,rwt/rw0t即為頻率為周的跨境資金流出壓力指數(見圖3)。

圖2 跨境資金流出壓力指數(月)與閱讀量增長趨勢的時間序列

圖3 跨境資金流出壓力指數(周)與閱讀量增長趨勢的時間序列

四、運用壓力指數對跨境資金流動情況進行實證分析

第一步,測算潛在的跨境資金流動規模。假設外匯存款凈增量(金融機構新增外匯存款與金融機構新增外匯貸款之差)保持平穩,使用涉外外匯順差(涉外外幣收付款差額)和結售匯順差(銀行代客結售匯差額)之差作為跨境資金流出規模的測度,其在一定程度上可作為“凈誤差與遺漏”項的高頻替代指標。如圖4所示,以該指標測算的跨境資金流出規模與“凈誤差與遺漏”項的差額走勢較一致,因而可以作為后者的高頻替代。

圖4 跨境資金流出測算規模與“凈誤差與遺漏”項的比較(單位:億美元)

第二步,使用月度跨境資金流出壓力指數解釋跨境資金流出規模。選取2015年5月至2021年9月的跨境資金流出壓力指數和測算的跨境資金流出規模月度數據,共76個樣本點,建立多項式分布滯后(PDL)模型,研究兩者關系。定義Yt為測算的跨境資金流出規模,定義Xwt為月度的跨境資金流出壓力指數。根據施瓦茲(Schwarz)準則,確定最優滯后期數為12期,得到擬合優度為28%,參數估計結果如表5所示。可以發現,從滯后第4期開始,跨境資金流出壓力指數對未來潛在跨境資金流動規模具有較顯著的負面影響,即跨境資金流出壓力指數上升,未來潛在跨境資金流出規模增大。其原因可能是,文本中的負面情緒在一定程度上推升了市場主體向境外擺布資金的意愿,但由于市場主體在信息接收上存在時滯,且金融市場存在摩擦,可能需要4個月以上的時間才能將跨境資金擺布意愿付諸實際。

表5 PDL模型參數估計結果

第三步,使用高頻跨境資金流出壓力指數解釋跨境資金流出規模。相較月度數據,高頻數據包含了更多可用信息,建立被解釋變量為Yt,解釋變量為滯后的高頻跨境資金流出壓力指數Xwt-i的混頻數據回歸(MIDAS)模型,共有333個樣本點,權重方法選擇阿爾蒙多項式函數。根據施瓦茲(Schwarz)準則,確定最優滯后階數為76,回歸得到的擬合優度為30%,解釋能力相較月度數據有所增強。

五、主要結論及啟示

本文研究表明,通過文本分析構建的跨境資金流出壓力指數能夠在一定程度上捕捉到市場負面情緒的變化,前瞻性預測未來跨境資金流出規模的變化趨勢,成為衡量跨境資金流出壓力的先行指標,這對跨境資金流動風險監測管理具有一定的啟發意義。

一是順應科技發展趨勢,不斷豐富跨境資金流動監測工具箱。在互聯網技術和計算機技術高速發展的今天,信息傳播方式發生了深刻變化,信息量和信息傳播速度均呈現幾何級數增長,自媒體對市場預期的引導作用越來越顯著,這些都改變著社會公眾預期形成和行為決策的方式。鑒于此,政策制定者應在傳統經濟和金融分析框架的基礎上,針對信息傳播方式的改變,引入新的分析方法和視角。

二是加大對文本分析方法的探索和運用。近年來,隨著機器學習技術、自然語言處理技術的不斷進步,部分國家的央行和研究機構開始探索通過數據挖掘、情感分析等技術手段建立文本隱含信息和實體經濟的聯系。對應到外匯管理領域,影響跨境資金流動的因素紛繁復雜、瞬息萬變,通過使用非結構化文本數據分析,能夠在一定程度上突破現有統計數據在發布頻率上的約束,克服傳統計量模型假設過多、過度擬合等不足,及時捕捉到市場情緒的變化,預測市場主體向境外擺布資金的意愿以及相應的跨境資金流出壓力,從而有的放矢對市場負面情緒上升較快的領域開展宏觀審慎調控和預期引導。

猜你喜歡
資金文本情感
如何在情感中自我成長,保持獨立
一周超大單資金凈增(減)倉股前20名
一周超大單資金凈增(減)倉股前20名
一周超大單資金凈增(減)倉股前20名
一周超大單資金凈增(減)倉股前20名
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
主站蜘蛛池模板: 亚洲免费黄色网| 亚洲无码一区在线观看| 午夜久久影院| 国产一区二区三区在线精品专区| 久久网欧美| 高清色本在线www| 国产在线观看高清不卡| 国产精品无码翘臀在线看纯欲| 亚洲三级影院| 亚洲人成人伊人成综合网无码| 狠狠色狠狠色综合久久第一次| 午夜色综合| 午夜综合网| 无码福利视频| 国产精品不卡永久免费| 亚洲嫩模喷白浆| av一区二区三区在线观看| 午夜一级做a爰片久久毛片| 亚洲中文在线视频| 精品国产一区91在线| 国产三级毛片| 色婷婷啪啪| 成年人免费国产视频| 亚洲色图欧美在线| 亚洲女人在线| 欧美在线精品怡红院| 东京热一区二区三区无码视频| 国产av色站网站| 国产成人精品视频一区二区电影| 国产亚洲欧美日韩在线一区二区三区| 在线播放国产一区| 国产精品成人观看视频国产| 永久免费无码日韩视频| 日韩免费成人| 国产天天色| 国产不卡一级毛片视频| 国内嫩模私拍精品视频| 动漫精品啪啪一区二区三区| 免费日韩在线视频| 高潮毛片免费观看| 久久久久88色偷偷| 亚洲人成人伊人成综合网无码| 亚洲男人的天堂在线观看| 婷婷六月天激情| 亚洲天堂视频在线观看| 高清乱码精品福利在线视频| 亚洲区一区| 91福利片| 伊人网址在线| 91视频精品| 丰满人妻久久中文字幕| 精品日韩亚洲欧美高清a| 日韩在线成年视频人网站观看| 欧美成人二区| 狠狠ⅴ日韩v欧美v天堂| 熟妇无码人妻| 日韩无码视频网站| 色网站免费在线观看| 在线播放精品一区二区啪视频| 国产欧美在线观看一区| 波多野结衣第一页| 国产精品久久精品| 免费观看精品视频999| 亚洲精品视频免费看| 高清精品美女在线播放| 真实国产乱子伦高清| 丁香婷婷综合激情| 九九这里只有精品视频| 一级毛片免费的| 国产区免费| 99er精品视频| 欧美午夜在线观看| 欧美国产综合色视频| 在线免费看黄的网站| 亚洲欧美日韩中文字幕一区二区三区| 亚洲中文无码h在线观看| 91精品伊人久久大香线蕉| 日韩无码白| 99re这里只有国产中文精品国产精品 | 色婷婷电影网| 日韩成人在线网站| 亚洲AV人人澡人人双人|