摘 要:大模型推動了第三次數字信息化浪潮。第一浪是信息化過程,科技代替體力勞動;第二浪是網絡化過程,傳統行業實現互聯網+改造的模式重塑;第三浪是數智化過程,科技替代腦力工作。中國金融科技發展也同樣有“三浪”的變化。大模型和傳統的AI模型有本質上的巨大差別,是從“可用”到“好用”的差異。大模型下的金融科技產業范式,可能有幾個邏輯上的變化值得關注:一是語控萬物(NL2X);二是大才能強;三是大模型的部署通常有兩種形態,一種是連橫的模式,另一種是合縱模式。經過場景不斷延伸、做深、做廣之后,大模型會逐漸從嵌入到現有的工作邏輯和場景,慢慢成長為新的生態,形成新的邏輯。
關鍵詞:金融科技;大模型;產業范式;落地應用
大模型推動了第三次數字信息化浪潮。中國金融科技發展也同樣有“三浪”的變化:第一輪是信息化,在零售業務上取得突破性發展;第二輪是互聯網,第三方支付工具等金融服務產品出現;第三浪是數據集業務,AI帶來量化投資方面的創新。金融科技的范式從場景流量為王或逐漸轉變為從算法、算力和數據三角元素支撐的,以數據為核心要素的新的產業形態,出現了語控萬物、大才能強、行業大模型等邏輯上的變化。未來可以通過選模型、估規模、建場景等途徑來落地金融機構或企業自己的大模型應用。
近期最新的有關大模型的事件是Meta發布開源Llama2模型,從測試數據結果來看,各種指標基本可以與GPT3.5追平。ChatGPT的爆火引發了大模型熱潮,令幾乎所有的企業都站在了同一個起跑線上,這也從側面展示了這一輪的大模型帶來的影響還在持續進展。大模型研究、產品和資本投入每周都在發生巨大變化,ChatGPT在刷新機器智能方面的新進展以及可能對社會經濟發展帶來的影響都是前所未有的,歷史上從未出現如此盛況(如圖1所示)。
將這樣的變化放在更大的宏觀背景中來看,實際上推動了數字信息化浪潮的第三浪。第一浪是信息化過程,科技代替體力勞動,人工操作電子化,通過計算機和IT技術解決了信息處理的問題,提升了工作效率,解決了信息孤島問題,使得業務流程標準化。第二浪是網絡化過程,數字化轉型進入全面展開的階段,科技延伸了人類觸角,發揮媒介作用,通過互聯網和移動互聯網解決了信息傳輸的問題,大幅降低信息差,傳統行業實現了互聯網+改造的模式重塑。第三浪是數智化過程,科技替代腦力工作,通過物聯網、云計算、大數據、AI大模型和數據解決了信息感知、模型知識、行動實現的問題,使得萬物互聯,實現生產智能化、決策智能化、管理科學化(如圖2所示)。
在每一次信息化浪潮中都會出現一些偉大的企業(如圖3所示)。第一浪中,IBM實現了從硬件廠商向服務型轉型的大策略,微軟信息化成為了巨頭。第二浪中,互聯網企業谷歌、蘋果迅速發展。今天的第三浪中,增速最快的英偉達市值最快到了萬億美元。



如果我們把目光縮小到金融領域,中國金融科技的發展也同樣有三浪的變化。第一浪信息化的過程中,從招商銀行一卡通開始,從電子報單到訂單電子化,邊際成本大大降低,效率提升,逐漸在零售業務上取得突破性發展。第二浪網絡化的過程中,第三方支付工具的金融服務產品出現,用戶體驗提升,金融普惠化、社交化、開放互聯,深入生活場景。而在今天的第三浪數智化的過程中,數據集業務出現,大模型徹底改變了金融服務生態,加速產品推廣,實現精準營銷,全面提升用戶體驗,大模型互動AI建設成本由邊際成本向固定成本轉變,成本越來越低,金融信創成為數智生態和行業建設的基礎(如圖4所示)。近幾年成長最快的資產部門是量化投資,短短幾年,投資基金從零發展到千億規模,表現最好的基金實際上是使用了機器深度學習帶來的交易增強策略,規模的增長和收益的增強,其背后核心就是AI和超算力量。AI帶來的效果已經初步顯現出來,大模型推動的數字化浪潮全面展開,將會給行業帶來新的變化和新的體驗,以及哪些金融機構能夠借助科技力量實現超越發展,這些都是值得期待的事情。
大模型和傳統的AI模型有本質上的巨大差別,是從“可用”到“好用”的差異(如圖 5所示)。傳統的AI模型是“可用”,能處理簡單、小規模的問題,有更快的推理速度,在低功耗設備上運行,成本低,結果精準可控,但是在通用性和適用場景以及持續表現還達不到完全滿意的效果。大模型是“好用”,在自然語言處理、計算機視覺等方面表現良好,需高性能計算資源支持,成本高,幻覺可能。大模型開創性地提出預訓練模式,可以一次性解決多個問題,提出精調模式,可以實現“場景+任務”,培養0樣本泛化和場景學習能力,實現多模態發展。
大模型技術突破是一次大的技術進步,是范式發生了變化,不僅僅要看到它帶來的現象變化,更需要理解背后邏輯的變化。相對應地,金融科技的范式從場景流量為王,逐漸地可能會轉變為從模型算法、算力和數據三角元素支撐的、以新的數據為核心要素的產業形態(如圖6所示)。
在這樣的范式下,可能有幾個邏輯上的變化觀察:
一是語控萬物(NL2X)。原來用戶習慣的是傳統的菜單甚至是圖形界面,現在語言會成為一個新的入口,語言不僅僅指講話、對話框,代碼也是一種語言。因為大模型本身是大語言的模型,是基于語言邏輯的學習。語言成為入口,這個變化可能會帶來流量關注度、流量體系的重構(如圖7所示)。


二是大才能強。一些創新、驅動力的建設進步很多時候是由大型的企業創源推動的,“大才能強”就是要集中一定的資源,在一個充分競爭的環境下不斷地創新,具體到大模型則需要大算力、大數據、大投入。這些都需要有大型平臺的支撐,同時要有充分競爭從而變化演化的環境,才能夠產生“涌現”現象。大模型超過300億參數的時候出現了“涌現”現象,在現實中,有一定的復雜度后才會出現突變(如圖8所示)?!按蟛拍軓姟边@一范式,對科創投資的各方面也會帶來邏輯上的變化。
三是大模型的部署。大模型的部署有兩種形態,一種是連橫的模式,因為大模型的通用性,各行各業都可以通過插件的方式,與基礎模型的平臺實現行業的應用。另外一種是合縱模式,在基礎大模型的基礎上訓練一個專門針對行業的模型,并且進行部署(如圖9所示)。



目前這兩種形態都存在,尤其是連橫模式的通用性使得它在多行業中得到普遍應用,同時隨著模型逐步逼近自身能力天花板時,在開源的行業共享和普惠性的推動下,在行業大模型的邊界、行業數據的邊界、行業應用的場景、行業應用的黏性等方面越來越成為重要因素時,垂直領域生態建設、應用場景建設和模型能力的不斷提升和訓練就成為了更加重要的因素。從長期看,垂直領域可能會有它自己的合縱模式。
以上是大模型對格局范式變化的基本邏輯。
一是選模型。金融大模型的五大能力為金融專業問答、超長文本處理能力、代碼能力、邏輯推理和多模態交互能力,要考慮落地效果、部署成本、安全合規、開放程度。目前仍然處在“百模大戰”甚至“千模大戰”的狀態下,各種大模型層出不窮,但基本上可以分為三個梯隊,第一梯隊是國際大公司,第二梯隊、第三梯隊的能力則參差不齊,但是可能在一兩年之內會逐步逼近語言、多模態的天花板(如圖10所示)。
二是估規模。算力的限制與數據規模要達到的程度有關,比如自己訓練一個公域數據的大模型,需要超過1,000塊的A100顯卡才能從頭預訓練,這時可能就需要幾億元甚至幾十億元的投資規模;如果是做行業模型精調,那實際上可以將投入控制在幾千萬元之內;如果是專屬應用,投資規模也很小;如果只是調用,可以不用投資,直接進行使用。所以投入規模最終還是取決于模型想要達到的程度(如圖11所示)。



三是建場景。場景建設分為兩個部分,一部分是對業務的場景,另一部分是內部的場景,相較于業務場景,內部場景落地會更有效(如圖12、13所示)。舉一個例子,將一個80億參數模型調出來的效果用在金融機構的運營業務上,比如用在簡單的TA這樣的業務場景中,基本上模型訓練簡單搭建一個應用場景,可以減少大約80%的工作量。所以在一些小的應用場景上,與傳統的AI相比,大模型確實能夠極大地提高效能,這也就是它的力量所在。
在這樣的場景不斷延伸、做深、做廣之后,大模型會逐漸地從嵌入到現有的工作邏輯和場景,慢慢成長為新的生態,形成新的邏輯,改變我們的時代。


(作者系恒生電子股份有限公司董事長。中國財富管理50人論壇(CWM50)供稿)