羅茂林

2023年以來,人工智能無疑是貫穿資本市場的一條主線,從“百模大戰”千帆競逐,到上游算力芯片“一日一價”。大模型正在催生一場巨大的變革,其影響最終將波及千行百業。
站在2024年的起點上,人工智能大模型又將有哪些新的趨勢?近日,星環科技創始人、董事長孫元浩在接受上海證券報記者專訪時表示,第一輪熱潮過后,商業化正在加速落地,許多垂直細分賽道或在2024年為大眾帶來眼前一亮的變革。
熱浪之下的變革與挑戰
“大模型時代的來臨,將在多方面帶來巨大變革。”孫元浩開門見山地告訴記者,這將是一場知識獲取方式的變革。
他以學習為例說道:“人們對于知識獲取從閱讀書籍論文,到依靠搜索引擎,現在已經發展為大模型,隨著通用大模型和領域大模型的增加,除了把公有知識壓縮導入大模型之外,還可以導入更多的行業知識庫。”
具體到星環科技的產品,孫元浩介紹稱,向量數據庫Hippo可以幫助企業建設自己的內部知識庫,企業將自身的各種形式數據向量化存儲到向量數據庫Hippo中,可以提高大模型提問的精準度,建設企業自己的大模型助手。
除此之外,孫元浩認為,大模型的誕生在數據分析、交互方式、智力勞動等方面已經產生深遠影響。“以交互來說,越來越多的場景可以建設數字人以及AI Agent(人工智能體),直接通過自然語言調用后臺服務或者操作機器人,現有的應用都可以通過新的交互方式做改造。”
孫元浩預計,在第一輪大模型的熱潮之后,今年商業化的落地會開始細分加速。“領域知識庫、企業專屬的大模型將成為相對商業化步伐最快的。”孫元浩說。
伴隨變革的步伐,從產業鏈傳導來看,一系列新的挑戰將擺在行業面前。從產業鏈而言,AI大模型包括底層的算力提供、大數據分析工具(包括向量數據庫)、基礎大模型、由大語言模型驅動的應用開發工具、垂類模型和應用/效率工具等環節。
“對于國產GPU公司或者擁有儲備充沛算力的公司來說,涉足算力提供及基礎大模型的訓練和研發將具備較明顯的優勢。”孫元浩表示,星環科技作為國內領先的企業級大數據基礎軟件開發商,站在工具鏈的角度提供大模型時代的軟件開發工具鏈,公司提供包括大數據分析工具和大模型應用開發工具,旨在讓每家企業都能打造自己的專屬大模型。
在孫元浩看來,數據是模型生產過程中最大的桎梏之一。據了解,圍繞大數據基礎建設,星環科技已經完成多項重要工程。比如,公司在2023年推出了大模型統一運營管理平臺Sophon LLMOps,旨在為用戶打通從數據接入、生成、開發和清洗、提示工程、大模型訓練、大模型上架部署到大模型應用編排和業務效果對齊的全鏈路流程。
卡位工具鏈供應商
隨著大模型行業的迅猛發展,一條完整的產業鏈正在逐步形成,從專精底層模型架構到終端鏈接千行百業,各個廠商都在努力尋找自己在供應鏈上的位置。
“星環科技的大數據基礎平臺TDH支持11種模型的統一存儲管理,能夠為大模型落地的訓練開發、應用推廣、運營提升等多個環節的不同多模態存、算、檢索、生成需求,提供統一的數據接口。”孫元浩告訴記者,與此同時,星環科技自身也推出了兩款深耕細分領域的垂類模型,分別為金融大模型“無涯”及大數據分析大模型“求索”。
談及未來規劃,孫元浩表示,星環科技將進一步提升在大數據和人工智能領域內的技術實力,鞏固公司的技術壁壘。“目前我們已經有三個計劃中的項目,分別是數據分析大模型建設項目、智能量化投研一體化平臺建設項目和AI知識助理建設項目。”孫元浩說。
在采訪中,孫元浩多次提及“生態建設”。他表示,星環科技日前已經加入中國大模型語料數據聯盟,聯盟主要為了應對大模型發展對高質量、大規模、安全可信語料數據資源的需求,旨在通過鏈接模型訓練、數據供給、學術研究、第三方服務等多方面機構,聯合打造多知識、多模態、標準化的高質量語料數據,探索形成基于貢獻、可持續運行的激勵機制,打造國際化、開放型的大模型語料數據生態圈。
“生態對于整個大模型產業發展有著重要的意義。”孫元浩以公司金融大模型“星環無涯Infinity”為例介紹稱,該模型基于公開研報、公告、政策、新聞、監管法規、公開司法判例等數據,融合了輿情、工商、產業鏈、熱門主題、衛星等多模態信息,將之轉化為高質量金融語料,輸出對于事件或標的的總結分析及演繹推理,“這個產品匯集的各類信息和語料,就是基于生態伙伴們的共建。”(來源:上海證券報)