999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

當前熱點話題下對開源發展的三點認識

2023-01-01 00:00:00梅宏
新經濟導刊 2023年4期

圍繞社會經濟領域逆全球化與信息技術領域大語言模型(LLM)和生成式AI(AIGC)這兩個熱點話題深入思考后,筆者產生了三點認識:一是信息技術生態必然是開源和閉源的交織,二是軟件供應鏈全球化至少在基礎軟件領域開源是不可逆的,三是大模型和生成式AI的發展或將大幅度提升開源開發的質量與效率。

一、信息技術生態必然是開源和閉源的交織

開源和閉源同整個信息技術生態緊密關聯。開源的發展一直是追求多方共贏的過程,開源的歷史則是軟件在創新自由與版權收益之間的博弈過程。開源雖然以理想主義為緣起,但在商業的蓬勃助力下匯聚群體智慧,成為開放創新的典范。

人們認為軟件源代碼一開始就是開放的,其實是后來Linux模式和其他自由軟件競爭才導致“開源”的出現。可以說,沒有商業就沒有開源,從商業模式支撐的軟件模式開發,到多種開源模式探索,再到企業積極擁抱開源和如今的開源全球化,開源已經形成多元化商業模式。

開源一定離不開理想主義,開源需要奉獻精神。早期的開源都是圍繞微軟“帝國”周邊,特別是操作系統生態。事實上,在每一個壟斷性的軟件領域都必然會有一群理想主義者投入研發一個開源版本,比如操作系統Linux、瀏覽器、辦公系統、工業軟件等,所以理想主義是激發開源的一個重要動因。不過,企業追求商業利益最大化也是合理的,否則就沒有企業存在的必要了。但是顯然,理想主義和商業利益需要平衡。

開源成為當前的熱點,從微軟對開源的態度就可以看出來。起初,微軟是開源最大的反對者。2001年,微軟CEO巴爾默說開源是癌癥、是病毒,后來他卻成為開源的積極擁抱者,甚至在開源社區收購了GitHub。讓人疑惑不解的是,2022年,微軟以OpenAI名義推出ChatGPT,盡管有消息稱GPT3大概要開源,但微軟為什么不直接開放呢?這也恰好說明一個道理,但凡能夠在這個領域獨享利益時,絕大多數企業或個人可能都會選擇一個相對閉源的態度。所以,信息技術生態必然是開源和閉源的交織。

“抱團取暖”一直是開源發展的重要驅動力。當出現壟斷時,我們希望大家團結起來,開源社區為大家提供了一個抱團取暖的平臺,大家在共同社區維護共同版本,就有可能形成一定的優勢。以生成式AI開源的情況來看,ChatGPT的問世帶來了大語言模型的百花齊放,其中GPT4的優勢目前最為明顯。那么現在,眾多跟隨者大概又到了抱團取暖的時刻,只是尚未明確抱團取暖的基本態勢。從目前大模型開源、閉源的情況以及各個大模型發展的時間線來看,這些模型目前還處于“戰國時代”,也就是說,大家都在各自為營。如何形成一個大家共同維護的開源大模型的合力,技術上仍有許多值得探討的事情,這正是開源閉源交織的問題。

二、軟件供應鏈全球化在基礎軟件領域開源不可逆

雖然當前社會經濟領域有逆全球化的趨勢,但軟件供應全球化至少在基礎軟件領域開源是不可逆的。在經濟全球化受阻的大背景下,科技領域尤其是開放科學還在持續進行。開放科學涉及開放硬件、開放軟件、開放訪問、開放數據、開放教育資源等,即所謂的“HSADES”,其中科學數據開放已成為全球共識。近年來,世界各國在科技領域的競爭日趨激烈,雖然一些少數團體要求審視科學數據完全開放政策,但從全球態勢看,還沒有出現科學數據共享通道關閉的征兆,所以開放科學仍然是進行時。

在過去近20年間,云計算、大數據、AI的發展均受益于開源。以AI為例,其快速發展離不開代碼的開源和數據的開放,包括開放開源的框架、開源的算法和開源的數據,這些開放推動了大數據和AI的快速發展。開源軟件,具體到軟件的生態領域已然全球化,而且已經形成覆蓋全球的錯綜復雜的開源軟件生態鏈。從硬件資源的供應鏈到系統技術的供應鏈,一直到上層應用的供應網絡,形成了一個非常復雜的網絡。

開源已經離散在生活中的每一個角落。2021年,有兩個報告均提到行業領導者90%都在使用企業開源軟件。而Synonsys(全球排名第一的電子設計自動化EDA解決方案提供商)提到17個行業里的1500個代碼中,有98%都是開源代碼。由此可見,開源是不可逆的,即便開源行動沒有涵蓋所有領域,但就基礎軟件領域和程序員的全球生態化而言,開源的確不可逆。例如Linux,其已經成為日常生活中絕大多數人都會使用的系統,R語言更是有上千個軟件包并建立了上萬個復雜的依賴關系,這就是信息技術生態的復雜性。

再舉兩例。一是開源的云計算管理平臺OpenStack14,現已有817個代碼倉、2439個開放者和250個機構模式、8種貢獻模式、4種任務選擇模式、3種協作模式,然后是提供部分解決方案、業務集成等一系列支持,形成了一個巨復雜的OpenStack生態。二是深度學習框架,以TensorFlow和PyTorch為代表的開源深度學習框架支撐了大量的深度學習應用。

與此同時,全球化開源生態也會帶來很多不確定性,特別是在安全領域。開放供應鏈的復雜性,使得開源供應鏈面臨的風險受到持續關注,如Apache Log4j漏洞事件曾引起巨大轟動(編者注:自2021年12月7日公開,Apache Log4j 漏洞被認為是“2021年最重要的安全威脅之一”,稱其為“核彈級”漏洞并不夸張。該漏洞已被廣泛應用于勒索、挖礦、僵尸網絡上,黑產組織則利用Log4j漏洞發起多個攻擊事件),當然還有更多的類似事件。人們在大量使用開源軟件的同時也會擔憂其安全性,于是從政府到社區、從產業界到學術界都在建立各個級別的安全保障體系。2021年,美國發布了關于改善國家網絡安全的總統行政令,明確要求政府加強對供應鏈的安全管控。2022年,阿里巴巴的王堅提出供應鏈安全試驗,尤其是開放帶來的復雜軟件供應鏈問題,已經引起政府、社區、企業和學術界的普遍關注。

有鑒于此,國家層面需要考慮構建面向全球的開源生態體系,這將涉及政府、市場、社區、企業和個體。盡管開源社區有常用的治理體系,但全球化的開源生態需要全球化的體系,這涉及全球層面,包括很多國家的法律法規、標準規范和技術工具等相關方面。

三、大模型和生成式AI的發展或將大幅提升開源開發的質量與效率

過去幾年,國內的相關研究團隊圍繞群體智能做過一些開源軟件開發工作,提出了人工群體智能概念和構建群體智能的構造性模型。群體智能是科學家長期關注并研究的一種自然現象,也就是說群體中間每個個體可能不具備智能或者智能非常有限,但由個體構成的群體會展現出遠遠超出個體能力的智能行為,這是低等生物群體里的矛盾現象之一。西方起初把社會性生物群體層面展現的群體智能稱為Smart,后來為了從社會層面進行區分改稱為Collective,兩個單詞本質是一個意思,只是針對的群體不同。以低等生物群體智能為例,菌群聚合、蜂群筑巢、魚群避敵、蟻群尋食等,都不是靠個體單獨完成的任務。但微小的個體最后產生的效果卻非常好,甚至堪稱精美,這是低等生物群體智能現象。放大到人類社會,平庸的人在一起協作也能產生群體智能現象,歇后語“三個臭皮匠頂個諸葛亮”揭示的就是這個意思。市場經濟通過一只“看不見的手”,卻能夠進行大規模資源的有效配置,這也可以被視為群體智能的典型現象之一。

怎樣理解生物群體智能?早期有一位法國科學家提出了環境激發效應,并用這個概念解釋生物群體智能形成的機理。環境激發一詞來源于兩個希臘詞根,一個是刺激,一個是工作,受刺激而工作。基于環境激發效應,個體在工作中就會留下痕跡,這個痕跡被其他個體感受到,從而刺激這些個體留下新的工作痕跡,慢慢匯聚起來的工作痕跡形成了群體智能。互聯網產生以后出現的網絡空間,匯聚了人類智能群體,為人類跨時空大規模協同提供了可能。隨著互聯網技術的不斷發展,大量網絡應用出現,這使得互聯網上一批松散的人群可以通過直接或間接的交互完成一系列需要大家共同完成的工作,維基百科就是一個典型的例子。現實中的眾包模式,也是通過大規模用戶分工合作完成的。此外,還有利用群體力量通過玩游戲的方式設計RNA(核糖核酸)分子結構,利用群體力量求解單向選擇題,等等。

我們能否把群體智能用于開發軟件這種更為復雜的知識邏輯制品呢?顯然,開源軟件開發就是人類聚集群智非常典范的例證之一。但這一群體智能本身仍屬于比較原始的形態,通過大規模開發者群體的持續協同,能夠維護開發一個復雜的軟件系統,這涉及多種成功技術因素,比如開發技術有效的信息管理、自上而下的任務分解和自下而上的人員組成等。之所以其為原始形態,是因為它還沒有達到群體智能所探討和追求的完全分布式的社會化軟件開發目標。當下,大多數成功的開源軟件項目都依賴于一個小規模的精英群體完成頂層架構設計,并對版本發布進行嚴格規劃和設置,他們更多集中于對源代碼的管理和匯聚,對需求設計的支持不夠。

環境激發效應這一概念,為理解群體智能現象提供了一種解釋性模型,目前的研究主要關注群體智能的構造性模型。群體智能系統包括三個關鍵因素:一是信息激發,即如何有效激發每個個體提供與問題相關的信息片段;二是信息融合,即如何對不同個體提供的信息進行有效的融合;三是信息反饋,即把融合后的信息有效反饋至每個個體。激發、融合、反饋,這一過程不斷循環,迭代起來,就是IFE(交互式前端技術)構造模型。

這個模型對群體智能系統的形成主要在兩個框架內發生:一是物理空間,也就是現實世界,二是網絡空間,包括數字化的物理空間。進一步觀察信息的反饋融合是否為自然發生,或者是否有人造的自動化系統參與,用這兩個標準來劃分自然的群體智能現象、半人工的群體智能現象或人工的群體智能現象。我們用AI設計,是希望解決用人類設計智慧信息的融合反饋算法。在物理空間,有純自然的群體智能,比如蜂群筑巢等。在網絡空間,智能也少有人工介入,只是利用網絡上原始信息的儲存和具有傳播能力的材料,比如開源主要是通過郵件列表做,還有眾包。人工群體智能就是加入人的干預,這在物理世界還沒有找到具體案例,但我們認為在網絡空間也許能找到,也許還可以構造。網絡空間具有高效的信息融合能力以及個性化信息高效的反饋能力,這是一種業內追求的群體智能的理想形態。

人工群體智能借助人工設計的智能模型預算法,實現了對群體中海量信息的有效融合與個性化反饋,在群體內部形成信息的正反饋回路,進而在群體層面涌現形成超越個體智能的智能現象,這就是所謂的群體智能。

那么大模型和生成式AI能帶來什么?它或將為海量信息的高效融合與個性化反饋提供創新性解決方案,可能會大幅度地提升開源軟件的質量和效率,進而提升開源開發的群體智能水平。大模型作為海量信息的融合器,靠大模型融合而不是靠人。AIGC則針對軟件開發領域,結合個性化能力形成個性化信息反饋,再回到模型就變成一個大模型矢能的ACI。人工群體智能把大模型作為信息融合器,將使得上述這個循環運轉得更快,匯聚得更快。

四、如何更好地推進開源發展

第一,對開源生態的構建,要大力弘揚開源精神,把握開放、共享、協同、生態的開源本質,鼓勵奉獻,尊重市場,積極探索開源的商業模式。第二,積極推進構建面向全球的開源生態治理體系,從人類命運共同體的視角來促進全球化開源生態。第三,積極探索LLM/ AIGC在開源軟件開發中的應用,構建面向開源軟件協同開發的ACI系統,在維護開發者群體多樣性和持續創造性的前提下,有效提升開發效率和質量。

現在業內在談開源軟件面臨的各種各樣的問題,很多專家說未來人類文明就運行在軟件之上,而在整個軟件體系中,毫無疑問開源軟件是非常重要的組成部分,特別是在越來越基礎的層面,開源軟件構成了人類社會的基礎設施,因此我們有必要站在人類命運共同體的視角維護人類社會的基礎設施,而不是走向逆全球化之路。實際上,開源社區治理體系已經相當成熟,在這種情況下,我們仍在探索有沒有新的模式,特別是適合于中國開源發展的模式。

(作者系中國科學院院士,中國計算機學會第十二屆理事會理事長)

主站蜘蛛池模板: 国产黄视频网站| 国产成人亚洲综合A∨在线播放| 91精品啪在线观看国产91| 尤物在线观看乱码| 亚洲色大成网站www国产| 国产成人午夜福利免费无码r| 国产第一页免费浮力影院| 久久黄色视频影| 日本午夜视频在线观看| 欧美日韩国产在线播放| 色视频国产| 久久久91人妻无码精品蜜桃HD| 久久亚洲精少妇毛片午夜无码| 欧美福利在线观看| 九九这里只有精品视频| 丰满人妻被猛烈进入无码| 高清视频一区| 国产美女精品在线| 国产成人调教在线视频| 亚洲中文字幕av无码区| 无码高清专区| 国产精品lululu在线观看| 国产日韩精品欧美一区灰| 免费毛片视频| 欧美日韩午夜| 欧美日韩国产在线人| 国产99在线| 精品国产福利在线| 青青草原国产av福利网站| 欧美一区二区啪啪| 国产农村1级毛片| 亚洲精品国产乱码不卡| 精品视频福利| 久久久久无码精品国产免费| 亚洲精品国产首次亮相| 成色7777精品在线| 伊人色综合久久天天| 欧美在线综合视频| 亚洲欧美另类日本| a级毛片免费在线观看| 四虎国产在线观看| 无码电影在线观看| 天天色天天综合网| 欧美黄色a| 99伊人精品| 永久免费无码日韩视频| 她的性爱视频| 日韩无码真实干出血视频| 久久久噜噜噜| 久久精品欧美一区二区| 欧亚日韩Av| 欧美国产菊爆免费观看| 亚洲国产成人麻豆精品| 久久精品无码一区二区国产区| 四虎成人在线视频| 鲁鲁鲁爽爽爽在线视频观看| 亚洲天堂视频在线播放| 456亚洲人成高清在线| 国产成人一级| 欧美成人手机在线观看网址| 国产成人做受免费视频| 全午夜免费一级毛片| 免费毛片视频| 青青操国产| 熟女视频91| 无码AV高清毛片中国一级毛片| 色综合天天视频在线观看| 少妇精品网站| 欧美精品一二三区| 亚洲AV无码久久精品色欲| 天天摸天天操免费播放小视频| 麻豆国产在线观看一区二区| 国产成人久久综合一区| 一本大道香蕉高清久久| 国产综合在线观看视频| 国产后式a一视频| 尤物在线观看乱码| 亚洲第一视频网| 久久久久人妻一区精品色奶水| 亚洲国产综合精品中文第一| 亚洲小视频网站| 99手机在线视频|