劉卓軍

學習的態度應當是持續的、開放的、純粹的,學習的方式則應當是包容的、務實的、沒有禁忌的,其中相互交流的方式尤其應得到提倡和受到鼓勵。
學習既是一種狀態也是一個過程。學習必然有成本當然也有回報,至少學習要付出時間,而取得的效果或回報能否達到或超出預期還是離預期甚遠卻有著不確定性。換句話,預期導向不應當是衡量學習效果的合理方式。一方面,我們熟知古訓:可遇不可求;另一方面,我們也知道有活到老、學到老,學無止境等的至理名言。學習可以有具體的目的也可以沒有,完全是一種打發時間的消遣也未嘗不可。如果一個人能把自己修煉到那樣一種狀態,視學習為日常生活離不開的內容,那真是上升到了一種超然的境界。而達到這種境界可不是“可遇不可求”的,只要堅持完全可以實現。其中,對學習效果有所預期當然也屬正常之舉。事實上一般而言,通過讀、聽、看、研究和實踐等方式以獲得知識或技能、掌握以前不會的比較而言又是有價值的東西,這應當是學習的樸素目的。就學習效果來說,能學到什么知識、掌握什么技能以及達到什么程度就另當別論了,因為影響學習效果的因素非常之多,并不是努力了就能學得好。但有一點是肯定的:你努力得多,學到的東西就多,多與少也一定會影響到學得好與不好。客觀地說,學習效果的好與不好是相對的,沒有絕對標準。有些人可能很快就能學懂一件事,有些人卻要花很長的時間學懂同樣的事,而且不同的人在不同事物的學習上也會有不一樣的表現,這種差別的背后有多種多樣的原因,它暗示了所有的人都有需要不斷提升自己的學習能力和技巧的具體問題。概括起來,學習的態度應當是持續的、開放的、純粹的,學習的方式則應當是包容的、務實的、沒有禁忌的,其中相互交流的方式尤其應得到提倡和受到鼓勵。
在我們強調創新和提升競爭力的時候,很明確且很堅定地一點應當是,要堅持積極的學習態度,采納合適的學習方式。不妨比較一番,機器學習已經有了長足的發展,人的學習若不能大幅長進,如何是好呢?對此,考察和談論一下關于ChatGPT這一熱點話題是有意義的,因為學習是關聯到智能的重要問題,機器學習也就順理成章地成為人工智能的基本問題了。在機器學習一再的靚麗表現中,AlphaGo、AlphaZero、AlphaFold、AlphaTensor、ImaginNet等已經輪番在社會大眾的腦海里留下了深刻的烙印。現在,ChatGPT的上乘表現不單漂亮地通過了圖靈智能測試,更激發了不少民眾對于奇點正在逼近而表現出的擔憂。事實上,OpenAI開發出的ChatGPT不過是一種使用人工智能和自然語言處理模型生成對話或更正式的書面文本的工具。盡管使用它能產生不少令人吃驚的結果,也必須承認它還有很多需要不斷完善和提升的地方。即便如此,投放出能和ChatGPT有得一比的中文版的類似工具必將充滿很大的挑戰。即使產品能搞出來,產品的功能怎樣,效果如何也還要拭目以待。根本的原因是,ChatGPT已經演變成一款軟件工具中的龐然大物。把各個方面披露的信息綜合起來可知,ChatGPT的代碼量接近350 GB,是非常巨大的系統。若1KB以20行代碼算,總的將有70億行代碼。進一步,ChatGPT的功能和效果很大程度上要依賴海量數據的訓練,這個量有 100 億個句子,合算成訓練用總文本量超 45 TB,這大抵同于美國國會圖書館藏書的1/5。所以也很好記,差不多相當于把全世界的人口集中起來,每個人寫一行代碼,每個人提供一句用于訓練的話。如此看來,這樣的工具靠短平快是打造不出來的,必須堅持長期主義。
2015年在得到馬斯克等人10億美元捐贈后,OpenAI作為非營利組織開啟了開發ChatGPT的歷程,由于實在難以為繼,前不久OpenAI的掌門人將其改變成營利組織,并接受了微軟100億美元的投資,為的是把超大規模的工具軟件最后真正地打造打磨出來。根據美國財富雜志的報道,OpenAI為此制定了分為4個階段的盈利計劃:
1.先滿足馬斯克等首批投資者收回投資資本;
2.微軟有權獲得OpenAI 75%的利潤,直到收回它的投資;
3.在OpenAI的利潤達到920億美元后,微軟持股比例下降到49%,剩余的由其他風險投資者和OpenAI員工分享;
4.當利潤達到1500億美元后,微軟和其他投資者的股份無償轉讓給OpenAI的非營利基金。
也就是說,OpenAI最后還是要回歸非盈利性質。如上的計劃能否兌現,需要多長時間,現在還是個未知數。提及的做法我們可否仿效,可否采取其他方式?這些都是實實在在的挑戰。我們不但要學習,更要闖、去試!