AI產品在宣傳時普遍熱衷于宏大敘事:我們什么問題都能回答,我們什么都能干,我們可以讓人類文明躍升到下一個臺階!作為愿景,這沒有什么問題,畢竟讓我們感到興奮的正是AI的無限潛力。但通過過去半年我們這個《AI實用手冊》的介紹,大家也不難看出來,從實用角度,今天的AI能力還遠沒有達到能解決通用問題的水平。
但是,有很多專注解決某個具體問題的小AI工具其實做得相當出色,完全勝任自己的工作。這些工具也許難以和宏大敘事掛鉤,但其中有不少是我每天都會用的產品,對我來說更加“實用”。今天,我想介紹其中的幾個。
過去一年,我經常在線下向朋友推薦Dola。就這樣一對一推薦,至少“安利”了數十個新用戶。Dola極其簡單—它就是一個專注于日程管理的聊天機器人,甚至無需下載App,在聊天軟件里與它對話即可。
自從離開校園后,我一直使用日歷工具來管理自己的日程。然而,創建日程要填寫表單,確實有些麻煩。在團隊內還好,我們反復向年輕同事們熏陶的“優秀工作習慣”之一就是“約人開會一定要在日歷上發邀請”,久而久之大家已經有默契了。但和其他人溝通時,現在大家主要通過微信,要求對方“發日歷邀請”顯然就太過分了,除非是少數同樣我知道習慣使用日歷的朋友。日常生活中的日程信息更雜亂,尤其現在我還要管理孩子的日程:學校的家長會、課外培訓班、比賽時間、醫生預約、演出、火車航班……要整理到日歷中,工作量還蠻大的。
Dola幾乎完美地解決了這個問題,你跟它說話即可,它會提取其中的時間、地點、事項等關鍵信息,自動記錄到日歷中。在非結構化的雜亂信息中提取結構化數據,是大語言模型非常擅長的,準確率非常高。比如,我最近給它發送了一段話,“下周一開始十天學而思S+班早上10∶20開始兩小時上五天休息一天”。根據這段略為混亂的話,它準確無誤地幫我在日歷上記錄了10個日程。
更方便的是,Dola可以識別圖片。日程信息其實手機上都有,只是散落在各種聊天記錄、短信和App中,缺少結構化呈現。自從我發現Dola可以識別截圖后,我日常做得最多的事情就是把微信聊天記錄截圖發給它—別人可能通過微信跟我商量了一個見面或者安排的時間,我截圖給Dola,它就能讀取圖片、自動提取關鍵信息、記錄日程。
我翻了翻聊天記錄,我給它發過演出購票訂單、預約確認短信、比賽報名結果截圖、課程表、醫生開的紙質預約單等等,這些它都幫我準確無誤地記錄到了日歷上。更復雜的信息它也能識別,比如學校的一些安排是需要家長在在線文檔中認領時間段的,我可以把整個表格截圖給它,它也知道我和孩子的姓名,能自動推理出屬于我們的時間段,幫我建立日程。
有人會問,ChatGPT這樣的通用AI聊天難道做不到嗎?理論上可以,前提是AI需要能操作日歷工具,這個功能暫時還不是AI聊天機器人的標配,ChatGPT也只在最近推出的“Agent模式”中增加了這個功能。通用AI的識別成功率似乎也都沒有Dola高,尤其是一些比較復雜的安排。
最影響使用體驗的,恰恰是通用AI的“通用”。它什么都能干,因此反而需要額外的信息才能理解你的真實意圖。舉個簡單的例子,當我一言不發甩一張孩子比賽報名截圖給Dola,它知道我就是想把這個日程添加到日歷中,因為Dola只能做這個事情。但當我把同樣截圖發給其他AI,它會夸我報名這樣的比賽很有勇氣并祝我比賽順利。你還得再敲一句話,告訴它你只是想添加日程。
這也是專門工具的優勢所在—為你預設了上下文,省去了你解釋自己的精力。
順便提一下,Dola最近改名為了Toki,我打開官網看了一下,發現不知道什么時候也推出了App。
另一個AI的用處就是整理我們日益混亂的數字世界,比如我的電腦。作為有一定整理強迫癥的人,我電腦上最混亂的三個文件夾是:桌面、下載,截圖。我用了幾個簡單的工具來組合解決這個問題。
首先是文件命名。許多下載的文件名都是非常“技術”的名字,并不方便查找,Arc瀏覽器的AI功能可以在下載時自動重命名這些文件,讓文件名更有意義。另一個文件名的重災區是截圖,系統自動生成的文件名中只有截圖時間,我使用一個叫Keep it Shot的工具來管理我的截圖文件夾,它在后臺自動讀取圖片的內容來自動重命名文件,這樣子截圖的內容就一目了然。
接下來,我用一個叫Sparkle的工具來自動整理文件夾。這個工具也很簡單,它在后臺默默盯著你指定的文件夾,根據文件類型和文件名來自動創建子文件夾,再將這些文件分門別類放進去。
大語言模型用來做整理工作相當得力。Arc另一個我常用的AI功能就是自動整理所有標簽頁,將所有標簽頁自動分組,還可以自動改寫標簽頁的標題—作為一個日常開著400多個標簽頁的人,這確實能節約不少時間。
一個小插曲是,這些功能我一直在用,卻從來沒有深究過其背后的原理,即它們到底是依據什么來整理的。剛才同事讀這篇文章的初稿時問我這個問題,我竟一時語塞,去查了文檔,才搞清楚了原理。具體原理在這里就不展開了,我只是想說,可見,好用的工具就像魔術一樣—“it just works”。
值得一提的是,Sparkle是由Every開發的工具,而Every的主營業務是付費newsletter,近年來專注于啟發讀者如何更好地使用AI。Sparkle更像是Every對自己理念的一種闡釋:當你手頭有了1萬個博士供你調遣,最有趣的是讓他們去做那些你今天根本想不到可以雇人來做的雞毛蒜皮的小事。整理文件夾就是其中一件。
最后,其實許多已有工具增加一點AI功能就可以起到畫龍點睛的作用。其中一個例子是Timing,多年來我一直用它來記錄我在電腦前的時間,它會在后臺記錄精確到秒的數據—你正在使用什么軟件,打開什么文檔和網站。這可以幫我統計、回憶每天都花了多少時間做了什么事情,以便優化時間分配,提升效率。
問題是,Timing記錄的數據量實在太大了,尤其是經常在不同的軟件間切換時,記錄數據非常碎片。明明忙了一天,卻想不起來干了什么,如果要認真回顧,恐怕每天單單用來回顧自己做了什么,就得花上一個小時。
和前面介紹Dola時相反,大語言模型在這里的作用是將結構化數據轉化成人類可以理解的自然語言,這一點它也是很熟練的。現在,Timing會用AI自動總結我每個時段在做的事情,標記在日程上。準確度不高,但對于幫助我回顧來說已經綽綽有余,也確實節省了我很多時間。
今天我們的生活高度數字化,互聯網服務收集、呈現的數據也更多,許多枯燥數據如果稍作解讀,都可以給用戶帶來更大的幫助。我之前用過一段時間血糖儀,配套App中也有一個AI解讀數據的報告,對我的幫助就非常大,可惜這樣的工具還太少。
這樣的小工具我還能寫出很多。AI真的要“通用”,回答任何問題、完成任何工作,還有距離。但用來做上面這些工具,都不需要最新的旗艦模型,用很便宜的模型就能做好。今天,這樣的產品機會遍地都是。
當然,好用的工具并不一定是好的生意。相比通用工具,垂直工具面臨幾個挑戰。一是容易被遺忘。所以需要找高頻的垂直工具,但“垂直”和“高頻”之間的平衡并不容易尋找。我上面舉的幾個例子都足夠高頻。二是垂直工具相對于通用工具來說,用戶可能不會覺得太值錢,付費意愿沒有那么高。
其實,垂直AI工具在競爭上面對的主要威脅并不是通用AI工具,而是其他更成熟的工具增加AI能力。比如,我使用Dola的主要方式是截圖,但每次打開Dola再選中截圖、發送,仍然需要好幾個操作步驟。6月Apple在WWDC上發布的iOS 26系統可以在截圖時就自動識別,看起來方便得多。反而是像Timing這樣的已有成熟產品,添加一個AI能力就可以形成一個不錯的護城河。這和上期我們探討AI瀏覽器是類似的。