因為參與寒武紀研報的選題研究,我打開了已經好幾個月沒打開的AI應用“今天學點啥”,求助它幫忙解讀兩篇與芯片有關的英文學術論文。論文是寒武紀創始人陳天石10年前寫的,內容是關于其團隊對AI所需芯片需要怎樣的架構創新所做的工作。
如果沒有AI,這種強技術相關性的學術論文對記者來說哪怕不是天書,也至少需要耗時一兩天、搜索大量資料,才能弄懂其中一二。但當我將兩篇論文下載下來,再上傳給“今天學點啥”,選擇我希望它輸出的講解風格:面向初學者、5分鐘速講(你也可以選擇愛因斯坦、尼采、孔子、武俠、懸疑、快板甚至奏折風格),幾分鐘后,我得到了一份20頁長的PPT,以及對這份PPT的視頻講解—長度在10分鐘左右。
關鍵的是,它講得還挺不錯。沒有聽講解前,我只知道論文大概講了一些與嵌入式神經網絡處理器(NPU)相關的事,聽了講解,我理解它提出了一種新的芯片架構,通過優化芯片的內存空間、提升數據訪問效率,從而獲得比傳統GPU更強的AI計算效率—畢竟GPU最初是為圖像計算而不是AI計算設計的。
開發“今天學點啥”的是一家叫秘塔AI的中國公司。這家公司2018年就創立了,早期產品是為法律從業者提供AI助手類工具,今年4月才推出上面這個自稱“塔子老師”的新產品。
老實說,這樣的產品目前很難歸類,它既像是一種個性化教育類產品—公司創始人在產品發布期間曾對外聲稱,有學生家長是其用戶—又像是工作類場景的延伸。對今天的很多職場人士而言,哪怕已經不需要寫論文、交作業,不少人仍然需要主動學習,才能更好地完成分內工作(比如我們這些科技記者)。
這類沒什么“邊界感”的AI應用在過去一年間蔚然成風。Google這兩年最有名的AI原生應用NotebookLM很大程度上也在做類似的事,區別在于,背靠大廠的NotebookLM的token處理容量強大很多。它允許用戶最多上傳50個包括PDF、MP3、Markdown等格式在內的文件,并以這些文件構建本地數據庫,再發起提問。相對來說,作為初創公司的秘塔AI一次只允許用戶上傳并解讀一個文件。
NotebookLM在輸出端的配置同樣豪華,除了對文件內容定向提問,它還可以將文件夾里的內容轉換成音頻、視頻、報告、思維導圖等多種格式,以及可以基于文件夾內容生成個性化的測試題—說到這里,你可能會想到豆包,這個同樣出身大廠的產品目前也是個變形金剛式的處理器了,把一篇文章扔進去,它能提供PDF、PPT、播客、視頻等多種“加工方式”,任你挑選。
今天學點啥、NotebookLM、豆包,其實在做同樣一件事:輸入一些內容,經AI加工后再輸出一些內容,然后將它們存儲起來或者分享在應用內的用戶社區。事實上不止這幾個產品,其他很多未被點名的,比如工作臺產品ima、知識庫產品Flowith、筆記產品Get筆記,以及上一代筆記產品Notion、原來的文檔查詢產品百度文庫……都在做類似的事。而這些需求眼下是由多款不同的產品分別滿足的,比如信息生成和加工主要是微軟的Office套裝,信息存儲工具主要是各大電腦公司的操作系統和內存,信息和知識的流通一定程度上靠的則是社交平臺。
而NotebookLM、豆包、ima、Flowith、Get筆記等產品想做的,是讓這些行為都發生在一個應用內,即一站式解決用戶從信息生產、信息加工到信息存儲和傳播的全流程需求。
構建一個新產品的邏輯好像更簡單了:似乎只要先在輸入端做足接入類型,提供直接記筆記的文檔功能、Chatbot入口、搜索入口、可以直接上傳本地文件的入口,以及如果你在別的網站有網頁內容需要導入,只需粘貼一個鏈接,有的產品還支持一鍵錄音,這樣連你在開會等場景下輸入的信息它也能收集到;然后再在輸出端提供豐富多樣的格式,從PDF、PPT,到播客、視頻,從思維導圖到練習題,從內容總結到提供智識價值的個人助手……
構建此類產品需要的邏輯和清單已經沒什么大秘密,但誰能真正成功?這件事其實更難了—原因并不是競爭,而是有用戶思維的產品可能沒那么多。
百度文庫的產品負責人在談到如何將這款互聯網時代的老產品改造成AI時代的一站式工具時,提出了一種“延長線”邏輯,即在產品現有功能的基礎上分別向用戶需求的上一步和下一步甚至下兩步延展。以百度文庫為例,它原本是個讓用戶上傳和查找論文、報告等文檔類資料的數據庫,這一功能的上一步可能包括提供AI問答、AI搜索等功能,下一步則包括讓用戶在找到文檔后直接在這個平臺內打開一個編輯器開始寫東西,或者用查找到的內容、自己撰寫的內容或用AI生成的內容,生成PPT、AI播客、繪本等輸出形態。
改造后的百度文庫早就不是那個類似知網、豆丁網、道客巴巴的文檔查詢和下載平臺,它想要成為“一站式”的,為此在兩端延長線上疊加了相當多的功能。但迄今為止,我還沒有遇到一個打開它用一用的契機。
仔細想想,所謂的“延長線”邏輯真的算是一種產品邏輯,還是產品經理怠于洞察用戶需求的借口?畢竟在延長線的兩端,做大輸入或輸出端的接口多樣性都不是難事,尤其對大廠而言。但如何為用戶制造一個心動的機會,這事兒沒那么容易。
出于工作原因,我試用過ima、Get筆記、Flowith和百度文庫,但之后就沒有再次打開它們了,因為我實在很難在想要開始寫稿或者做一個會議紀要的時候改變打開電腦自帶的Pages或者記事本的老習慣,而去打開一個在我頭腦中沒有什么記憶點的新產品。這些產品甚至都不約而同的推出了知識庫功能—讓人可以對著自己的文件夾提問,但我對我的文件夾只有更精準地搜索的需求,而非詢問—或許這類功能更多是服務B端的企業用戶吧。
目前,我真正因為有使用動機而多次打開的新產品,一個是NotebookLM—它能承載的上下文窗口實在太大了,是目前所有AI應用中最大的,你可以一股腦將大量同一主題的論文丟給它;一個是豆包,目前它是我在ChatGPT之外使用最多的Chatbot(這個類別在我個人心中仍然存在),因為它作為搜索引擎比傳統搜索引擎好用太多了—再也不用在大量鏈接中查來找去只為找到一個細節答案;還有一個是今天學點啥,它對同一篇論文的講解效果比NotebookLM更好,但需要研究某一議題時,一篇論文是遠遠不夠的,所以在這次向它請教陳天石的論文之前,我其實已經有好幾個月沒有打開它了。
我沒有提到ChatGPT,但我依然在大量使用它,因為很多問題目前仍然只有它(在我的Claude賬號被封的前提下)知道得更多、更深、更富洞見。
所以,一站式的App吸引到我了嗎?或者更準確地說,App的“一站式”特點吸引到我了嗎?好像并沒有,打動用戶的往往是產品的銳度而非廣度。只有當那些在上一個技術時代沒有被很好滿足的需求得到解決了,我才會記得并使用它。