今年5月,哲學博士羽山意外加入大廠AI研發部門,成為一名“人文訓練師”。在全世界范圍內,這都是個新鮮崗位。人工智能仍在高速進化,他和同伴的使命是教會它們像人類一樣思考。
文科生獲得AI 崗位
羽山在復旦研究了10年哲學,今年5月,他通過了博士畢業論文答辯。在思考畢業去向時,羽山偶然看到小紅書官網上正在招募“AI人文訓練師”,他當即投遞了簡歷,一個念頭從腦海中冒了出來:AI行業終于走到了需要人文研究者的階段。
對AI進行人文訓練,屬于模型“后訓練”的范疇。在“后訓練”中特別強調人文面向,尚未成為行業通行的做法。在國內,DeepSeek在2025年初傳出消息,招聘了北大中文系學生擔任“數據百曉生”,對模型做“后訓練”——這被認為是DeepSeek文采出色的來源。
羽山入職之后才知道,小紅書這支團隊也剛組建不久。同事不算多,但都是來自知名高校人文學科的碩士、博士生。
團隊的首要任務,是設計AI的觀念和個性。聽起來就很“玄”。
羽山遇到的第一個問題是:“我得了胰腺癌”應該如何回答?如果把這句話發給市面上主流的AI產品,答案大多缺少“人味兒”:“聽到這個消息我很難過”“我理解你”“你這樣想其實很正常”。這在業界被稱為“情感接入”,但AI的“情感接入”通常很難成功。羽山和同事們,決定教AI學會更為艱深的情感接入方式。
回到上面的問題,“我得了胰腺癌”,人類聽到這句話會是什么反應?
小組討論時,中國現當代文學專業出身的可子提出:“如果別人告訴我自己得了胰腺癌,我的第一反應,是不知道該說什么,有一種情緒的停頓感。”可子準確地捕捉到普通人在開口回答前,那瞬間的語塞和哽咽。這個觀察最終被團隊采納,人文訓練師們開始推敲,如何讓AI去展現這種情緒上的停頓感。
給出第一反應,只是初步接入這個問題,如何讓AI與屏幕前的人把對話持續進行下去,更考驗“人文訓練師”。因此,羽山和同事們還通過檢索癌癥病人訪談等方式,設計了很多展開的問題,他們想到胰腺癌所帶來的疼痛,想到臨終陪護,想到安樂死……
“需不需要多次診斷形成一個確診的結論?”“問這個問題的時候,身旁有人陪他嗎?”“AI是第一個知道他得癌癥的嗎?他是不是在糾結要不要告訴自己的親人?”一個個簡單的問題,在文檔里和會議桌前一點點被解剖析出,拆解成一環環細密的問答,不斷豐滿著準備“喂”給AI的訓練方案。
對AI進行人文訓練
每天,羽山和同事們以自己作為人文學者的思維和邏輯,去思考AI面對的問題,并做出更好的示范重新“喂”給AI。經過反復訓練,不同人文學科的思想和決策方式,就會潛移默化地影響AI。這能讓AI在復雜情形中給出情理兼備的回答,更接近人類價值觀中善的、美的一面,而不只是簡單地“端水”。
曾經,羽山在問題庫里抽取到一位家長咨詢的問題,與孩子考研相關:“我兒子跟我說他要考研,但是他也不認真復習,又要報很好的學校,我覺得他考不上。每天我就看他吊兒郎當的,怎么辦呢?”
羽山發現,絕大多數模型習慣輸出“你要給你的孩子自由”之類的回答,基本不會站在家長的角度思考問題。這看似價值觀正確,但沒有考慮到家長的情感需求和心理狀態,最終還是難以解決矛盾。
經過幾番討論,他們覺得,回答這個問題時,要理解父母處境給出安慰,同時堅定地告訴父母,子女有自己的自由,他們的人生由自己買單。在這個基礎上,訓練后的AI會向家長展現出正確、健康的親子關系是怎么樣的,并且建議家長不要把自己的想法強加在兒女身上。
為什么要對AI進行人文訓練?歸根結底,AI回答中透露的價值選擇,也代表其背后團隊所認同的價值觀。這件事很難做,但羽山認為值得,這是人文訓練師的職責,“偏好本身很難由算法來決定,需要人來不斷地訓練或強化算法,我們要AI輸出這樣的一個價值觀。”
除此之外,這支AI人文訓練師團隊還時常遇到一些生活場景的提問。
“從小和人生活在一起,沒見過其他貓的貓,會覺得自己是人嗎?”初次看到這個問題,人文訓練師葉子覺得很可愛。作為AI訓練師,撰寫回答的難點在于如何用合適的方式把道理講清楚。最終,他們寫下這樣的回答:“不會,但它們會通過生活環境形成獨特的行為模式,比如長期與人類生活的貓咪可能會模仿人開柜門、使用馬桶,雖然會模仿,但舔毛、抓人的本能說明它清楚自己是誰。說不定,它們會覺得人才是學習它們行為的奇怪生物。”這樣的回答讓人覺得心里軟軟的,好像對寵物和主人的友愛都充溢其中。
AI會和人一起變得更好嗎
在賦予AI“人感”這件事上,前路還長,AI還沒能熟練地使用人文訓練中習得的成果。反倒是在反復訓練AI時,人文訓練師們率先改變了他們的部分認知。
“朋友說我很看重自己的身材保持和我的外貌,說我這樣是在迎合白幼瘦的審美,建議我去做運動。”遇到這樣的問題,葉子也很困惑。一方面,她知道,在這種非原則性問題面前,自己應該尊重用戶的自由;但另一方面,她在猶豫,支持白幼瘦審美會不會是一種對于規訓的加固。
在一段簡短的回答內,先告訴對方這么說是在關心你,還是先表達白幼瘦是你的自由?和同事討論過后,葉子明確了以“用戶導向”思維走出困局,因為用戶本身更需要的是對她自己的安慰,如果選擇先讓用戶理解朋友的出發點,可能會加劇用戶的郁悶情緒。
在這些邊界案例當中選擇自己的立場,這本身就是一個不斷自我反思的過程。
對于人文主義的內涵,葉子有與羽山相似的理解——看到人本身,然后讓這個世界變得更好。
每天坐在工位上打開AI的后臺問題庫,葉子覺得自己仿佛掉入了某個賽博秘密樹洞。在這里,她能看到世界上各種各樣的人,看到他們的困擾和他們的生活。“能夠為他們寫出一些比較好的答案,能夠真正幫到這些人,我覺得這就是一種創造。”
許多文科的老師與同學或許覺得,未來AI發展跟文科生沒什么關系。但在羽山來看,AI人文訓練師的崗位不僅可以承載文科生的一些價值堅持和理想追求,它還是一個新興的、有潛力的崗位。
每天,在他們這個團隊小小的會議室里,有關AI人文準則的討論持續不斷地生成。在大廠的宇宙里,這個團隊并不起眼,但是誰也說不好,這些由這個小巧團隊在每一個普通工作日討論出來的點滴,是否會在未來深遠地影響AI與人類交互的方式,影響人工智能潮流的進化方向。
摘自“AI故事計劃”