? ? ? 近日,財聯社專訪湯姆貓董事長朱志剛,以下是此次專訪內容:
? ? ? 15年前,一只“會說話的貓”在智能手機屏幕上迅速走紅,以輕巧幽默的方式定義了智能手機時代“人與虛擬角色互動”的基礎范式。如今,這只風靡全球的虛擬形象正在以AI情感陪伴機器人的全新身份,試圖重構一個巨大的潛在市場。
“湯姆貓AI機器人的應用場景是現實存在且十分明確的,那就是實現對人類更好的陪伴與情感交流。”近期,湯姆貓董事長朱志剛表示,湯姆貓致力于成為全球最會聊天的AI機器人。
從“會說話的湯姆貓”到“會聊天的湯姆貓”,不只是單純的產品迭代,更是一次關于技術溫度和情感連接的重構。在大模型技術不斷發展的背景下,作為IP持有方的湯姆貓公司正推動一次底層戰略轉型:從以內容和互動為主的數字產品,躍升至“硬件+內容+服務”構建的AI陪伴版圖。
情感為基,重塑AI陪伴“剛需”
湯姆貓的進化不是偶然。自2010年上線以來,這一IP已累計獲得超過全球240億人次下載,全球月活躍用戶(MAU)最高達到4.7億人次。在朱志剛看來,會說話的湯姆貓定義了智能手機時代“人與虛擬角色互動”的基礎范式,長久以來用戶對湯姆貓的情感連接,不只是娛樂,更是一種輕量級陪伴的情緒寄托,屬于人工智能的雛形產品。
“但相當長一段時間內,自然語言處理(NLP)與人工智能技術停滯不前,面對還不會思考的湯姆貓,公司將‘會說話的湯姆貓’升級成‘會聊天的湯姆貓’的愿望,也遲遲難以實現。”
ChatGPT橫空出世帶來的興奮感,朱志剛仍記憶猶新,這意味著公司長期探索的目標——會聊天的湯姆貓,距離落地實現近了一大步。
然而,“會聊天”不是簡單地接入大模型即可,接入大模型只是具備了知識問答、內容生成的能力,并不具備情感連接。人類聊天有別于其他信息傳遞的本質特征正是情感連接。在朱志剛看來,“會聊天” 的內涵,遠不止于知識與信息的傳遞,更體現在能讓人收獲積極的情緒體驗,進而獲取珍貴的信任感與歸屬感。
朱志剛介紹,湯姆貓的受眾極其廣泛,比如3-12歲的兒童群體,正處于認知快速發展期,具有強烈的好奇心和探索欲,提問和對話是他們探索世界的重要方式,因此對即時互動和響應有較高的要求。然而現實是,大多數父母很難隨時回應孩子“十萬個為什么”的提問,這正是湯姆貓AI機器人可以承擔的角色空位,提供教育與情感支持,成為兒童時代最快樂的小伙伴。
針對老年群體,尤其是獨居老年人,AI湯姆貓的溫暖陪伴能夠為他們的日常增添歡聲笑語,幫助他們提升生活質量和幸福感,獲得美好的情感慰藉。
針對自閉癥患者等特殊群體,湯姆貓AI機器人可用于早期干預和語言訓練,同時也成為患者在封閉環境中的私交同伴,是患者信得過的朋友。
現在的年輕人,也可能遇到生活節奏快,離家遠,感到孤單需要情緒撫慰的時候,能隨時隨地有AI湯姆貓說說話,也可以緩解壓力。可以說“人終其一生都在找一個能說話的人。”
不滿足于“問答準確”,更追求“情感連接”,可以說,湯姆貓選擇AI陪伴機器人賽道是一種使命必然。
“當情感陪伴垂直模型的細膩與通用大模型的深邃在湯姆貓交相融合,湯姆貓終于擁有了記憶與思考的能力,人類也將擁有最好的情感與交流的伴侶。”在公司自研的情感陪伴垂直模型投產后,朱志剛即滿懷信心。
情感建模+多模態交互,打造最會聊天的機器人
“為了更精準地識別用戶情緒,進而提供必要的情感支持,公司與西湖心辰合作開發的情感模型,專注于用戶情緒識別與長期記憶功能,能主動發起對話并根據歷史交互調整反饋策略,如根據用戶情緒狀態提供安慰或鼓勵。”朱志剛詳細介紹了從用戶的需求和體驗入手推導產品背后的底層技術實現路徑。
相較于通用大模型對話助手,湯姆貓AI機器人在語言風格和表達方式上更具擬人化與友好性。比如當孩子問“黑洞是什么”,機器人不會只用晦澀的天體物理術語,而會說:“黑洞就像家里一個巨大的吸塵器……”甚至還會調用過往聊天中提及的寵物話題,回答“量子糾纏就像你家里的貓(雯雯)和狗(厚福),雖然相隔很遠,卻能感受到彼此的存在……”,如此通俗易懂的比喻幫助孩子理解科學現象的同時引發孩子的情感聯想。
“對于年紀小不能完整、清晰的表達的小朋友,我們首先利用語音識別技術(ASR)精準捕捉兒童模糊發音與短詞匯,通過意圖識別模型了解孩子真正想表達的內容,再通過大模型的上下文理解與生成能力,給出準確又有趣的回答。鼓勵小朋友的每一次表達,逐步培養邏輯性表達習慣,解決‘童言碎片化’難題,助力語言能力進階。”
產品還具備情緒雷達和主動聊天功能,通過語音識別用戶情緒,并動態調整互動策略,其自主研發的TTS模型經過數千小時的訓練,確保輸出的聲音具備IP識別度和情感感染力。如用戶情緒低落時,湯姆貓機器人將用“難過的聲音”進行共情并給予安慰,真正發揮“會聊天”的陪伴價值。
在陪伴過程中,湯姆貓AI機器人具備短期和長期記憶的能力,能記住用戶的點點滴滴,并在持續對話過程中調用記憶內容自學習,越聊越懂用戶,成為用戶越來越信賴的伙伴。
為進一步打造更加真實的聊天交互,湯姆貓AI機器人在嵌入式軟件和硬件上同樣做了諸多創新。該機器人產品可模擬豐富的表情(如眨眼、微笑)和動作(如轉頭、耳朵擺動),與語音內容同步呈現擬人化互動。例如,當用戶表達悲傷時,機器人會呈現“關切”表情;用戶輸入語音時,湯姆貓機器人的耳朵會一上一下,表示其在認真傾聽。
同時,湯姆貓AI機器人還是一個能調用大模型能力、博古通今的AI助手,其采用了MoE(Mixture of Experts)混合專家模型架構,具備根據不同任務需求選擇最優模型組合的能力。朱志剛透露,通過MoE架構結合外部技術資源(如豆包、DeepSeek等模型),在意圖識別等功能上形成補充,該模型架構的開放性有助于公司持續構建“硬件+內容+服務”的生態閉環,未來更好地服務于不同年齡群體的陪伴需求。
硬件+內容+服務,一體化生態閉環成形
當前市場中,很多AI玩具廠商僅通過對接大模型API來構建對話系統,缺乏差異化與持續運營能力。而湯姆貓的策略,是將IP內容、技術架構與硬件設計深度融合,構建“硬件+內容+服務”的一體化生態系統。
從硬件上看,產品采用自主設計的嵌入式系統與多傳感器架構;在內容上,公司整合了過往十余年積累的動畫、音頻、游戲互動資源,實現內容聯動與持續更新;在服務層面,開發了配套的APP與小程序,支持家長查看孩子的聊天摘要、識別情緒變化,同時保護隱私,不記錄敏感對話數據。
此外,湯姆貓還特別關注銀發用戶群體。在產品中嵌入了健康知識問答、生活提醒等功能,滿足老年人日常陪伴與輔助需求。已有用戶反饋稱:“現在家里有湯姆貓,連我都覺得安靜的日子變得熱鬧了。”
朱志剛透露,接下去,湯姆貓將引入更前沿的技術,不斷豐富產品形態和功能,滿足不同用戶在不同場景下的使用需求,持續提升用戶體驗。例如,通信方式上,將從WiFi+BT向4G Cat1方向演進;材質方面,將從單一硅膠材質向毛絨及其他材質方向演進;大模型方面,從云端大模型向端側大模型演進,帶來隱私、安全、低延時的體驗;運動能力方面,從桌面向室內自由活動方向演進;打斷方式上,從喚醒詞打斷向語音打斷方向演進。
搶灘萬億級AI陪伴賽道,構建面向未來的技術護城河
市場機構ARK Invest預測,到2030年全球AI陪伴市場將從當前每年3000萬美元躍升至700億至1500億美元,年增長率預計超過200%。在這條高速成長的“長坡厚雪”賽道中,湯姆貓已經率先完成技術、內容、交互系統的整合閉環,并實現了商業化落地。
朱志剛指出:“AI陪伴賽道足夠寬,一個萬億規模的市場容得下更多的創業公司投身其中。作為其中的一家創業公司,公司憑借全球知名的“會說話的湯姆貓”IP形象,在全球范圍內擁有250億的下載,積累了龐大的粉絲用戶,持續活躍10余年,天然具備用戶認知度和親和力。湯姆貓AI機器人通過IP人設強化情感連接,實現從會說話到會聊天的天然過渡,形成與大廠標準化產品的區隔。”
在構建護城河方面,公司特別強調“云端一體”能力。例如在本地設備端優化音頻處理算法,實現AEC(回聲消除)、AGC(自動增益控制)和ANC(主動降噪);在云端中間件系統中,構建用戶畫像、關系圖譜、長期記憶系統、情緒識別、TTS獨特音色,實現“越聊越懂你”的智能交互體驗。
回顧整個轉型路徑,朱志剛表示:“技術上確實經歷了很多挑戰,但我們最終迎來了人工智能的破曉時刻。人工智能必將是人類科技發展史上具有劃時代意義的、為各個領域帶來顛覆性變革的成果,是非凡與無法想象的。弱水三千,只取一瓢飲,湯姆貓公司將集中力量做好會聊天的湯姆貓,并以極致親民的價格回饋客戶,讓每個人都可以享用會聊天的湯姆貓。”