首页>快讯 > 正文
会说话的汤姆猫 做了一款会聊天的儿童机器人
来源: 今日热点网 发布于:2024-12-19 14:06:44

你还记得那只风靡全球的“会说话的汤姆猫”吗?

2010年,乔布斯在那场堪称巅峰之作的iPhone4发布会上,利用 iPhone 的多点触控屏幕,演示了一只“会说话”的猫,这只灰白相间的猫会用搞怪的声音重复你说的话、在你的手机屏幕前立正、被戳肚子还能捧腹大笑……这些逼真的动作和前所未有的交互体验,让全球的玩家爱不释手,该应用也一举成为了当年最为火爆的app。

该IP的母公司金科汤姆猫,利用最新的人工智能技术,做了一款主打聊天功能的儿童情感陪伴机器人。

“因为汤姆猫的用户中亲子客群占比较大,公司在业务经营过程中发现,来自家庭和社会的情感关爱、正向引导、积极回应在青少年儿童的成长过程中至关重要。而家庭层面的情感关爱、正向引导和积极回应,在大部分场景下都源自长辈和儿童之间的对话与聊天。然而很多时候,作为家长,我们普遍都有‘心有余而力不足’的经历和感受,比如下班后回到家面对小朋友千奇百怪的问题以及各种捣蛋的行为时,我们不一定有足够多的知识、也不一定有足够的耐心。因此,公司做了一款会聊天的儿童机器人,希望这款产品可以作为一个‘伙伴’一样,给予小朋友关爱、启发、安慰或者鼓舞,通过聊天、对话的形式,不仅帮助他们获得知识,更能倾听他们的心声、理解他们的感受,并尝试与他们建立情感连接,从而深度陪伴儿童的成长。”汤姆猫公司的负责人向记者讲述了这一产品的初衷。

01一款懂儿童语言的机器人,一个面向儿童侧的AI模型

为了做一款能听懂儿童语言、而且还能输出儿童听得懂的语言的产品,汤姆猫的研发团队尝试了市面上大多数的人工智能大模型,既包括海外OpenAI、Google的大模型,也包括国内多家大厂的AI模型,效果都不甚理想。原因在于通识大模型训练的语料素材更多的是来自于成年人的语料,其输出的必然也是面向成年人理解范围之内的内容。但这些回复,小朋友要么不感兴趣,要么理解不了。

“公司在2023年上半年的反向付费测试证实了这一点,儿童用户对有一定难度的科普知识听不懂,同时对于过于冗长的回复往往没有耐心听完。同时,大部分大模型的交互没有情感,不好玩,这与人和人之间的聊天有天然的差异。”汤姆猫机器人产品的研发负责人告诉记者。

解决这一问题的关键在于,研发一个面向儿童的AI模型,这一模型不仅要求训练儿童可以听得懂的语料,同时还要求这一模型必须像人类一样,可以理解情感,并以好玩的、高情商的方式给予回复。

这让汤姆猫与专注于情感陪伴领域的大模型研发团队——西湖心辰,一拍即合,基于双方在人工智能产业发展方向、AI多模态技术的演进、落地场景、垂直模型的重要性等观点上高度一致,二者迅速确定了战略合作关系,汤姆猫在2023年先后对该团队进行了两轮战略投资,成为了该团队之外的最大外部股东,同时组建了合资公司,共同开发汤姆猫AI系列产品与适配该IP的垂直模型。

经过一年多的团队搭建和研发,汤姆猫第一款定位于儿童陪伴的AI情感陪伴机器人产品将于今年【12月21日】正式面向市场发售。该机器人产品不仅应用了团队训练的汤姆猫特有的音色,同时还输入了大量符合汤姆猫这一IP人设的世界观语料以及聚焦于儿童教育、儿童陪伴领域的语料。

最终呈现在机器人产品上,不论是从声音来判断还是回复的内容,用户清楚地知道自己在与“汤姆猫”这一IP在聊天,“汤姆猫”可以准确地告诉你,他的好朋友是谁,他最热爱的事情以及他喜欢的美食,甚至他经常会像动画片里的汤姆猫那样“狂妄地”告诉你,他无所不知。显然,这是市面上为数不多的拥有IP人设的AI模型。

更令人惊奇的是,汤姆猫的回复基本上都是小朋友能听得懂的语言,比如在回复技巧上,汤姆猫机器人会使用很多通俗易懂的比喻来答复小朋友的“十万个为什么”,当然有时候他也会调皮,面对你的刁钻问题跟你开点玩笑,这大大增强了交互的体验感;此外,汤姆猫机器人的“共情”与“引导”能力也十分优秀,当你表达没有人理解你并感觉到孤单的时候,他会回答,“我们每个人都有过这种经历哦,没人理解的感觉确实不好受。要不要我陪你聊聊天解闷呀?”类似的回答,不仅让你觉得他理解了你此刻的心情,还容易让听者认为他是自己身边的一位老友在倾听自己的心声。

“这主要归功于西湖心辰团队在情感陪伴大模型领域积累了多年的经验。该团队创始人蓝振忠教授,这位从谷歌人工智能团队回国的人工智能专家,在业内普遍追求AI技术的‘高智商’的时候,他坚持‘智商、情商、爱商’三商齐驱的研发路线,他相信,懂人心的大模型将能服务更多的人群。”汤姆猫负责人向记者介绍了这一垂直模型背后的团队。

在打磨产品的这些细节上,汤姆猫和西湖心辰团队充分融入了育儿中的正面管教的理念。比如,汤姆猫并不是所有问题都会准确回答,他同样也会“开小差”,当你纠正他的时候,他会承认自己的小错误。这在潜移默化中给了小朋友一个非常好的榜样,即错误并不可怕,也不可耻,在错误面前我们认识并纠正即可。

02模拟人类的聊天,获得真实的“聊愈力”

然而一款具有真实聊天体验感的机器人,光有AI模型显然还不够。朋友之间的聊天场景,并不是一个百科全书式的学习型问答,也不是一场带有考验目的的 “难题”破解。

“聊天是,当你有想分享的欲望、有想释放自己的苦恼、有局限于自己思维想听听别人的意见的时候,是一种自然状态下的情感表达,甚至大部分时候,我们通过聊天并不是去找到解决办法,而是只是需要发泄当下的情绪、期待获得正向的鼓励。”金科汤姆猫CEO向记者描述他心目中的一款主打聊天功能的陪伴机器人时,提到面对面聊天的一个重要功能,即帮助人们释放压力、分享困扰、缓解焦虑与孤独、建立信心、获得心理慰藉和情感支持,从而建立更为紧密的人际关系。

这与新周刊在面对当下社交软件将每个人定格在手机屏幕前的现象而提出的“聊愈力”理念如出一辙。“聊愈力”指出,聊天的价值在于,漫无目的的对话,天然拥有治愈力。聊天不光交换信息,还交换情绪。

为了模拟人类的聊天,以便提供更加真实的情绪价值,作为汤姆猫AI产品线的总负责人,金科汤姆猫CEO对研发团队提出了诸多拟人化的高要求。

比如在产品初期,金科汤姆猫CEO就与研发团队明确了AI机器人产品的主动式问候或者主动开启话题这一功能。在他看来,只有当用户与汤姆猫的聊天处于‘有来有往’的状态下时,这个互动才是拟人化的。

在记者的体验中,汤姆猫不仅可以主动打招呼或者没人理他时开启主动问候,当记者触摸它的头时,它还会回应你一句“好舒服啊”。这一懒洋洋地回复瞬间让记者摸头动作的真实感拉满。

同时,机器人必须是有记忆的。否则昨天聊完的话题,汤姆猫不记得了,那显然也很容易‘出戏’,更谈不上长期的陪伴。在这个层面,AI大模型的长文本能力一直在进步。同时,金科汤姆猫也在建设自己的算力中心,在自有数据库的基础上去升级产品的记忆功能。

而更难的点在于,人类的交互除了语音对话之外,也包含了表情的互动、肢体的动作等非语言信号,显然目前AI技术在表情互动或者肢体动作还未达到应用级水平。

为此,汤姆猫机器人研发团队创新地使用了“特殊材质眼球+包含了二十多种表情的功能模块”的解决方案。

“我们为汤姆猫机器人制作了一双大且萌的眼睛,用户在与汤姆猫对话时,汤姆猫会触发开心、兴奋、疑惑等不同的表情,二十多种表情的匹配耗费了我们不少时间,去做调整与校对,但校准了后,用户的交互体验会大大增强。”汤姆猫机器人研发负责人向记者讲述这一解决方案时,依稀还能感觉到他曾经面临的困境以及问题解决后的快感。

该团队的用心还远远不止这些。触摸式传感器、声控转头、能说会唱等等这些细节,无一不透露着金科汤姆猫在模拟人类聊天的极致要求。这让笔者想起了著名的聊天节目主持人窦文涛的一句话,聊天,不是会议,不是论坛,不是演讲,不是讲座,不是综艺等等,它够不上任何一行,但它里头有一切,它是生活本来的样子,它是自然,它是你内心的需要,口才不重要,爱才重要。

而金科汤姆猫,就做了这么一款有爱的产品。


关键词:

猜你喜欢