谷歌全面拥抱AI
凤凰网科技讯 《AI前哨》北京时间5月11日消息,北京时间今天凌晨,谷歌公司的年度I/O开发者大会正式拉开帷幕。不出所料,顶着巨大压力的谷歌把主题演讲的重中之重放在了生成式人工智能(AI)上,但是推进得依旧小心翼翼。
眼下,谷歌最大的压力来自ChatGPT和微软必应对于谷歌搜索霸主地位的冲击。AI的加持让原本名不见经传的微软必应焕发了第二春,也让外界批评谷歌行动迟缓。
(相关资料图)
谷歌管理层当然意识到了这一点,这次开发者大会就是为自己正名的大好时机。“我们正在重新构想包括搜索在内的所有核心产品。”谷歌CEO桑达尔·皮查伊(Sundar Pichai)在主题演讲中表示。
皮查伊称,谷歌正在将生成式AI整合到搜索和其他产品中,比如可以创建草稿的Gmail,以及可以对图像进行调整将人物居中、在空白区域上色的谷歌相册。
生成式谷歌搜索
谷歌搜索的未来是AI,但它并没有完全把宝押在聊天机器人上(尽管它正在开发一个名为“巴德”的聊天机器人),也没有重新设计自己的主页,让它看起来更像一个ChatGPT风格的信息系统。相反,谷歌把AI放在了互联网上最具价值版面的核心位置上,也就是现有的搜索结果中。
大会现场,为了演示全新生成式搜索,谷歌搜索副总裁利兹·里德(Liz Reid)打开笔记本电脑,开始在谷歌搜索框中输入,“为什么酸面包仍然如此受欢迎?”她写道,然后回车。谷歌的正常搜索结果几乎立即加载。在它们的上方,一个矩形的橙色区域脉冲发光,显示出“生成式AI是实验性的”。
谷歌生成式搜索处于实验性阶段
几秒钟后,发光被AI生成的摘要所取代:上面的几段话详细介绍了酸面包的味道有多好,它的益生元成分的优点等等。在右边,还有三个网站链接。里德称,这些网站的信息“证实”了摘要中的内容。
谷歌把这种形式称之为“AI快照”。所有这些都由谷歌大语言模型驱动,源自开放网络。然后,里德将鼠标移到对话框的右上角,点击一个被谷歌设计师称为“熊爪”的图标,它看起来像一个汉堡包菜单,左边有一条竖线。“熊爪”打开了一个新的视图:AI快照接着被一个句子一个句子地分割,下面有链接到特定句子的信息来源。里德再次指出,这是一种验证。她说,这是谷歌AI做到与众不同的关键。“我们希望当大语言模型说了什么时,它能告诉人们可以从哪里阅读更多相关信息。”
AI快照显示在搜索结果最顶端
几秒钟后,里德点击回到主页,开始另一次搜索。这一次,她为泳池派对寻找最好的蓝牙音箱。同样,标准搜索结果几乎立即出现,AI搜索结果也会在几秒钟后生成。这一次,搜索顶部有一个简短的总结,详细介绍了你应该关心的蓝牙音箱问题:电池寿命,防水性能,音质。右边是三个购买指南的链接,下面是六个不错候选音箱的购物链接,每个链接旁边都有一个AI生成的摘要。记者让里德接着说“100美元以下”选择,她照做了。AI快照会重新生成新的摘要和新选择。
这是谷歌搜索结果页面的新外观。它是AI优先的,色彩丰富,与你所习惯的完全不同。它由谷歌迄今为止最先进的大语言模型提供支持,包括一个名为PaLM 2的新通用模型、谷歌用来理解多种媒体类型的多任务统一模型(MUM)。在记者看到的演示中,它通常令人印象极其深刻。它改变了你体验搜索的方式,尤其是在移动设备上,AI快照通常会占据搜索结果的整个第一页。
AI快照的颜色会根据搜索内容而变化
需要提醒的是,要想访问这些AI快照,你必须选择一个名为生成式搜索体验(SGE)的新功能,这是另一个名为搜索实验室的新功能的一部分。并不是所有的搜索都会触发AI答案,只有当谷歌的算法认为它比标准结果更有用时,AI会出现,而像健康和财务这样的敏感话题目前被设置为完全避免AI的干扰。但在记者的简短演示和测试中,不管搜索巧克力饼干、阿黛尔(Adele)、附近的咖啡店,还是2022年的最佳电影,AI快照都出现了。AI可能不会杀死谷歌搜索传统上显示的10个蓝色链接,但肯定会把它们往页面下方推。
大语言模型PaLM 2
今年3月,谷歌发布了旨在与ChatGPT竞争的实验性聊天机器人“巴德”。谷歌周三扩大了这一工具的使用范围,将其英文版本推向180多个国家和地区,同时还提供日文和韩文版本。
谷歌AI利器PaLM 2
皮查伊还在大会上讨论了谷歌为打造更强大AI技术所做的努力。他公布了一项更强大技术的最新版本——Pathways语言模型2 (PaLM 2),并表示已经开始研发一款更大的模型,名为Gemini。
谷歌称,通过在PaLM 2上运行,Gmail变得更加智能和富有创意。该聊天机器人将能够显示和解释图像,并允许用户将回复导出到Gmail、Docs和其他应用程序。
“PaLM 2模型在逻辑和推理方面更强,这要归功于广泛的逻辑和推理训练,”皮查伊称,“它还接受了100多种语言的多语言文本训练。”
PaLM 2的翻译能理解更深层意思
谷歌高级研究主管斯拉夫·彼得罗夫(Slav Petrov)在PaLM 2发布前表示,PaLM 2在一系列基于文本的任务上表现得更好,包括推理、编码和翻译。“与(2022年4月宣布的)PaLM 1相比,它有了显著改进。”他表示。
为了演示PaLM 2的多语言功能,彼得罗夫展示了PaLM 2如何能够理解不同语言中的习语,并给出了德语短语“Ich verstehe nur Bahnhof”的例子,它的字面意思是“我只理解火车站”,但是言外之意是“我不明白你在说什么”,相当于英语中的“一窍不通”。
谷歌工程师在一篇描述PaLM 2能力的研究论文中称,该系统的语言熟练程度“足以教授这门语言”,这在一定程度上是因为其训练数据中非英语文本的比重更高。
谷歌的医疗模型Med-PaLM 2
此外,谷歌还基于PaLM 2为医疗领域推出了Med-PaLM 2模型。该模型由谷歌健康研究团队训练,可以回答问题并总结各种医学文本的发现,比如它可以分析X光胸透影像。
借助PaLM 2,谷歌希望缩小公司与微软等竞争对手之间的“AI差距”。微软一直在积极地将AI语言工具整合到Office软件套件中。微软现在提供的AI功能可以帮助总结文档、编写电子邮件、生成演示幻灯片等等。谷歌需要与微软保持平起平坐,否则就有可能被认为在AI研究方面行动迟缓。
未来几周,美国消费者将能够通过等候名单获得生成式搜索体验。这是一个试验阶段,谷歌将监控搜索结果的质量、速度和成本。
纵观整个主题演讲,谷歌正在缓慢而谨慎地推进AI部署。也许对有些人来说,这太慢、太小心了。凤凰网科技《AI前哨》对此将持续关注。(作者/箫雨)
关键词: