微软：AI不抢你工作，只当副手

来源: 虎嗅网　发布于：2023-05-25 14:09:42

本文来自微信公众号：晚点LatePost （ID：postlate），作者：贺乾明、邱豪，编辑：黄俊杰，题图来自：微软Build 2023

【资料图】

乔布斯曾将计算机比作大脑的自行车——人踩上脚踏板，速度就快了几倍；用上电脑，创作效率也成倍提升。在昨夜举办的微软 Build 开发者大会上，微软 CEO 萨提亚·纳德拉（Satya Nadella）重复了这个比喻，“随着 ChatGPT 出现，自行车变成了蒸汽机”。

他认为这是人工智能的重要时刻。而微软占据着独特的位置。

过去 4 年，微软向 ChatGPT 开发者 OpenAI 投资了 130 亿美元，拥有独家商业合作权利。而微软靠着 Windows 系统、Office 办公软件等一系列应用，深刻影响着全球数十亿人如何工作，去年从中净获利 727 亿美元，是腾讯的五倍。

ChatGPT 的诞生颠覆了人们对未来工作的想象，但大语言模型存在缺陷，会一本正经胡说八道，给出错误建议。早已出发的微软，希望进一步扩大优势。

在 Build 大会上，纳德拉和微软的高管们展示了一个更宏大的规划：如何在人工智能技术有缺陷的情况下，把它融入到微软所有核心业务中，让更多人和人工智能一起工作。

人主导工作，AI 只是副驾

Copilot（副驾驶）是微软 Build 大会上的关键词。据微软解释，Copilot 是用现代人工智能和大语言模型（如 GPT-4）协助人们完成复杂任务的应用。

2021 年，微软借助 OpenAI 的 GPT-3 开发辅助程序员写代码的 GitHub Copilot，引入了这一概念。ChatGPT 出现后，微软先后把它用到 Dynamics、Office 等应用中。在今年的 Build 大会上，微软把它扩展到 Windows 操作系统和其他核心业务中。

人工智能早已大规模入侵现实世界，每一个社交、电商平台都在用人工智能算法推荐内容和广告、兜售商品。纳德拉上周接受采访说，这是人工智能的自动驾驶时代——人工智能作为一个黑匣子，自主决定最终结果。而微软正在做的事情，代表着人工智能从自动驾驶时代转向了副驾驶时代。

“虽然（人工智能）发展速度快，但方向正确，人类掌握着更多主导权。” 纳德拉说。“让人类参与其中至关重要，可以充分利用技术带来的好处。” 人工智能大模型仍有缺陷的现在，Copilot 也可以尽可能减少 AI 的负面影响。

微软 Office 365 部门负责人施洋（Jared Spataro）把 Copilot 称为一种工作方式：“它嵌入 Word、Excel、PowerPoint、Outlook、Teams 等程序中，与你一起工作。”

他提醒 Copilot 只是辅助人们工作，而不是取代人们。“它会给你一个不完美的想法，你在这个基础上动手”，毕竟 “有时它是对的，有时也会出错。”

在 Build 上，微软副总裁优素福·迈赫迪（Yusuf Mehdi）用 Word 协助起草一份加州的法律合同的 Demo，展示了 Copilot 如何提高工作效率。

用升级后的 Word 打开通用的合同文本后，点击工具栏右方的 Copilot 按钮，会出现供用户输入需求的对话窗口。用户希望知道法律条款是否符合加州的法规时，Copilot 会调用 WestLaw 插件给出分析。用户希望修改特定责任条款时，Copilot 会调用插件阅读文档，找到特定的段落修改，并给出修改的摘要。“这是一种更有力地起草法律合同的方式，” 迈赫迪说。

在 Word 中使用 Copilot 的场景。来源：微软

同样，Copilot 是低成本完善人工智能系统的方法：每个用户一边向微软付钱使用软件，一边帮着人工智能更有效完成自己的工作，也帮着人工智能变得更有用。

微软的首席技术官凯文·斯科特（Kevin Scott）称，过几年，软件没有 Copilot，就会像今天软件不联网那样匪夷所思。

事实上，早就有公司做到了这一点。比如特斯拉的 “全自动驾驶”（Full Self Driving）系统，把辅助驾驶系统卖给车主，让他们给出反馈。过去几年，这套辅助驾驶系统给特斯拉贡献了数十亿美元收入，帮助特斯拉的系统变得更强。

融入现有软件和服务生态，绕开 AI 解决不好的问题

“过去 20 年的科技行业中，我看到的一个错误是，人们经常专注于基础设施，而不是产品。” 斯科特说，他一遍又一遍地提醒微软内部团队这件事。

“技术是伟大的。它让一大堆不可能、不可行或昂贵的事情变得可能、可行、更便宜。但模型不是你的产品。”

ChatGPT 和它背后的大模型，吞掉了海量文本数据，但还有许多具体的事情处理不好。比如它很难给出所有数学题的正确答案。今年 3 月，OpenAI 推出 GPT-4 后不久，便上线了插件系统，借助现有的软件和服务生态，绕开它解决不好的问题。当用户寻求解答复杂的数学题时，可以选择计算知识搜索引擎 Wolfram Alpha 的插件，获取准确答案。

现在微软把 ChatGPT 的插件体系引入所有使用 Copilot 的核心业务中。纳德拉说，开发者只要编写一次插件，就能把它部署到 ChatGPT、Bing、Dynamics 365 Copilot、Microsoft 365 Copilot、Windows Copilot 等产品中，触及数十亿用户。

微软把插件视为桥梁，连接公开数据训练的大语言模型和不同公司的保密数据。当用户向人工智能 Copilot 提出特定场景的问题时，由特定公司开发的插件给出更好的回答。

插件也是微软扩充大模型能力的关键。“你或许经常听到，基础模型很强大，但它不能做所有的事情。”斯科特说，“即使模型本身并不完整或完美，你也可以用插件增强 Copilot 或人工智能应用程序，让它做更多的事情。”

这也是微软建立人工智能生态的尝试，其庞大的用户基础确保了开发插件对开发者有吸引力。

ChatGPT 已经成为一个超级入口，它是最快突破 1 亿月活用户的消费级应用（只花了两个月）。据流量监测网站 SimilarWeb 数据，ChatGPT 4 月全球访问量为 17.6 亿次，仅次于 Google、百度和 Yandex 三家搜索引擎。在 Build 大会上，纳德拉宣布的第一个重要进展，就是把 Bing 作为插件接入 ChatGPT Plus 中，未来开放给所有 ChatGPT 用户。

微软自己的用户数也足够多。据微软发布的一份统计报告，不算盗版用户，全球共有约 15 亿 Windows 操作系统用户、12 亿 Office 办公软件用户。微软和 OpenAI 完全有希望做出一个人工智能时代的 App Store。迈赫迪说，现在微软和 OpenAI 的系统中已经有 50 多个插件，即将上线的插件有数千个。

如果说微软用 Copilot 改造业务是为了迎上技术革新的步伐，插件则展示了它希望在这次技术革新中向前一步。

斯科特说，这些插件就像是数字世界的执行器，可以增强人工智能系统，使其能够行动。演讲最后，他举了一个自己心目中 “传奇” 工程师如何用一次小的技术更新重塑行业的例子，“现在是我们所有人的时刻”，并用一句 “Do Legendary Shit” 作结语，引起整场观众热烈的回应。

尽管算力紧缺，微软依旧在线部署大模型

把大模型部署到更多场景中需要更多算力。据 The Information 等媒体报道，在全球 60 多个数据中心部署数十万张 GPU 的微软，因为 ChatGPT 掀起的需求激增而面临算力紧缺的局面。

斯科特现在负责协调微软的 GPU 预算和调配。他说这个工作 “既糟糕又痛苦”，因为 GPU 根本不够用。在 Build 上，微软的高管们没有明确透露如何解决未来算力可能更加紧缺的问题。

Google 选择将部分人工智能应用的算力消耗（比如查询和推理）转移至用户的电脑或者手机上。对于个人用户来说，最可靠的计算能力还是手里的手机、家里的电脑。如果你不玩游戏，这些设备中的算力都是冗余的。大模型如果能把这些冗余的计算资源变得有用，不仅可以让数十亿用户分担计算成本，还能推动终端硬件性能继续向前迭代。

在半个月前的 I/O 开发者大会上，Google 发布了新的大语言模型 PaLM2。PaLM2 分好几个版本，参数最少的版本壁虎（Gecko）可以在手机等移动设备上离线运行。

参数是大模型从大量数据中提炼的规律和特征。通常情况，参数越大，大模型的能力越强，消耗的算力会越多。Google 已经做到了用更少的参数实现更好的效果。但一个模型的参数如果少到足以在手机上快速运行，能力会有较大折扣，胡说八道的概率会提升。

微软和 OpenAI 看上去不打算选择这条路。GPT-4 没有参数规模更小的版本、不支持在终端离线运行，OpenAI 跟微软也都没透露将计算转移到本地的相关计划。斯科特在 Build 上介绍 Copilot 的技术体系时，指出微软的基础模型和人工智能基础设施能力，都会通过 Azure 输出。

Copilot 的技术堆栈。来源：微软

按照微软和 OpenAI 目前的设想，运算依然在微软的数据中心完成，用户联网获取答案。但他们预期随着算法进步、硬件迭代，完成一次运算需要的算力会降低。

OpenAI 曾做过一项研究，2020 年训练一个 AlexNet （一种用于图像识别的卷积神经网络）级别的神经网络所需计算量减少为 2012 年的 1/45，同期由摩尔定律代表的硬件效率提升只能带来 11 倍的成本优化。

OpenAI 总裁格雷格·布罗克曼（Greg Brockman）在 Build 上说，GPT-4 现在很贵，并不完全可用，但未来会发生变化，仅过去一年 OpenAI 就把 ChatGPT 的成本降低了 90%。他相信类似的降本效率能持续下去。斯科特也跟着强调，那些今天看上去很贵的事情明天可能就便宜下来。

在微软召开 Build 的同时，它的同行们也发布了新进展。

OpenAI 前员工创办的大模型公司 Anthropic 宣布从 Google、Salesforce、Zoom 等投资方手中获得 4.5 亿美元资金。市场将 Anthropic 视为 OpenAI 最强的竞争对手。

Google 宣布将用生成式人工智能改造广告业务。当用户搜索时，Google 的大模型会根据搜索关键词生成有针对性的广告标题。

Adobe 发布了内置 AI 的测试版 Photoshop。用户只需要输入文字，它可以自动修改图片。Adobe 称，这一新功能会在今年下半年在 Photoshop 中全面推广。

没人能准确判断生成式人工智能究竟将如何重塑人类工作。但可以肯定的是，全球最重要的生产力工具平台都在向这个方向全力投入，从不同角度探索，尽快让改变成为现实。

本文来自微信公众号：晚点LatePost （ID：postlate），作者：贺乾明、邱豪，编辑：黄俊杰

关键词：