本文来自微信公众号:所有的鱼(ID:gh_90e16e4e6292),作者:wengyang,题图来自:《人生切割术》
3 月 14 日,OpenAI 发布 GPT4。对很多人来说,这就是今年最值得关注的科技新闻。因为去年底出现的 ChatGPT 已经足够好。那时它还是基于 GPT3.5 模型。新的 GPT4 则更进一步,曾有传闻称, GPT4 有大约 100 万亿个参数,是三年前问世的 GPT3 的 500 倍。(OpenAI 进行了辟谣,但没有公开真实数据)
演示中,GPT4 最有趣的新能力是它可以使用图像输入——你发一张梗图,它能理解这张图为什么好笑。这个功能有很多现实应用,比如给视障人群做指引。它也具备与前辈们相同的问题,比如编造答案,生成暴力和有害的文本。
(资料图)
但自去年发布以来,最受关注的显然不是这个问题。人们最在意的是自己是否会被取代,一个“典故”被反复提及:我们是不是会像 18 世纪的工人一样,挥锤砸向自己的珍妮机?
OpenAI 的人有一个相对积极的预测:一些工作岗位会消失,也有一些新的会被创造出来。但最终效果是入行门槛降低,专家的生产力得到提升。
短期看,任何一个工种被完全替代的可能性都很小。OpenAI 对 ChatGPT 的定位也更接近一个助理,而非专家;但长期看,它是会将人们从“狗屁工作”中解放出来,还是会让工人受困于最繁琐的工作,可拥有的财富份额却越来越低?
这不是无端的担忧。一篇对于卢德主义者的反思文章如此写道:理论上,计算机能做的越多,人类需要做的就越少。“劳动缩减”的前景理应让我们充满希望而不是不祥的预感。但是,在我们这样的社会中,不存在将富余转化为休闲的机制。
围绕这个论点存在一个广为人知的研究数据。2000 年以来,美国劳动和资本之间的收入分配,也就是工资和利润之间的分配,突然发生了变化,劳动力可获得的份额急剧下降。技术进步似乎并不平等地让每个人获益。
也有近在咫尺的案例。GPT4 让 OpenAI 最引以为傲的特性之一是安全性。虽然仍有几率生成有害文本(尤其是当人们孜孜不倦地诱导它“越狱”时),GPT4 相比 GPT3.5,生成这类内容的倾向降低了 82%。
这种下降背后是大量的人工调试,如果 AI 不知道对错,你就要告诉它,一遍遍地告诉它。TIME 的一项调查发现,为了降低 ChatGPT 的有害性,OpenAI 使用了大量的肯尼亚外包劳工。这些人帮助建立有害内容的过滤系统,建立“有道德的未来 AI”。方式是通过不断观看、标记互联网最阴暗丑恶的一些内容,儿童性虐待、兽交、谋杀、自杀……与此同时,这种创伤性工作的时薪在 1.32 到 2 美元之间。作为参考,当地前台接待员的最低工资为 1.52 美元。
ChatGPT的6.6亿次对话与2美元时薪
以下首发于小鸟文学 2 月 newsletter, 6.6 亿为 ChatGPT 网站的月访问量 :
1927 年五月,年轻的飞行员查尔斯·林德伯格驾驶单引擎飞机圣路易精神号从纽约市起飞。他接下来 33.5 个小时的飞行,成为了人类史上首次独自完成的不着陆跨大西洋飞行。
短短 42 年之后,阿波罗 11 号降落月球,第一个人类走出登月舱,完成了一次月球行走。
20 世纪,技术是以这样惊人的速度在前进的。但这种速度并没能维持下去。西北大学经济学家 Robert Gordon 表示,到 1970 年,现代生活所有的关键技术都已到位:卫生、电力、机械化农业、高速公路、航空旅行、电信等。广泛的共识是,1970 年至今,创新和经济增长相比于前 100 年显着放缓。在大多数方面,发达国家人民 2019 年的生活感觉上与 1979 年没有什么两样。
人们开始反复抛出一个疑问:为什么技术不再让人兴奋了?
著名人类学家、无政府主义者大卫·格雷伯将此描述为“一种失望、被骗的感觉”。对于 20 世纪中后期成长起来的孩子,那些出现在科幻作品里的技术未来并没有理所当然地成为现实。“简而言之,飞行汽车在哪里?力场、牵引光束、传送舱、反重力滑板、三录仪、长生不老药、火星殖民地,又在哪里?”
他在 2012 年发表的著名文章《飞行汽车和利润率下降》中写道,相反,70 年代以来有所进展的医疗技术和信息技术,都是一些模拟。并没有划时代的新技术出现,有的只是旧有的被打碎和模拟,并包装成“未来”。
直到最近,这种令人失望的停滞才似乎终于迎来终结,一些人相信,一种真正的划时代技术出现了:以 ChatGPT 为代表的 AI 聊天机器人,及其背后的大语言模型(LLM)。
ChatGPT 由人工智能公司 OpenAI 于 2022 年 11 月发布。仅两个月后,其活跃用户就达到一亿,打破了过往记录——对于 TikTok ,这个时间是九个月,Instagram 则用了两年半。如今,每天有 3000 万人在使用 ChatGPT。
ChatGPT 的基础形式是一个免费的网页对话机器人。你问它答,非常简单。让人印象深刻之处在于,它的知识非常广博,且实用性极强。正如 OpenAI 建议的,你可以让它给你解释物理概念、脑暴生日聚会的点子,或是让它帮你编程、改代码。它也可以瞬间生成一些看似需要创造力的东西,比如小说、散文、笑话甚至诗歌。
与此同时,ChatGPT 拥有联系上下文的能力,能与用户产生连续对话,甚至会在表述错误后纠正并道歉。
ChatGPT 的横空出世几乎立刻引发了业内的危机感。过去一个月,与这类 AI 工具相关的新闻层出不穷。先是曾对其投资数十亿美元的微软宣布将扩大与 OpenAI 的合作,将比 ChatGPT 更新的技术引入其产品,包括 Bing 搜索引擎和 Edge 浏览器。
紧接着,一度行动相对保守谨慎的 Google 迅速推出了自己的 AI 聊天机器人 Bard,基于自家开发的大型语言模型 LaMDA ,显然直接对标 ChatGPT。同时宣布将会把 LaMDA 集成到搜索引擎中。
但仓促的首次亮相并不顺利,Bard 的第一个演示就被指出存在事实性错误:在关于韦伯太空望远镜的问题下,Bard 回答韦伯望远镜“拍摄了太阳系外行星的第一张照片。”很快就有天文学家反驳,第一张系外行星图像实际上由甚大望远镜拍摄于 2004 年。
将对话机器人融入搜索引擎是一个万众期待的功能。原因之一是搜索引擎本身存在显而易见的问题:腐化、被广告充斥、愈发难用。“今天,100 亿次查询中有一半没有得到解答,或至少没有得到很好的答案。”微软高管 Yusuf Mehdi 接受采访时表示。而与实时搜索结果结合,也有望解决这类语言模型信息滞后,资料来源不明,甚至可能像 Bard 一样,给出完全错误答案的问题。
此外,2 月 7 日,百度也宣布推出自己的对话式 AI 工具“文心一言”;韩国企业 Naver 则将于今年上半年推出升级版的 SearchGPT 服务。
盛况之下,回到一开始的那个问题,人类是否的确打破进步瓶颈,迎来了突破性的技术?从想象力上来说,似乎是的。甚至在格雷伯的文章内,他所期待看到的技术之一就是“能与之进行有趣对话的计算机”。
但作为一个无政府主义者,格雷伯的论述并非停留在技术需要天马行空的层面。在他看来,之所以我们很难再看到 100 年前持续不断的观念革命,是因为如今资源被集中在少数几个巨大项目上,“即使是基础研究,似乎也是由政治、行政和市场需要驱动的,这使得任何革命性的事情都不可能发生。”
“我们正从诗意的技术走向官僚的技术。”
从结果上来看,许多一度看似极具希望的技术最终成为了更大的负担。
18 世纪和 19 世纪新型工业自动化的发明产生了矛盾的效果,使世界上越来越多的人变成了全职工人;而所有旨在使我们免于承担行政职责的软件,也使我们变成了兼职或全职的行政人员。
行政工作的增长直接导致了企业管理技术的引进。这些技术总是被说成是提高效率和在各层级引入竞争。这些技术最终的实际意义是,每个人都会把大部分时间花在推销东西上:基金申请提案、出书提案、对学生表现和基金申请的评估、对我们同事的评估、新的跨学科专业的说明……
大学教授似乎觉得他们不可避免地要花更多的时间来管理项目基金一样,富裕的家庭主妇们也轻易地接受了每年要花几周时间填写 40 页的在线表格来让孩子上小学。
事实证明,真正出现的技术是最有利于监视、工作纪律和社会控制的技术。正如我们不断被提醒的那样,计算机开辟了某些自由的空间,但它们并没有带来阿比·霍夫曼(Abbie Hoffman)所设想的无工作的乌托邦,而是产生了相反的效果。它促成了资本的金融化,使工人铤而走险地陷入债务,同时也为雇主创造“灵活”的工作制度提供了手段——既破坏了传统的工作保障,又增加了几乎所有人的工作时间。
引用自结绳志与澎湃思想市场:格雷伯的礼物|技术减速主义:我们为什么没能等来“飞行汽车”?
顺着格雷伯的思路,不由得让人好奇, ChatGPT 这样的工具将如何改变当下的社会与工作?当人们兴奋于 AI 可以帮自己写文案、周报,甚至论文的时候,它是会将人们从“毫无意义的工作”中解放出来,还是会让这些工作变得越来越繁琐,要求越来越高?
如果格雷伯还活着,他会视 ChatGPT 为诗意的技术还是官僚的技术?
这种对人力更高的要求已经显现出一些苗头。推出了 ChatGPT 的 OpenAI,最近又反过来推出了一种可以检测文本是否为 ChatGPT 生成的工具。尽管现在还非常不准确,正确率只有 26%,但可预见的是,随着 AI 被融入工作流,未来对于文本的评估会出现新的流程和标准。
评价 ChatGPT 的前辈 GPT-3 时,专栏作家 Stephen Marche 曾如此写道:根据我作为前莎士比亚教授的经验,我认为学术界需要十年的时间来面对这个新的现实:两年时间让学生摸清技术,三年让教授们认识到学生正在使用这些技术,五年让大学管理者决定如何处理。教师已经是世界上工作最繁重、报酬最低下的人了。他们已经在处理一个处于危机中的人文科学。而现在又出现了这个。我为他们感到难过。
人的现实境遇也值得关注。在生成式 AI 的大潮下,除了试图夺回自己作品主权的视觉艺术家们,VICE 采访发现,越来越多的配音演员也被要求签署合同,让渡他们的声音权利,以便客户可以使用人工智能生成最终可以取代他们的合成版本,有时甚至不需要额外补偿。
事实上,如今这些对话机器人在宣传里主推的功能,不论是“压缩信息提供答案”还是“激发好奇心”,距离这个领域所向往的终极目标,通用人工智能(AGI),都仍有很大的距离。对于 AGI ,OpenAI 创立者之一 Sam Altman 的定义是,“一个非常聪明的同事,你可以训练它做任何事情”。
而对于这种技术会带来的社会变化,这位支持全民基本收入的年轻企业家也有更远的想法。近期接受福布斯采访时,他表示,“我认为,如果 AGI 真的完全实现,我想象它会在各种意义上打破资本主义。”
这个层面上,格雷伯和他的想法似乎是相似的,“如果要发明机器人为我们洗衣服和收拾厨房,那么我们就必须确保,无论是什么取代资本主义,它都要建立在一个更加平等的财富和权力分配的基础上——其中不再有超级富豪或愿意做家务的绝望穷人。”
后记
这篇内容成文于一个多月前,人工智能领域在过去一个月同样发展迅速。New Bing 融合了 GPT4,以对话的功能来呈现搜索答案并提供参考来源,十分强大;百度的文心一言也已开发内测,效果有点好笑。
这都不由得令人产生更多好奇:
AI 生成内容的充斥会不会加速互联网的腐败?疑问来自于流传的一张截图,图中在炫耀一种新的创收方式:用 AI 批量生成自媒体文章,发到不同平台赚取流量补贴,虽然微薄但积少成多。垃圾内容的生产成本低得前所未有。你能接受的互联网上有多大比例的内容为 AI 生成?
AI 生成艺术会不会不是一种工具,而只是一种风格?我常看的 newsletter Garbage Day 聊到这个话题,论据是“我们只花了六个月的时间就开始将‘NFT 艺术’识别为一种特定的外观和感觉”(我同意)。如果你经常看 AI 绘画的帖子,会发现不论是 DALL-E 还是 Midjourney 都显示出对某种风格的倾向性,“蓬松的光晕”“暖大地色或蓝绿金属色搭配”“对称构图或强迫透视”。这种微妙的 AI 感在人为介入较少时尤其明显。那么反之,跳脱出这种风格的艺术会不会因其稀缺性变得更受欢迎?
数据中心还撑得住么?对于去年的流行——加密行业——碳排放曾是一个核心的争议点。那么如今上亿人每天不断输入、生成,会不会给人工智能行业带来同样的问题?
本文来自微信公众号:所有的鱼(ID:gh_90e16e4e6292),作者:wengyang
关键词: