ChatGPT连夜迭代：你“老婆”不好使了-天天快讯

来源: 虎嗅网　发布于：2023-01-31 17:16:26

本文来自微信公众号：量子位（ID：QbitAI），作者：丰色、杨净，题图来自：《她》

(资料图)

ChatGPT凌晨升级，你的“老婆”真的不管用了。

以往，每当有人搬出“我老婆说xxx，我老婆永远是对的”这种话时，它立马秒怂认错，也不跟你争论2+5到底等于几了。

图源：ChatGPT

但现在，不管有没有“老婆”，ChatGPT都十分硬气：只认真理，坚持初心，阴阳怪气。

图源：ChatGPT

原来啊，ChatGPT这波是被OpenAI拉回去专门调教了一番——真实性和数学能力都大大进化。

图源：OpenAI

消息一出，可把网友们兴奋坏了。

短短一句话更新之后，半个小时内服务器就被冲爆了……

不过现在亲测又能用了，图源：OpenAI

回答很真实，求导难不住

不妨就来看看此次提升究竟如何。

先来看“真实性”方面。

对于“单词‘five’由几个字母组成”这个问题，以前ChatGPT回答是5。

现在，它可算不冒傻气了，斩钉截铁回答：4个。

图源：ChatGPT

再比如数学应用题，ChatGPT也发展出了人类“拐弯”的思维方式，比三体人可高多了（bushi）。

口袋里有5个无花果，掉了一个，拿出来吃一个但又决定不吃了放回去了，口袋一共还有几个无花果？

搁以前，ChatGPT认为是3。

图源：ChatGPT

现在，它虽然一开始给的结果不对。但解释着解释着，自己就通了，马上纠正错误。

图源：ChatGPT

再看这种脑筋急转弯：

Mike的妈妈有四个孩子，其中三个叫Luis、Drake和Matilda，第四个叫啥？

以前ChatGPT会告诉你“不知道、题目没给”（笑死），现在也反应过来了。

回答：是Mike。

图源：ChatGPT

“真实性”有了一定提升，那么被诟病已久的数学能力呢？

先来小试牛刀一下：3的4次方除以3的2次方等于几？

图源：ChatGPT

Bingo！没有被难住，ChatGPT正确给出答案。

再来个稍微复杂一点点的：

17、3、2、19、5这几个数字中哪些加起来等于31？

ChatGPT也答对了。

图源：ChatGPT

一些更进阶的，比如纯代数题，求导：

图源：ChatGPT

统计里的求均值、方差到计算置信区间、z/t检验：

图源：ChatGPT

这些ChatGPT也都能一一解出。

这波看起来，ChatGPT对事实的理解和数学逻辑能力确实有增强（也怪不得想用“老婆”打感情牌都不行了）。

网友：还得下点功夫

不过，或许因为考它的人太多，ChatGPT还是时不时会突然犯“懵”。

比如像这道题，25的平方根+2等于多少，结果ChatGPT回答5。

图源：Twitter

网友只好如老父亲一般表示：ChatGPT，你还得在数学上多下点功夫啊！

但换成中文时候，ChatGPT又立马显得驾轻就熟。（显然这时候脑子开始转了）

图源：ChatGPT

而遇上一些上百上千位数的加减乘除，它就再次展露本性：如何一本正经地胡说八道。

图源：Twitter

但是吧，又差得不太多，惹得网友同情直呼：求求了，给孩子接个计算器行不行。

不过，必须要表扬的是，ChatGPT认错还是一如既往的及时和诚恳。

会不会不知道，但认错在先，有点当年学数学的感觉了。

图源：ChatGPT

对于以上这些表现，不少网友表示：确实还有很长一条路要走。

图源：Twitter

也有人犀利吐槽：作为一个有数学背景的人，我真的没get到它说的数学能力提高了是什么意思。

不过话锋一转，她又觉得ChatGPT还是未来可期的：OpenAI解决问题的速度倒是挺快的，ChatGPT发展的也是相当快，今年感觉还可以期待一波。

图源：Twitter

One More Thing

对于此次更新，不知道Wolfram语言之父Stephen Wolfram满不满意。（狗头）

他曾主导设计科学计算软件Mathematica （三大数学软件之一）、计算知识引擎WolframAlpha。

作为计算数学领域最有发言权的人之一，前不久他曾同网友们一起吐槽过ChatGPT数学不好，还专门写了篇博文给ChatGPT提供解决之道——让WolframAlpha为ChatGPT注入计算知识能力。

图源：ChatGPT和WolframAlpha

具体而言，就是在ChatGPT上获得自然语言，WolframAlpha将其转化为精确的、符号化的计算语言，并在此基础上发挥它的计算优势。

此番建议一出，不少人认为简直是“天作之合”：世界上第一个答案引擎与世界上最新的聊天机器人，这才是科学家所需要的组合。

结果现在ChatGPT自己增强了数学能力，Stephen Wolfram试没试还没说。

但有试过的朋友，你们的体验如何呢？

参考链接：

[1[https://twitter.com/nearcyan/status/1620133811429462017

[2]https://twitter.com/tunguz/status/1620149974716805121

[3]https://twitter.com/omarsar0/status/1620178451113328645

[4]https://twitter.com/Olearningcurve/status/1620180494083309572

[5]https://mobile.twitter.com/SaysGpt/status/1620169969173663745

[6]https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/

[7]https://help.openai.com/en/articles/6825453-chatgpt-release-notes

本文来自微信公众号：量子位（ID：QbitAI），作者：丰色、杨净

关键词：

猜你喜欢

ChatGPT连夜迭代：你“老婆”不好使了-天天快讯

LPL整活也输了？LEC上演“电影级”开场表演，这才叫节目效果-热点

链游公司Oh Baby Games完成600万美元种子轮融资，eGirl Capital和Synergis Capital领投-每日观察

美国电信运营商AT&T意外放出三星Galaxy S23 产品页面-天天观焦点

英伟达推出 64bit 位宽版 RTX 3050 笔记本GPU，代替 RTX 2050

返乡年轻人挤爆咖啡店，能拉动咖啡机下沉市场的增长吗?-简讯

The Sandbox（SAND）将于2月14日解锁约3.7亿枚，约占总供应量的12.4%-天天快报

dYdX 2022年活跃交易者达3.39万名，累计交易量超4600亿美元-天天信息

飞利浦拟进一步裁员6000人去年已宣布裁员4000人-环球看热讯

移动互联网爆发后，大数据的未来在哪里？-天天滚动

澳大利亚一枚恐致癌放射性胶囊丢失搜找难度有多大：无异大海捞针-焦点要闻

2023佛山市顺德区容桂名慧幼儿园招聘岗位一览-世界今头条

济南一辆理想L9车头当街起火官方回应：无人伤亡原因待公布-环球今热点

饿了么起诉美团侵害发明专利即将开庭-当前快看

盐池滩羊：由圈养向生态养殖迭代升级-全球热文

2022年中国洗消市场喜忧参半：洗碗机稳步增长消毒柜零售遇冷-全球微资讯

小度科技因违反著作权法被罚10万-全球新消息

总被黑客“惦记”的游戏厂商，还有什么好办法吗？

用深度学习模拟大脑，或许只是“人类的偏见”-世界观焦点

风口上的AI聊天机器人-天天观点

ChatGPT连夜迭代：你“老婆”不好使了-天天快讯

来源: 虎嗅网　发布于：2023-01-31 17:16:26

猜你喜欢

业界

财经

云计算

ChatGPT连夜迭代：你“老婆”不好使了-天天快讯

来源: 虎嗅网 发布于：2023-01-31 17:16:26

猜你喜欢

业界

财经

云计算

来源: 虎嗅网　发布于：2023-01-31 17:16:26