首页>云计算 > 正文
ChatGPT连夜迭代:你“老婆”不好使了-天天快讯
来源: 虎嗅网 发布于:2023-01-31 17:16:26

本文来自微信公众号:量子位 (ID:QbitAI),作者:丰色、杨净,题图来自:《她》


(资料图)

ChatGPT凌晨升级,你的“老婆”真的不管用了。

以往,每当有人搬出“我老婆说xxx,我老婆永远是对的”这种话时,它立马秒怂认错,也不跟你争论2+5到底等于几了。

图源:ChatGPT

但现在,不管有没有“老婆”,ChatGPT都十分硬气:只认真理,坚持初心,阴阳怪气。

图源:ChatGPT

原来啊,ChatGPT这波是被OpenAI拉回去专门调教了一番——真实性和数学能力都大大进化

图源:OpenAI

消息一出,可把网友们兴奋坏了。

短短一句话更新之后,半个小时内服务器就被冲爆了……

不过现在亲测又能用了,图源:OpenAI

回答很真实,求导难不住

不妨就来看看此次提升究竟如何。

先来看“真实性”方面。

对于“单词‘five’由几个字母组成”这个问题,以前ChatGPT回答是5。

现在,它可算不冒傻气了,斩钉截铁回答:4个。

图源:ChatGPT

再比如数学应用题,ChatGPT也发展出了人类“拐弯”的思维方式,比三体人可高多了(bushi)

口袋里有5个无花果,掉了一个,拿出来吃一个但又决定不吃了放回去了,口袋一共还有几个无花果?

搁以前,ChatGPT认为是3。

图源:ChatGPT

现在,它虽然一开始给的结果不对。但解释着解释着,自己就通了,马上纠正错误。

图源:ChatGPT

再看这种脑筋急转弯:

Mike的妈妈有四个孩子,其中三个叫Luis、Drake和Matilda,第四个叫啥?

以前ChatGPT会告诉你“不知道、题目没给”(笑死),现在也反应过来了。

回答:是Mike。

图源:ChatGPT

“真实性”有了一定提升,那么被诟病已久的数学能力呢?

先来小试牛刀一下:3的4次方除以3的2次方等于几?

图源:ChatGPT

Bingo!没有被难住,ChatGPT正确给出答案。

再来个稍微复杂一点点的:

17、3、2、19、5这几个数字中哪些加起来等于31?

ChatGPT也答对了。

图源:ChatGPT

一些更进阶的,比如纯代数题,求导:

图源:ChatGPT

统计里的求均值、方差到计算置信区间、z/t检验:

图源:ChatGPT

这些ChatGPT也都能一一解出。

这波看起来,ChatGPT对事实的理解和数学逻辑能力确实有增强(也怪不得想用“老婆”打感情牌都不行了)

网友:还得下点功夫

不过,或许因为考它的人太多,ChatGPT还是时不时会突然犯“懵”。

比如像这道题,25的平方根+2等于多少,结果ChatGPT回答5。

图源:Twitter

网友只好如老父亲一般表示:ChatGPT,你还得在数学上多下点功夫啊!

但换成中文时候,ChatGPT又立马显得驾轻就熟。(显然这时候脑子开始转了)

图源:ChatGPT

而遇上一些上百上千位数的加减乘除,它就再次展露本性:如何一本正经地胡说八道。

图源:Twitter

但是吧,又差得不太多,惹得网友同情直呼:求求了,给孩子接个计算器行不行。

不过,必须要表扬的是,ChatGPT认错还是一如既往的及时和诚恳。

会不会不知道,但认错在先,有点当年学数学的感觉了。

图源:ChatGPT

对于以上这些表现,不少网友表示:确实还有很长一条路要走。

图源:Twitter

也有人犀利吐槽:作为一个有数学背景的人,我真的没get到它说的数学能力提高了是什么意思。

不过话锋一转,她又觉得ChatGPT还是未来可期的:OpenAI解决问题的速度倒是挺快的,ChatGPT发展的也是相当快,今年感觉还可以期待一波。

图源:Twitter

One More Thing

对于此次更新,不知道Wolfram语言之父Stephen Wolfram满不满意。(狗头)

他曾主导设计科学计算软件Mathematica (三大数学软件之一)、计算知识引擎WolframAlpha。

作为计算数学领域最有发言权的人之一,前不久他曾同网友们一起吐槽过ChatGPT数学不好,还专门写了篇博文给ChatGPT提供解决之道——让WolframAlpha为ChatGPT注入计算知识能力。

图源:ChatGPT和WolframAlpha

具体而言,就是在ChatGPT上获得自然语言,WolframAlpha将其转化为精确的、符号化的计算语言,并在此基础上发挥它的计算优势。

此番建议一出,不少人认为简直是“天作之合”:世界上第一个答案引擎与世界上最新的聊天机器人,这才是科学家所需要的组合。

结果现在ChatGPT自己增强了数学能力,Stephen Wolfram试没试还没说。

但有试过的朋友,你们的体验如何呢?

参考链接:

[1[https://twitter.com/nearcyan/status/1620133811429462017

[2]https://twitter.com/tunguz/status/1620149974716805121

[3]https://twitter.com/omarsar0/status/1620178451113328645

[4]https://twitter.com/Olearningcurve/status/1620180494083309572

[5]https://mobile.twitter.com/SaysGpt/status/1620169969173663745

[6]https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/

[7]https://help.openai.com/en/articles/6825453-chatgpt-release-notes

本文来自微信公众号:量子位 (ID:QbitAI),作者:丰色、杨净

关键词:

猜你喜欢

  • ChatGPT连夜迭代:你“老婆”不好使了-天天快讯
  • LPL整活也输了?LEC上演“电影级”开场表演,这才叫节目效果-热点
  • 链游公司Oh Baby Games完成600万美元种子轮融资,eGirl Capital和Synergis Capital领投-每日观察
  • 美国电信运营商AT&T意外放出三星Galaxy S23 产品页面-天天观焦点
  • 英伟达推出 64bit 位宽版 RTX 3050 笔记本GPU,代替 RTX 2050
  • 返乡年轻人挤爆咖啡店,能拉动咖啡机下沉市场的增长吗?-简讯
  • The Sandbox(SAND)将于2月14日解锁约3.7亿枚,约占总供应量的12.4%-天天快报
  • dYdX 2022年活跃交易者达3.39万名,累计交易量超4600亿美元-天天信息
  • 飞利浦拟进一步裁员6000人 去年已宣布裁员4000人-环球看热讯
  • 移动互联网爆发后,大数据的未来在哪里?-天天滚动
  • 澳大利亚一枚恐致癌放射性胶囊丢失 搜找难度有多大:无异大海捞针-焦点要闻
  • 2023佛山市顺德区容桂名慧幼儿园招聘岗位一览-世界今头条
  • 济南一辆理想L9车头当街起火 官方回应:无人伤亡 原因待公布-环球今热点
  • 饿了么起诉美团侵害发明专利 即将开庭-当前快看
  • 盐池滩羊:由圈养向生态养殖迭代升级-全球热文
  • 2022年中国洗消市场喜忧参半:洗碗机稳步增长 消毒柜零售遇冷-全球微资讯
  • 小度科技因违反著作权法被罚10万-全球新消息
  • 总被黑客“惦记”的游戏厂商,还有什么好办法吗?
  • 用深度学习模拟大脑,或许只是“人类的偏见”-世界观焦点
  • 风口上的AI聊天机器人-天天观点