你的位置:柠檬皮 丝袜 > av在线 >

捆绑 调教 “Kimi数学版”,来了!具备了“推理逻辑”的大模子,吊打99%的东谈主类!

发布日期:2024-12-02 14:09    点击次数:176

捆绑 调教 “Kimi数学版”,来了!具备了“推理逻辑”的大模子,吊打99%的东谈主类!

地球东谈主齐知谈:捆绑 调教

GPT类的大模子,以笔墨才能见长,在数理逻辑方面相比差。

GPT类的大模子,以笔墨才能见长,在数理逻辑方面相比差。

上海一个实验室在本年8月份发布了一个测驳斥说, 大模子插足2024年高考,语文赢得很高的分数(124分),数学则不足格:

包括目下的豆包、kimi、文心一言、通义千问等等整个大模子齐在内,齐是基于GPT的,因此齐是一个德行。

不外,本年9 月中旬,情况有了新的变化!

OpenAI发布了一个全新系列的大模子: o1,它承袭“强化推理”的时候途径,使大模子信得过具备了“逻辑推理才能”,而况也曾问世,就在科常识题解决方面, 一举稀疏了东谈主类的博士水平,如下图:

伸开剩余85%

国内大模子公司跟进最快的,是kimi。半个月前kimi就放出风来,说已经告捷研发出了k0-math,不日发布。

这两天,我尽然看到kimi的界面中,增多了 “kimi数学版”的logo:

这关联词被kimi CEO杨植麟视为“登月事营第二步”的舛错打破,王珏讲授赶在第一时辰尝尝鲜,给群众写一份测试论说。

【第一题】9.5和9.11哪个大?

关于东谈主类来说,这是通盘送分题,但关于 GPT类大模子来说,却是“送死”题!——因为它是基于“笔墨概率酌量”的,并莫得信得过的“逻辑推理”才能。

Kimi数学版如实能圣洁、且严谨地处置:

咱们看到,Kimi数学版如实颠倒严谨地按照数学逻辑推理的才略开展想考,而况把每一步齐“说”了出来。

而况,它不仅仅得出一个谜底就扬弃了,而是会承袭 多种考证阵势,确保得出的论断是正确的(如若发现不正确的话,它会再行开展想考)

【第二题】广西柳州的六年事统测题,难倒了全柳州整个小学数学讲授

原本的Kimi也能解——天然谜底是对的,讲明也简短可行,但它仍然并非基于“数学逻辑推理”的,而是基于“笔墨概率酌量”的。

让Kimi数学版来解捆绑 调教,那才真实纯逻辑的抒发:

看kimi的想考阵势和推理逻辑如实颠倒明晰:具体界说ψ运算次序、假定它是加法->论断、假定它是减法->论断(其实到这里已经不错得出最终论断了)、假定它是乘法->论断、假定它是除法->论断、而假定它是幂运算->论断。

而况Kimi把整个想考经过齐写下来了,凡是有极少数学基础,一定能看得懂——从这个角度, 实足不错饰演学生的讲授、以致讲授的讲授了吧!

【第三题】初中生数学竞赛题-丘成桐少年班选择试题(第1谈)

解一般题目并不可露出出AI的上风,从本题运转齐是各个档次的竞赛题、或者压轴题了。

这种题关于同档次的学生来说,难于登天!但关于Kimi数学版来说,却频频显得行云活水。

我畴昔也让kimi解过,频频大略得出正确的论断,而况解题阵势亦然对的(但不褂讪,偶然会算错)。

不外,从想考阵势、具体算法、以及解题的准确度、褂讪性等角度,要远逊于Kimi数学版:

【第四题】初中生数学竞赛题-丘成桐少年班选择试题第20谈

这个题目初看起来如实很绕,摸头不着。Kimi这回实足没解对——而况错得极其初级(见下图):

棋差一招,尤其是这种对题目要求的初级诞妄(而况不啻一次,每次齐会出极幼年问题),证据kimi还需要禁止向上。

不外,另一方面,如若仅仅启发咱们的想路的话,这倒也充足了——不管是关于学生、如故关于讲授, 最需要的并非解题的全经过,而是想路上的“启发”。

【第四题】2024高考数学压轴题

关于平时高中生来说,这种题是可望而不可及的。国度恰是要用压轴题,来筛选出有禀赋的学生吧!

Kimi的推崇,有些题是曲常明白、且正确的,有些题有些不容置疑,对离别我也不敢说,有能耐的讲授我方评判一下吧:

【第六题】大学生竞赛选择题-丘成桐领军运筹帷幄第1谈(微积分)

丘成桐数学领军班面向大一重生的选择题,第一题看起来倒不算难:

【第七题】大学生数学竞赛题-丘成桐领军运筹帷幄第10谈(概率题)

从本题运转,平时东谈主应该不错留步了!(王珏讲授亦然平时东谈主,我仅仅为了测试的需要,诚挚地copy&paste费力)

【第八题】大学生数学竞赛题-丘成桐领军运筹帷幄第15谈(几何题)

【本文小结】

1、咱们如实看到了Kimi数学版具备强大且合理的“推理才能”,天然也有不小的改良空间。

2、通过上述测试,虽说Kimi的数学解题才能还莫得到那么完善,但稀疏99%的东谈主(包括我我方)应该不算夸张!

3、Kimi不仅具备较强的解题(逻辑推理)才能,而况把想考经过抒发得颠倒明晰,实足不错当作带领孩子找解题想路的“启发者”来使用。

4、提请群众想考:AI解题才能一定会远超东谈主类,东谈主类畴昔是莫得契机去解题的(AI又快又好、还免费,谁会让东谈主去解题呢?)。那么,咱们教数学、学数学的价值是什么?教什么?若何教?若何学?

这句话略微扩大一下,即是凯文·凯利的那句名言:

当一切顺手可取,关于东谈主类最蹙迫的是什么呢?

当一切顺手可取,关于东谈主类最蹙迫的是什么呢?

推特 男同

(凯文·凯利给出的主张,可在本公众号往期著作中找)

天然,我知谈,讲授们会说:

因为教师要考呀,数学学不好,连高中、大学齐考不上,那更不成了!

因为教师要考呀,数学学不好,连高中、大学齐考不上,那更不成了!

这个不雅点颠倒践诺,我也颠倒情愿。

但是,考上大学 ,即是咱们教和学的 独一指标吗?——即便考上大学、大学毕业后,学生就 被AI淘汰?(因为畴昔即便有题目需要解,也不会先让东谈主类去解,除非你比AI强,才有契机)

当作家长,咱们亦然这样想的吗——只好考上高中、大学就行捆绑 调教,无所谓畴昔是否能找到责任?无所谓畴昔会不会被AI淘汰?

发布于:北京市





Powered by 柠檬皮 丝袜 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024