对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
11月18日消息,对标代推第日前,布新国内人工智能公司月之暗面推出的理模Kimi国产大模型正式发布k0-math。
k0-math是型中Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,考高考考通过模拟人脑的研全思考和反思过程,大幅提升解决数学难题的对标代推第能力。
据了解,布新在多项数学基准能力测试中,理模k0-math的型中表现能对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。
根据官方公布的考高考考结果,在中考、研全高考、对标代推第考研以及包含入门竞赛题的布新MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型,理模拿下第一。
在业界最常使用的数学能力基准测试MATH 中,k0-math模型得分93.8,超过 o1-mini的90分和o1-preview的85.5分。
官方表示,k0-math这一成绩仅次于暂未开放使用的o1完全版94.8分。
据介绍,常规模型的设定目标是尽快提供问题的答案,但k0-math不同,k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。
不过,月之暗面坦言,k0-math虽然擅长解答大部分很有难度的数学题,但是当前版本还无法解答LaTeX格式难以描述的几何图形类问题。
另外,k0-math还有一些局限性需要突破,包括对于过于简单的数学问题,例如1+1等于几,k0-math模型可能会过度思考,对于高考难题和IMO题目依然有一定概率做错、猜答案。
月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。
(责任编辑:百科)
- ·回合制策略游戏《Chains of Freedom》Steam页面 明年发售
- ·真是造假吗?穆科科出身于圣保利青训,曾是U13梯队的头牌射手
- ·手机影像之王!荣耀Magic7 RSR 保时捷设计正式发布:7999元起
- ·酷睿Ultra 200S超频实战:游戏帧数暴增
- ·[流言板]Shams:热火与后卫以赛亚
- ·开启手机自动驾驶时代!荣耀Magic7获评AI手机年度标杆机型
- ·库明加更新社媒附带告别歌曲歌词,“牵着我的手,带我离开这里”以及“告诉我该去哪里”之类的内容。意味深长。
- ·萨拉赫被评为利物浦队内11月最佳球员,本赛季已第三次获奖
- ·埃梅里:曼城排名在我们之后,但未来几周他们情况会更好
- ·[流言板]纳瓦斯职业生涯荣誉盘点:世界杯+2座欧洲杯+4次欧联冠军
- ·[流言板]史密斯:所有人都知道汤普森对我们球队来说多重要
- ·队报:里尔边锋热格罗瓦曾获米兰试训机会,但因签证问题未能成行
- ·强!34岁德赫亚本赛季扑救成功率83%,领跑欧洲前七联赛
- ·邓弗里斯:我们想再次进入欧冠决赛并夺冠,2023年的失冠很难释怀
- ·PUBG中韩职业RACE邀请赛 Day1 积分榜&战神榜
- ·100倍超远摄神器!荣耀Magic7 RSR行业首发2亿超感光潜望长焦
- ·[流言板]2025年篮球名人堂候选人公布:安东尼、霍华德等人在列
- ·R.I.P. 利物浦球迷将在今晚的比赛中纪念不幸离世的19岁球迷
- ·[流言板]控制情绪!恩比德半场8中2,三分4中1,得到9分3篮板2抢断
- ·[流言板]美记:因母亲家里遭遇盗窃,布朗本周陪伴妈妈未参加训练