当前位置: 首页 >
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 人气:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-19字节大量使用新语言,包括go,rust等,为什么阿里一直都抱着j***a不松手?
- 2025-06-19未来江苏会不会被广东越甩越远?
- 2025-06-19作为一个服务器,node.js 是性能最高的吗?
- 2025-06-19都说苹果是细节狂魔,那苹果有没有细节其实做的很差的点?
- 2025-06-19为何中国反复升级轰六轰炸机群?
- 2025-06-19你们的美系福特开了多少年?
- 2025-06-19为什么台式 PC 还处在组装(DIY)阶段?
- 2025-06-19在中国儿子就那么重要吗?
- 2025-06-19为什么军队中使用「幺」「拐」「勾」「洞」等发音来口头表述数字?
- 2025-06-19大家猜猜伊朗的结局如何?
- 2025-06-19巴基斯坦援助伊朗防空,大家怎么看?
- 2025-06-19京东外卖为什么一直没有骑手接单?
- 2025-06-19为什么Dreamwe***er,FrontPage会被淘汰?
- 2025-06-19媒体称以色列防空成本一晚近 3 亿美元,最多再撑 12 天,美方会支援吗?若无美补给结果会如何?
- 2025-06-19中国军队有多强,在世界能排第几?
- 2025-06-19怎么通俗的解释路由这个词?
推荐产品
-
能分享一下你写过的rust项目吗?
工作层面上,全是我一个人干。 1,有几个项目是直接用 ru -
如何评价黄子华?
在B站看了很多他的栋笃笑,记得一段 他买寿司给爷爷吃,爷爷说 -
Vim 有什么奇技淫巧?
整理一下笔记, 尽量多给一些不常见但好玩实用的命令。 退出 -
大家觉得华为鸿蒙系统5.0好用吗?
2025.6.16 更新: 随手写的答案破百赞了。 如果有条
最新资讯