如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?_安徽省滁州市滁州经济技术开发区尽护清洁用具有限合伙企业
联系人:
手机:
E-mail:
地址:
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
发布时间:2025-06-20 13:35:15 人气:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
相关新闻
- 不生孩子纯玩一辈子可行吗? 单从身体上而言,不考虑有身体疾病的情况下: 80岁以上的老人...
- 冬天也要穿胸罩吗? 坦白局…你们的冬天真的都不穿内衣啊?是这样的,今天不小心碰到...
- 台湾是中国领土,那台湾海峡算是内海,为什么不击沉那些无理通过海峡的军事力量? 朋友,这事不怪你,这是我们宣传部门长期在台湾海峡上表达含混不...
- 有一张巨强的显卡是什么体验? 说个反的,1660显卡玩黑猴,画面马赛克但游戏流畅,也就没在...
- 为啥苹果不给 MacBook Pro 加上这些特性? 这问题是2019年的,现在是2024年。 在这五年里,MBP...
- 为什么 Bun 选择了 Zig 以及 JSCore? 因为 Bun 打的就是差异化的牌,选择 JSC 和 Zig ...


客服