如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?_安徽省滁州市滁州经济技术开发区尽护清洁用具有限合伙企业
联系人:
手机:
E-mail:
地址:
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
发布时间:2025-06-19 02:05:10 人气:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
相关新闻
- 如何评价 Zed 编辑器? 看很多回答都是一年前的(现在2025.5),目前更新非常频繁...
- 你们的腰椎间盘突出,怎么治好的? 坚持,不断总结经验,有一天,忽然就好了。 先说下经历的波折...
- 新手平面设计师(方向美工)怎么有目的提升设计能力? 平时多看战酷,花瓣找灵感??? 确定老师是这样跟你说吗? 3...
- 你身边身材最好的女生是什么样? 去游泳的时候见过一个,165左右,小头宽肩细腰胯宽腿直肤白,...
- 六七年前 4000 多就可以买到入门级独显的笔记本电脑,现在为什么不行了? 因为那个时候的笔记本电脑是7768p/800p/1080p的...
- 各双拼输入方案之间有明显的优劣之分吗? 双拼初学者,没有大量数据支撑,只谈 个人感受(日平均输入在一...


客服