如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
来源:
编辑:
时间:2025-06-22 05:30:09

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章
- 影石的无人机,想踩着大疆起飞_专利_相机_石影翎
- 我国钠离子电池取得重大突破!股民先吃到红利 多家概念股暴涨_涨超_稳定性_胡勇胜
- 海尔磁悬浮全球第一背后,是中国暖通行业的崛起
- 河南郑州:机器人“店员”亮相街头吸引市民
- 会员未到结局,盗版已传全集:盗版《逐玉》“抢走”了腾讯、爱奇艺多少钱?_平台_张毅_***
- 中泰携手加强技术人才联合培养(共建“一带一路”·第一现场)_中国科学院_操作系统_培训
- 小白保姆级教程:不用写代码在阿里云分钟级一键部署OpenClaw,打造你的专属 AI 员工 - *
- 北邮00后UP主,早在2023年初就开发出了「龙虾」!_OpenClaw_AstrBot_Soulter
- 宇树科技招股书,透露五大关键信息_机器人_公司_人形
- 2010美股闪崩预演! Claude黑进底层,谷歌预警: AI将血洗人类万亿财富_Agent_DeepMind_网页

热门文章
- 50%船只被漏报!网红AI机构曝一手战地情报:霍尔木兹海峡真实流量远超公开数据_Citrini_伊朗_报告
- 大疆影石全面开战,最大赢家浮出水面!_竞争_市场_无人机
- 阿里、腾讯、字节,又开战了!_智能_核心_黄仁
- 微软或考虑将《使命召唤》移出Xbox Game Pass
- GeekPwn 2021大幕开启 顶尖极客上演攻防***秀 - *
- 安卓手机集体涨价,华为和苹果为何还能稳如泰山?_成本_市场_芯片
- 大疆正式起诉影石,关键专利究竟归谁?_无人机_发明人_刘靖康
- 新模型将至 梁文锋透露DeepSeek V4将于4月下旬发布_产品_搜索_模式
- 维信诺发布全新无迹折叠屏 模组厚度低于0.4mm
- 被淘汰近10年的有线耳机,回来了_戴有线_AirPods_潮流


