Bitget App

交易“智”变

OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性

OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性

金色财经

金色财经2025/02/23 02:33

近日，OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司，称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此，xAI的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。

xAI的图表显示，Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而，OpenAI的员工很快在X平台上指出，xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。

巴布什金在X平台上辩称，OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

0

0

免责声明：文章中的所有内容仅代表作者的观点，与本平台无关。用户不应以本文作为投资决策的参考。

PoolX：锁仓获得新代币空投

不要错过热门新币，且APR 高达 10%+

立即参与！

你也可能喜欢

BCA Research：估计已有60亿美元的加密流动性因Meme币从生态系统中流失

金色财经•2025/02/24 09:49

数据：6 只香港虚拟资产 ETF 今日成交额约 1563 万港元

Chaincatcher•2025/02/24 08:50

Galaxy Digital在4天内向币安转移价值2660万美元UNI代币

金色财经•2025/02/24 08:42

过去 7 天 Tron 链上稳定币增加 8.25 亿美元

金色财经•2025/02/24 08:27

热门新闻

BCA Research：估计已有60亿美元的加密流动性因Meme币从生态系统中流失

数据：6 只香港虚拟资产 ETF 今日成交额约 1563 万港元

加密货币价格

交易热门币种

新用户可获得价值 6200 USDT 的迎新大礼包

立即成为交易者？新用户可获得价值 6200 USDT 的迎新大礼包

Trade smarter

Trade smarter

下载 App

公司

关于我们联系我们海外华语社区工作机会 2022-2024合作伙伴：梅西土耳其顶尖运动员合作伙伴 Blockchain4Youth Blockchain4Her 媒体工具包 Bitget 博客公告中心储备金证明保护基金 BGB 友情链接网站地图

产品

现货合约杠杆策略理财 APIs Web3 钱包法币 OTC

跟单

现货跟单合约跟单策略跟单 TraderPro

服务

提交反馈帮助中心官方验证通道上币申请 VIP 服务机构服务资产托管下载数据福利中心好友邀请费率表报税 API

法律与风险披露

执法请求监管请求合规牌照反洗钱政策隐私政策用户协议法律声明风险提示 ST 规则

工具

Telegram 应用中心币圈导航币圈百科加密货币小组件活动日历加密货币术语表收益计算器空投列表

买币

概念板块计算器买 BTC 买 ETH 买 Doge 买 XRP 买 BGB 买 SHIB 加密货币行情比特币价格以太坊价格 BRC-20 价格

Trade smarter

下载 App

© 2024 Bitget

丨隐私·条款·风险