OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性
最新消息,据金十报道,OpenAI的一名员工公开指责马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(IgorBabushkin)则坚称公司并无不当。
xAI的图表显示,Grok3的两个版本——Grok3ReasoningBeta和Grok3miniReasoning——在AIME2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME2025得分。
巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。
声明:文章不代表本站观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!