简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » 9.9和9.11哪个大?马斯克的Grok-3也翻车了

9.9和9.11哪个大?马斯克的Grok-3也翻车了

文章来源: 第一财经 于 2025-02-19 07:35:57 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数

9.11和9.9哪个大?

这是一个曾让不少大模型“翻车”的数学题。北京时间2月19日,在马斯克发布自称“ 世界上最聪明的人工智能”Grok-3后,有用户尝试测试版本,发现该模型在不加任何定语及标注的情况下,无法正确回答刁难AI大模型的经典问题。

第一财经向Grok-3提问后,AI回答称“9.11比9.9大”,直接“翻车”。不过,也有获得测试资格的用户表示,Grok-3的性能很好,肯定处于行业第一梯队。

昨日,xAI的Grok-3正式发布,马斯克称之为“世界上最聪明的人工智能。”Grok-3诞生于超大型AI智算中心之上,该AI智算中心起初配有10万块英伟达高端显卡,后续扩容至20万块。此前DeepSeek-V3模型官方宣布仅用2000余块英伟达显卡,以及600万美元预算。

同一天,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,主要内容关于NSA (Natively Sparse Attention,原生稀疏注意力),进一步展示了DeepSeek团队在软硬件优化,降本增效方面的追求。

xAI团队在直播中表示:“为了研发下一代更高性能的AI,我们正在研究下一个AI智算中心,这将比目前的强大约5倍。”不仅仅是xAI,近期谷歌、微软、Meta、亚马逊四家国外大厂极大提高了2025年资本开支,总计达到数千亿美元,并称大部分资本开支将用于AI智算中心建设。另外,今年初公布的星际之门计划投资5000亿美元用于AI智算中心建设。

达观数据联合创始人张健对记者说:“Grok-3依然遵循大力出奇迹的缩放定律,通过堆叠大量算力和增大模型规模,追求极致性能提升。这种方式短期内可能在特定评测指标上取得领先,但性价比相对较低,更像是在探索模型性能的上限。”

但也有从业者表示“大力出奇迹”的思路还有较长的路要走,并认为成立时间不久的xAI,能够在短时间内实现一流的性能水平,说明卷算力,卷投资仍有价值。

韦豪创芯合伙人王智此前向记者表示,AI向未来演进,更多新架构和算法,长期而言,足够算力的支持必不可少。

不过越来越多人开始质疑这种“大力出奇迹”的方向。有评论称单看基准测试,虽然Grok-3各项数据领先,但是提升幅度并不大,尤其考虑到xAI已经花费巨额资金用来训练Grok-3。

“马斯克的AI智算集群方案非常激进,不仅要求大规模的资金投入,而且要求快速部署快速上马。”Omdia分析师王珅告诉记者。

张健认为,不管是DeepSeek还是Grok3,两种方向并非完全对立,而是各有侧重,可能长期并存,并在技术发展中逐渐融合。“Grok 3 代表着对性能极限的探索,Deepseek 则代表着对实用性和效率的追求。两者共同推动AI技术进步,最终目标都是构建更强大、更智能、更实用的AI系统。”张健表示。

王珅认为,这两种方向的侧重可能有着先后顺序。“我们团队判断,在2026年至2027年间,AI智算中心的堆算力高峰会过去,然后是各种硬件和模型的深度优化打磨。中国由于硬件限制,会更早强调优化。”

上海市人工智能行业协会秘书长钟俊浩告诉记者:“两种方向都重要,但有着优先级的差异,对性能极限探索是基础,而追求实用性和效率的方向要站在前者基础之上。”

  • 海外省钱快报,掌柜推荐,实现买买买自由!
查看评论(13)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

特朗普9月一行程曝光,堪称史无前例
川普大赞爱妻"1句话"点醒他,让他看清普丁真面目
比起三个美国籍孩子,宗家100多亿境外资产更值得关注
全球首例,深圳机器人搭地铁为商家送货
德州暴洪"神秘营"27女童遭冲走亡!恐怖事发全程曝光




24小时讨论排行

大连工大,你应该保护受害女生,而不是开除
中领馆:所有在美中国公民尽快完成"海外公民登记"
纽约时报:中国第二季度经济保持稳健增长
川普突然变强硬真正原因,觉得自己被普京羞辱了
川普稳赚不赔的战争生意 拜登就想不出这样的办法
纽约时报:“中国冲击2.0”比上一次严重得多
特朗普承诺军援,象征乌克兰战事的重要突破
欧巴马吁民主党"硬起来",勿因川普重返白宫而沉默
“同志”的年头要回归了?“共产”还远吗?
乌克兰喜收爱国者飞弹,俄议员酸"川普威胁"没人怕
关税没引起物价上涨?白宫爱国说法遭打脸 3大原因曝
美最高法院推翻禁令,让特朗普解散教育部
中国父子德国风景区湖中溺亡 失踪一周后找到遗体
美众议员:习近平在川普任内不会侵台 著眼50年…
袁红冰爆中国机要官员带文件叛逃 曝2套俄垮台后方案
陈立人杀妻案,前女友提交重要证物并要求不公开!
文学城新闻
切换到网页版

9.9和9.11哪个大?马斯克的Grok-3也翻车了

第一财经 2025-02-19 07:35:57

9.11和9.9哪个大?

这是一个曾让不少大模型“翻车”的数学题。北京时间2月19日,在马斯克发布自称“ 世界上最聪明的人工智能”Grok-3后,有用户尝试测试版本,发现该模型在不加任何定语及标注的情况下,无法正确回答刁难AI大模型的经典问题。

第一财经向Grok-3提问后,AI回答称“9.11比9.9大”,直接“翻车”。不过,也有获得测试资格的用户表示,Grok-3的性能很好,肯定处于行业第一梯队。

昨日,xAI的Grok-3正式发布,马斯克称之为“世界上最聪明的人工智能。”Grok-3诞生于超大型AI智算中心之上,该AI智算中心起初配有10万块英伟达高端显卡,后续扩容至20万块。此前DeepSeek-V3模型官方宣布仅用2000余块英伟达显卡,以及600万美元预算。

同一天,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,主要内容关于NSA (Natively Sparse Attention,原生稀疏注意力),进一步展示了DeepSeek团队在软硬件优化,降本增效方面的追求。

xAI团队在直播中表示:“为了研发下一代更高性能的AI,我们正在研究下一个AI智算中心,这将比目前的强大约5倍。”不仅仅是xAI,近期谷歌、微软、Meta、亚马逊四家国外大厂极大提高了2025年资本开支,总计达到数千亿美元,并称大部分资本开支将用于AI智算中心建设。另外,今年初公布的星际之门计划投资5000亿美元用于AI智算中心建设。

达观数据联合创始人张健对记者说:“Grok-3依然遵循大力出奇迹的缩放定律,通过堆叠大量算力和增大模型规模,追求极致性能提升。这种方式短期内可能在特定评测指标上取得领先,但性价比相对较低,更像是在探索模型性能的上限。”

但也有从业者表示“大力出奇迹”的思路还有较长的路要走,并认为成立时间不久的xAI,能够在短时间内实现一流的性能水平,说明卷算力,卷投资仍有价值。

韦豪创芯合伙人王智此前向记者表示,AI向未来演进,更多新架构和算法,长期而言,足够算力的支持必不可少。

不过越来越多人开始质疑这种“大力出奇迹”的方向。有评论称单看基准测试,虽然Grok-3各项数据领先,但是提升幅度并不大,尤其考虑到xAI已经花费巨额资金用来训练Grok-3。

“马斯克的AI智算集群方案非常激进,不仅要求大规模的资金投入,而且要求快速部署快速上马。”Omdia分析师王珅告诉记者。

张健认为,不管是DeepSeek还是Grok3,两种方向并非完全对立,而是各有侧重,可能长期并存,并在技术发展中逐渐融合。“Grok 3 代表着对性能极限的探索,Deepseek 则代表着对实用性和效率的追求。两者共同推动AI技术进步,最终目标都是构建更强大、更智能、更实用的AI系统。”张健表示。

王珅认为,这两种方向的侧重可能有着先后顺序。“我们团队判断,在2026年至2027年间,AI智算中心的堆算力高峰会过去,然后是各种硬件和模型的深度优化打磨。中国由于硬件限制,会更早强调优化。”

上海市人工智能行业协会秘书长钟俊浩告诉记者:“两种方向都重要,但有着优先级的差异,对性能极限探索是基础,而追求实用性和效率的方向要站在前者基础之上。”