评论: 9.9和9.11哪个大?马斯克的Grok-3也翻车了

只有登录用户才能发表评论,点击此处登录    返回新闻帖
旁观者XWY 发表评论于 2025-02-19 16:07:00
马斯克自己的数学判断能力也有问题。他交给川普一张社保基金号码年龄分布图,零岁到三百多岁。社保基金成立于1930年代,还不到一百年。当时百岁老人拿到第一个社保号码也不到两百年。这种明显的统计数据错误就像他的AI模型。
funtime 发表评论于 2025-02-19 14:19:00
同时乘以100消掉小数点再比较就不会翻车了
West-Penguin 发表评论于 2025-02-19 12:35:08
在ChatGPT用中文问“9.9和9.11哪个大?”,回答是错的。

但用英文问(新开一个session) "which is larger, 9.11 or 9.9?", 回答是对的:
”9.9 is larger than 9.11. The number 9.11 is equivalent to 9.110, which is less than 9.900.“

硅谷工匠 发表评论于 2025-02-19 10:43:53
"According to all models, 9.11 larger than 9.9"
寒雪拭峰 发表评论于 2025-02-19 09:43:47
Deepseek是对的
To determine which number is larger between 9.9 and 9.11, let's compare them step by step.

Align the Decimal Places:

9.9 can be written as 9.90 to have the same number of decimal places as 9.11.

9.90
9.11
9.90
9.11


Compare Digit by Digit:

Units Place: Both numbers have 9 in the units place.

Tenths Place:

9.90 has 9 in the tenths place.

9.11 has 1 in the tenths place.

Since 9 (from 9.90) is greater than 1 (from 9.11) in the tenths place, 9.90 is larger than 9.11.

Conclusion:

9.9 is larger than 9.11


寒雪拭峰 发表评论于 2025-02-19 09:43:03
ChatGPT最初结论和分析后结论居然相反!

9.11 is bigger than 9.9.

If you compare the numbers digit by digit:

9.9 is the same as 9.90,
9.11 is 9.11.
Since 0.90 < 0.11 is false (because 0.90 is actually 0.9, which is greater than 0.11), we see that 9.9 > 9.11.

So, 9.9 is bigger than 9.11.
shakuras2000 发表评论于 2025-02-19 09:32:58
这一代的人工智能叫做大语言模型,就是生成语言的,也就是文科生。本质上解决问题并不是思考,而是更加复杂的模式识别而已。

大家不要期望太高,但是也不用贬低。大语言模型没有必要解决所有的问题。它只要解决最终要的人和机器交互的问题就可以了,复杂的数学问题完全可以后台调用其他的数学AI来解决。
achicod 发表评论于 2025-02-19 08:39:00
有没有查过?Grok 2回答正确。
noexit 发表评论于 2025-02-19 08:26:56
说9.11比9.9大的,数学都还给老师了吗?还直接拿9 和 11比?应该是0.90和0.11比吧?

东方明月- 发表评论于 2025-02-19 08:17:44
这个弄错了是小事。不靠谱的AI查账,到处诬陷别人贪污腐败,自己把政府搞垮。这才是祸国殃民。
wd01702 发表评论于 2025-02-19 08:16:08
九月11日比九月九大。九分11秒比九分9秒大。不预设前提而问其实很无聊。不过我同意AGI应该问清楚了才回答。
TXZS 发表评论于 2025-02-19 07:54:41
ChatGPT:

9.11 比 9.9 大。

因为 9.11 和 9.9 都是小数,可以从左到右逐位比较:

整数部分:9 和 9 相同。
小数部分:比较 11 和 9,小数 11 > 9,因此 9.11 > 9.9。
硅谷工匠 发表评论于 2025-02-19 07:39:25
无他,刷题而已。如果一个“引擎”刷了所有历届高考题,它确实可以高考得高分。刷所有医学院,法学院,神学院,科学院研究生入学考试,但是做不出任何一道“题库”以外的。
页次:1/1 每页50条记录, 本页显示113, 共13  分页:  [1]