號稱“地球上最聰明的AI ” Grok 3 竟答不對 9.11 和 9.9 哪個大!

老貓再世_

69 回覆
45 Like 3 Dislike
老貓再世_ 2025-02-19 16:28:34
在發佈會上,馬斯克宣稱 Grok 3 在數學、科學與程式設計的基準測試中超越了所有主流模型,並計劃將其應用於SpaceX的火星任務計算,甚至預測未來三年內將實現諾貝爾獎級別的突破。





但 Grok 3 的實際測試表現卻讓人大跌眼鏡。 發佈后,一些媒體測試了最新的 Beta 版 Grok 3,並提出了那個經典的用來刁難大模型的問題:“9.11 與 9.9 哪個大? “遺憾的是,號稱目前最聰明的 Grok 3,仍然無法正確回答這個問題,被網友戲稱為”天才不願意回答簡單問題“。


此外,在 xAI 發佈會直播中,在分析遊戲《流放之路 2》的職業與昇華效果時,Grok 3 也給出了大量錯誤答案,並且馬斯克也沒有看出這些明顯的錯誤。

https://www.ithome.com/0/831/994.htm
老貓再世_ 2025-02-19 16:28:48
以揉制肛 2025-02-19 16:29:39
聽講目前得deepseek答得岩
新吉田之寶 2025-02-19 16:29:50
嗱,我唔准你咁㗎
連登好多人揸住 TSLA 用佢嚟打飛機㗎
老貓再世_ 2025-02-19 16:31:41
9月9日 美國乜嘢敏感事?
F5制都撳爛啦 2025-02-19 16:32:20
九月九日 九月十一日

當然九月十一日大啦

AI喎 咪又係垃圾指令
•加藤恵• 2025-02-19 16:33:07
你開埋think定deepsearch咪啱囉
唔開 2025-02-19 16:34:57
ChatGPT
茶包小企鵝 2025-02-19 16:35:19
其實佢係搞錯左中文個文法姐
茶包小企鵝 2025-02-19 16:36:26
對於美國黎講911一定大個重陽
宇宙緣 2025-02-19 16:37:04
屈別薯芽
Never祖DtLookUp 2025-02-19 16:37:47
個問題唔岩
Ask the right questions
J.V 2025-02-19 16:37:50


佢一時時, 其實而家差唔多全部ai都要用reasoning先一定答得岩
始終係text generation ai
大菜嘔 2025-02-19 16:38:00
英文問 無問題
新吉田之寶 2025-02-19 16:39:05
Grok 3 地球上最強 AI

竟然會冇 reasoning?
天才小釣手 2025-02-19 16:40:51
唔特登拎條問題去Training
欣賞佢唔造假
J.V 2025-02-19 16:41:15
Grok 3 我琴日用都有個簡單既數學乘法計錯, 話佢錯仲用好多種方法來證明佢岩, 最後要用logic 方面來叫佢再double check , 佢自己推理完覺得佢個答案唔符合logic先認錯

其實成個過程等於lead住佢做reasoning, 遲D佢出左reasoning就無岩
老貓再世_ 2025-02-19 16:41:55



J.V 2025-02-19 16:42:47
唔知release左未, 如果出左我記得按個Think 就得
老貓再世_ 2025-02-19 16:45:21
騰信元寶

褲掏牛鳩 2025-02-19 16:46:16
勁scam。成班傻鳩聽個吹水佬9up
老貓再世_ 2025-02-19 16:46:48
Trump AI:America is THE GREAT
加乘哥 2025-02-19 16:48:34
Grok可能覺得 9.11=10.1
興及自由 2025-02-19 16:50:35
可唔可以問吓 8963 下一個數目係咩
黃金巨匠 2025-02-19 16:52:12
呢條本身佢答錯咗好耐,係呢兩個禮拜先正確
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞