
但 Grok 3 的實際測試表現卻讓人大跌眼鏡。 發佈后,一些媒體測試了最新的 Beta 版 Grok 3,並提出了那個經典的用來刁難大模型的問題:“9.11 與 9.9 哪個大? “遺憾的是,號稱目前最聰明的 Grok 3,仍然無法正確回答這個問題,被網友戲稱為”天才不願意回答簡單問題“。
此外,在 xAI 發佈會直播中,在分析遊戲《流放之路 2》的職業與昇華效果時,Grok 3 也給出了大量錯誤答案,並且馬斯克也沒有看出這些明顯的錯誤。
https://www.ithome.com/0/831/994.htm