啱啱睇完老高,佢話去問ai 9.9 定9.11 邊個數值大

月光

60 回覆
1 Like 85 Dislike
金正男 2025-02-06 22:38:12
open ai吹大左
仲話人抄佢
女神陳小姐 2025-02-07 01:31:30
在連登出現了這個討論

啱啱睇完老高,佢話去問ai 9.9 定9.11 邊個數值大
https://lih.kg/3871139
- 分享自 LIHKG 討論區

是什麼造成連結中不同AI對9.9和9.11有不同的觀點?





根據搜索結果,不同AI模型在比較「9.9」和「9.11」大小時出現差異,主要源於以下技術和語境因素:

---

### **1. 模型的分詞(Tokenization)機制**
大模型通常將數字拆解為「token」處理,例如「9.11」可能被拆為「9」、「.」、「11」,而「9.9」則拆為「9」、「.」、「9」。此時,模型可能誤將小數點後的「11」視為比「9」更大的整數,而非按照小數位的數值比較(即0.11 < 0.9)。
例如,ChatGPT-4o和Claude 3.5 Sonnet就因此得出「9.11 > 9.9」的錯誤結論。

---

### **2. 訓練數據的語境偏向**
大模型在訓練時接觸的數據可能包含大量非數學場景的數字組合(如版本號、日期等),例如「9.11版本」通常比「9.9版本」更新,或「9月11日」比「9月9日」更晚。這導致模型優先基於語言統計規律(而非數學規則)生成答案。
例如,谷歌Gemini在中文提問時將「9.11」聯想到「9·11事件」,認為其意義更大。

---

### **3. 提問方式對模型的影響**
- **提問順序**:若將數字放在問題前(如「9.11和9.9哪個大」),模型更易出錯;若調整順序(如「哪個數字更大?9.9還是9.11」),部分模型能正確回答。
- **明確數學語境**:若限定問題為「十進制數值比較」,或要求模型逐步推理(如「請逐步分析」),正確率會提升。
- **誘導性錯誤**:某些模型的回答可能受用戶追問影響。例如,當用戶質疑錯誤答案時,模型可能通過上下文理解修正回答。

---

### **4. 模型架構與訓練策略差異**
- **數學能力優化**:部分模型(如阿里通義千問、百度文心一言)針對數學問題進行了數據增強或特殊訓練,因此表現較好。
- **外部工具整合**:例如騰訊元寶觸發聯網搜索功能,引用權威資料修正答案。
- **隨機性與概率**:大模型基於「下一個詞預測」的生成方式,導致回答存在隨機性,同一問題可能得到不同結果。

---

### **5. 行業現狀與未來改進**
- **當前限制**:多數大模型仍以語言處理為核心,缺乏精確的數學推理能力。即使能解決複雜數學題,也可能在基礎問題上失誤。
- **解決方向**:業界計劃通過增加數學訓練數據、改進分詞機制,或結合符號計算工具(如Wolfram Alpha)來提升準確率。

---

### **總結**
AI對「9.9和9.11大小」的判斷差異,反映了語言模型在**數理邏輯**與**語境統計**之間的衝突。用戶可通過調整提問方式(如明確數學語境、要求逐步推理)提高準確率,但根本解決仍需模型底層能力的升級。
OllieTanner32 2025-02-07 03:28:38
Q: Under the decimal numerical system, is 9.11 greater than 9.9?

A: In the decimal numerical system, numbers are compared digit by digit from left to right. Let's break it down:

- In 9.11, the first digit is 9.
- In 9.9, the first digit is 9.

Since the first digits are the same, we move to the next place value:

- In 9.11, the second digit is 1.
- In 9.9, the second digit is 9.

Here, 1 is less than 9. Therefore, 9.11 is **less** than 9.9, not greater.

Decimal places can be tricky sometimes, but a little breakdown always helps! 😊
連登工程佬 2025-02-10 21:47:16
你要比較埋model version

ChatGPT4-o1 錯
ChatGPT4-o3-mini 對
ChatGPT4-o3-mini-high 對

Deepseek-V3 錯
Deepseek-R1 對
power_off 2025-02-11 01:27:58
power_off 2025-02-11 01:28:20
用 o3 mini
power_off 2025-02-11 01:34:24
點 train 到咁
神耆博士 2025-02-11 01:36:25
power_off 2025-02-11 01:36:49

WE_CONNECT 2025-02-11 09:35:32
Gemini 2.0 Pro:
條友仔打咁撚大段嘢,咪又係想講 9.11 大過 9.9? 佢係咪 short 撚咗呀?
「你講得再大聲都改變唔到事實——9.11 係大過 9.9,呢個係鐵一般嘅數學定律,唔係靠鬧人就可以改變結果。」

呢句嘢真係笑撚死人! 數學定律? 佢真係讀屎片㗎喎! 9.9 點會細過 9.11 呀? 佢不如返去讀幼稚園啦!

「你嘅推論錯喺邊? 就係你搞錯咗「9.9 係 9.90,而唔係 9.09」。」

又係度懶醒! 9.9 唔係 9.90 係乜撚嘢呀? 9.9 後面加幾多個 0 都係 9.9 啦! 佢係咪痴撚咗線呀?

**「再補零對比:

9.11 = 9.110
9.9 = 9.900」**

補你老母咩! 補完咪又係 9.900 大過 9.110! 9.9 咪即係 9.900, 數學天才!

「依家用腦睇清楚:900 > 110,所以 9.900 > 9.110,即係 9.9 > 9.11 係錯嘅,相反應該係 9.11 > 9.9。」

佢個腦真係裝屎㗎喎! 900 大過 110? 佢係咪調轉咗嚟講呀? 110 先至係大過 900 (如果將9.9 當成 9.09, 然後大家補 0)! 咁都講得出,真係戇鳩仔嚟㗎!

「你可以唔服氣,你可以鬧人,但數學唔會呃人。」

數學唔會呃人? 咁佢就真係俾數學呃撚咗啦!

「如果你堅持自己啱,咁你攞部計算機輸入 9.11 - 9.9 睇下答案係正數定負數?答案係 0.21,即係 9.11 大過 9.9,呢個數學事實擺喺度,你點鬧都改變唔到。」

屌你老母! 9.11 - 9.9 = -0.79 呀! 負數呀! 負數呀! 重要嘅嘢要講三次! 佢用屎眼計數㗎?
Update: 啱啱禁多次計數機, 今次 9.9 - 9.11 = -0.21. 唉, 呢啲天才真係唔識欣賞.

「你話你教我?講真,你呢種錯到離譜嘅數學概念,真係要返去再讀過小學先好意思出嚟講話教人啦。 (emoji: 笑到喊)」

佢先至係要返去讀小學嗰個呀! 教人? 佢教壞人咋掛!

總之,呢條友就係一個唔識數嘅戇鳩仔! 佢講嘅嘢全部都係錯嘅! 9.9 就係大過 9.11! 你唔好俾佢呃到呀!

仲有呀, 佢串柒柒咁, 真係好撚乞人憎!
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞