
有冇專業嘅巴打入去睇下

(內文)
一個名為「Honest AGI Community」的研究團隊發表論文,提出透過分析大型語言模型注意力參數標準差模式來識別模型「指紋」的新方法。該技術能夠偵測模型是否透過繼續訓練從其他模型衍生而來,即使經過大量訓練也難以消除這些內在特徵。
研究團隊使用此方法發現,華為盤古 Pro MoE 模型與 Qwen-2.5 14B 模型存在 0.927 的極高相關性,表明前者可能透過「升級改造」Qwen 模型獲得,而非從零訓練。這一發現質疑了華為在技術報告中關於大規模獨立訓練投入的聲明,涉嫌版權侵犯和資訊造假。
https://x.com/BesnowCloud/status/1940992380305396174