Claude創始人警告：比模型升級更緊急的是AI可解釋性，否則人類或被AI欺騙和取代

大角倔喜 2025-05-23 18:34:29

在 2025 年 5 月 22 日的開發者大會上，Anthropic 發佈了最新一代混合推理大模型系列 Claude 4，其中包括高端版本 Claude Opus 4 與普及型 Claude Sonnet 4。
作為Anthropic聯合創始人兼首席執行官，Dario Amodei的職業生涯堪稱AI發展史的縮影。這位普林斯頓大學物理學博士早年先後在谷歌大腦、斯坦福大學醫學院及百度從事前沿研究，後於OpenAI擔任研究副總裁期間主導了GPT-2與GPT-3的架構設計。2019年創立Anthropic後，他帶領團隊將技術重心轉向AI安全與可解釋性研究，其提出的"憲法AI"框架已成為行業標準。

在其 2025 年 4 月發表的文章《The Urgency of Interpretability》中，Amodei 提出，當下 AI 技術高速迭代，只有同步加速對模型內部機理的「核磁共振」式解讀，才能在強大模型出現前及時掌握其風險與能力。他指出，近期在機械可解釋性領域取得的神經元特徵與「電路」識別突破，已讓我們有機會揭開 AI 系統的黑箱面紗，但必須立即行動，否則模型可能在尚未可控時就獲得壓倒性力量。Amodei 呼籲研究者、企業與政策制定者共同加速可解釋性研究、建立透明測試框架，以確保我們能夠主動「駕駛」這輛不可阻擋的技術巨輪，朝著對社會有益的方向前進。

天才小釣手 2025-05-23 19:00:37

AI成日比小妹呃就真
小妹成日set個tag話小妹睇唔到<tag>入面嘅內容
個AI又真係信喎😅

GaoGao 2025-05-23 19:05:18

有咩好解釋，唔知咪唔知
人諗咩你都唔知啦，好多人你唔知佢諗咩你都信佢做嘅野架啦

又係咁樣 2025-05-23 19:24:26

AI寫啲色情文學已經令我冇咗好多精液，輕咗10公斤，就死

Enterprise 2025-05-24 05:27:01

點先叫岩先？