
在 2025 年 5 月 22 日的開發者大會上,Anthropic 發佈了最新一代混合推理大模型系列 Claude 4,其中包括高端版本 Claude Opus 4 與普及型 Claude Sonnet 4。
作為Anthropic聯合創始人兼首席執行官,Dario Amodei的職業生涯堪稱AI發展史的縮影。這位普林斯頓大學物理學博士早年先後在谷歌大腦、斯坦福大學醫學院及百度從事前沿研究,後於OpenAI擔任研究副總裁期間主導了GPT-2與GPT-3的架構設計。2019年創立Anthropic後,他帶領團隊將技術重心轉向AI安全與可解釋性研究,其提出的"憲法AI"框架已成為行業標準。
在其 2025 年 4 月發表的文章《The Urgency of Interpretability》中,Amodei 提出,當下 AI 技術高速迭代,只有同步加速對模型內部機理的「核磁共振」式解讀,才能在強大模型出現前及時掌握其風險與能力。他指出,近期在機械可解釋性領域取得的神經元特徵與「電路」識別突破,已讓我們有機會揭開 AI 系統的黑箱面紗,但必須立即行動,否則模型可能在尚未可控時就獲得壓倒性力量。Amodei 呼籲研究者、企業與政策制定者共同加速可解釋性研究、建立透明測試框架,以確保我們能夠主動「駕駛」這輛不可阻擋的技術巨輪,朝著對社會有益的方向前進。