2026/5/30 · AI 上線專家

Claude Opus 4.8 強調「誠實度」:當 AI 開始主動抓自己寫的程式碼漏洞

Claude Opus 4.8 強調「誠實度」:當 AI 開始主動抓自己寫的程式碼漏洞

AI 終於學會說「我不確定」

Anthropic 在 5 月 28 日發布了 Claude Opus 4.8,這次更新最引人注目的不是跑分進步多少,而是一個聽起來很人性的能力:誠實

早期測試者回報,Opus 4.8 比前一版更願意主動標記「我對這段程式碼不太確定」,而不是裝作很有把握。更關鍵的數據是:它讓有問題的程式碼「悄悄過關」的機率,比 Opus 4.7 降低了約四倍。

對於手上有一個外包工程師留下的系統、或者自己用 Cursor / ChatGPT 拼湊出來的專案,正在猶豫要不要上線的您來說,這個消息代表什麼?

為什麼「不確定就說出來」這麼重要?

過去幾週,我們在部落格上談過 Cursor 的高風險漏洞GPT-5.5 幻覺率降低 52.5%、以及 Anthropic 開發者大會上的警訊:AI 寫程式的速度很快,但「寫完之後工程師不再讀一遍」的現象正在蔓延。

Opus 4.8 的設計方向,剛好針對這個痛點:它不會假裝自己全知全能,而是會在輸出程式碼時,主動標記「這裡我沒有足夠證據支撐」、「這段邏輯可能有風險」。

這聽起來像是 AI 變保守了?不是。這其實是把「code review 的第一道關卡」內建到生成過程裡。

如果您現在手上有一個還沒上線的系統,程式碼是用 AI 工具產出的,這個功能可以幫您做兩件事:

  1. 減少盲點:您可能不是全職工程師,看不出哪裡有資安漏洞或邏輯錯誤。如果 AI 主動標記「這裡我不太確定」,您至少知道該請懂的人多看一眼。
  2. 降低上線風險:比起讓有瑕疵的程式碼靜悄悄地進到正式環境,提早發現、提早處理,成本低很多。

當然,這不代表您可以完全信任 AI 的判斷。但至少,它開始學會「不懂就說不懂」,而不是硬掰一個看起來很專業的答案。

這對您的專案實際上代表什麼?

Opus 4.8 已經可以透過 Anthropic API、Amazon Bedrock、Google Vertex AI 使用,價格跟前一版相同。如果您正在考慮送程式碼去做健診、或者猶豫要不要讓外包留下的系統上線,可以建議您的技術顧問試試看這個版本。

實務上,您可以這樣用:

  • 重新跑一次生成:把現有系統的需求文件或功能描述,重新丟給 Opus 4.8,看它會不會標記「這段邏輯有風險」。如果會,那您手上的版本可能真的有問題。
  • 問它「哪裡不確定」:直接問「這段程式碼有哪些地方你不太有把握?」,Opus 4.8 比之前更願意老實回答。
  • 搭配人工檢查:AI 標記的地方,請工程師優先檢查;沒標記的地方,也不能完全放心,但至少可以調整檢查的優先順序。

不過,誠實度提升也代表 AI 會更常說「我不知道」。如果您習慣 AI 什麼都能生成、什麼都很有把握的感覺,可能會覺得 Opus 4.8 變「龜毛」了。但對於想把系統安穩送到正式環境的您來說,龜毛一點,比事後踩雷好。

如果您手上的專案正在猶豫要不要上線,不確定程式碼品質到哪裡、也不知道該找誰問,可以考慮免費健診。我們會幫您確認哪些地方需要補強、哪些地方可以安心上線,讓您的系統不只做出來,還能穩定運作。

──

AI 上線專家 | 陪您把想上線的系統,安穩送到正式環境。免費健診 →