2026/5/30 · AI 上線專家

Claude Opus 4.8 強調「誠實度」：當 AI 開始主動抓自己寫的程式碼漏洞

AI 終於學會說「我不確定」

Anthropic 在 5 月 28 日發布了 Claude Opus 4.8，這次更新最引人注目的不是跑分進步多少，而是一個聽起來很人性的能力：誠實。

早期測試者回報，Opus 4.8 比前一版更願意主動標記「我對這段程式碼不太確定」，而不是裝作很有把握。更關鍵的數據是：它讓有問題的程式碼「悄悄過關」的機率，比 Opus 4.7 降低了約四倍。

對於手上有一個外包工程師留下的系統、或者自己用 Cursor / ChatGPT 拼湊出來的專案，正在猶豫要不要上線的您來說，這個消息代表什麼？

過去幾週，我們在部落格上談過 Cursor 的高風險漏洞、GPT-5.5 幻覺率降低 52.5%、以及 Anthropic 開發者大會上的警訊：AI 寫程式的速度很快，但「寫完之後工程師不再讀一遍」的現象正在蔓延。

Opus 4.8 的設計方向，剛好針對這個痛點：它不會假裝自己全知全能，而是會在輸出程式碼時，主動標記「這裡我沒有足夠證據支撐」、「這段邏輯可能有風險」。

這聽起來像是 AI 變保守了？不是。這其實是把「code review 的第一道關卡」內建到生成過程裡。

如果您現在手上有一個還沒上線的系統，程式碼是用 AI 工具產出的，這個功能可以幫您做兩件事：

當然，這不代表您可以完全信任 AI 的判斷。但至少，它開始學會「不懂就說不懂」，而不是硬掰一個看起來很專業的答案。

Opus 4.8 已經可以透過 Anthropic API、Amazon Bedrock、Google Vertex AI 使用，價格跟前一版相同。如果您正在考慮送程式碼去做健診、或者猶豫要不要讓外包留下的系統上線，可以建議您的技術顧問試試看這個版本。

實務上，您可以這樣用：

不過，誠實度提升也代表 AI 會更常說「我不知道」。如果您習慣 AI 什麼都能生成、什麼都很有把握的感覺，可能會覺得 Opus 4.8 變「龜毛」了。但對於想把系統安穩送到正式環境的您來說，龜毛一點，比事後踩雷好。

如果您手上的專案正在猶豫要不要上線，不確定程式碼品質到哪裡、也不知道該找誰問，可以考慮免費健診。我們會幫您確認哪些地方需要補強、哪些地方可以安心上線，讓您的系統不只做出來，還能穩定運作。

──

AI 上線專家 ｜陪您把想上線的系統，安穩送到正式環境。免費健診 →