← 所有文章
claudeClaude Code

讓 Claude 多想一會兒再回答:Extended Thinking 使用時機跟設定

2026年6月6日

同一個難題,我讓 Claude 用預設設定答一次、開 Extended Thinking 再答一次。前者給了一個能跑但有邊界漏洞的解法,後者在動手前先列了三個可能方案、自己否決了兩個。差別不是聪明程度,是它願意花多少力氣「想」。

這篇你會學到

先搞懂:兩層控制

現在的控制長這樣:
Effort level 是主控制。 新模型(Opus 4.6 之後、Sonnet 4.6)用「自適應推理」——模型自己決定每一步要不要想、想多深。你用 /effort 調整整體力度(low / medium / high / xhigh / max)。
Extended Thinking 開關是第二層。 它控制「思考這件事開不開啟、怎麼顯示」。
簡單記:effort 是油門深度,thinking 開關是引擎要不要預熱。

設定方式

當前 session 切換:macOS 按 Option+T,Windows/Linux 按 Alt+T
全域預設:跑 /config 切換 thinking mode,會存成設定檔裡的 alwaysThinkingEnabled。
看它在想什麼:思考過程預設是收合的,按 Ctrl+O 展開成灰色斜體文字。debug 它為什麼做出奇怪決定時特別好用。

重要:老技巧失效了

⚠️ 🔍 官方文件明証:「think」、「think hard」、「think more」這些詞現在只是普通文字,不會觸發更深的推理。唯一被辨識的關鍵字是 ultrathink——在提示裡任何位置加上它,那一輪就會用更深的推理,不改你的 session 設定。
你可以直接複製這段試:
ultrathink 這個記憶體洩漏可能有哪些原因?先列出所有假設再逐一排除,不要急著給答案。

什麼時候開

✅ 架構決策:選資料庫、拆模組、設計 API 介面這種「選錯了很貴」的決定
✅ 難纏的 debug:多個系統交互、時序相關、重現條件不明的問題
✅ 審查類任務:code review、安全檢視——思考過程會把邊界條件一個個攞出來
❌ 改個變數名、寫個小工具、問文件問題——思考 token 一樣計費,簡單任務開著只是變慢變貴

要注意的成本細節

⚠️ 🔍 官方文件:思考內容就算收合著沒看,token 照收費。長期開著 alwaysThinkingEnabled 又都在做簡單任務,帳單會有感。
💡 要強制完全關掉思考(不管 effort 設多高),設環境變數 MAX_THINKING_TOKENS=0。適合跑批次任務省成本。
💡 想要比 ultrathink 更持久的深度,直接調 /effort。兩者差別:ultrathink 是單次、effort 是整個 session。

收尾

預設設定對日常工作已經夠用——自適應推理會自己判斷。你需要介入的只有兩種時刻:任務明顯很難(上 ultrathink 或拉高 effort),或你在趕時間趕成本(關 thinking、降 effort)。
官方文件:Model configuration — Extended thinking

截至 2026年6月6日 驗證有效

← 所有文章OctoDock 首頁 →
讓 Claude 多想一會兒再回答:Extended Thinking 使用時機跟設定 | OctoDock