Background
Interleaved Thinking已成为行业标准
Extended Thinking; Interleaved Thinking; Thinking in Tool-Use
让模型在工具调用的过程中思考;而非一次性完成所有思考和推理;

"Think as a Tool"的实现方式:Anthropic的"think"工具实现了模型主动决定何时进行思考的能力,而非强制每轮都思考。其核心在于:
- 通过专用工具接口让模型在需要时调用"思考"功能
- 提供了明确的使用指南和示例,帮助模型理解何时需要思考
- 通过τ-Bench等基准测试证明其有效性(如在航空领域提升54%)
与ReAct模式的区别:
- ReAct同样是"Reasoning-Action"的交替模式,但思考深度有限
- "Think as a Tool"允许模型在需要时主动进行深度思考
- ReAct中思考内容通常只保留一轮,而"think as a tool"可保留多轮思考过程
研究点
- 自主决策何时进行思考? 思考和其他工具的协同调用?防止over-thinking
- 思考深度和广度;
- 思考过程的压缩 → memory
- 如何评估思考的质量?
- MAS中的思考一致性?
- …