Background

Interleaved Thinking已成为行业标准

Extended Thinking; Interleaved Thinking; Thinking in Tool-Use

让模型在工具调用的过程中思考；而非一次性完成所有思考和推理；

"Think as a Tool"的实现方式：Anthropic的"think"工具实现了模型主动决定何时进行思考的能力，而非强制每轮都思考。其核心在于：

通过专用工具接口让模型在需要时调用"思考"功能
提供了明确的使用指南和示例，帮助模型理解何时需要思考
通过τ-Bench等基准测试证明其有效性（如在航空领域提升54%）

与ReAct模式的区别：

ReAct同样是"Reasoning-Action"的交替模式，但思考深度有限
"Think as a Tool"允许模型在需要时主动进行深度思考
ReAct中思考内容通常只保留一轮，而"think as a tool"可保留多轮思考过程

研究点

自主决策何时进行思考？思考和其他工具的协同调用？防止over-thinking
思考深度和广度；
思考过程的压缩 → memory
如何评估思考的质量？
MAS中的思考一致性？
…