本质上是在评估LLM在生成政策说服性文本的能力
用工程实验逻辑类比
101分量表
基于LLM机理的批判性审视
技术还原:
Agent/System 架构:
[用户] → (阅读) → [LLM生成的文本] → (反馈) → [政策支持度测量]