线下问卷实验方案 | Notion

维度	说明
实验类型	单因素被试间设计（Between-subjects design）
自变量	协作模式（6 水平：G1–G6）
因变量	• 任务表现：感知效率、满意度、NASA-TLX 负荷、感知有用性
• 能力影响：代理感、技能提升感、AI 依赖倾向、创作所有权
样本量	每组 ≥ 20 人（总 N ≥ 120），基于中等效应量（f = 0.25, α = 0.05, power = 0.8）
实验时长	约 25–30 分钟/人（含任务 + 问卷 + 简短访谈）

一、实验分组设定方案 (Scenario-based Design)

在线上问卷中，我们通常采用情境实验法（Scenario-based Experiment）或任务后回溯法。受试者被随机分配到以下六个组别之一（对应你笔记中的协作阶梯）：

G1: 独立创作组 (Human-only)：作为基准，衡量人类独立完成高认知任务（如写一篇科研摘要）的心理基准。
G2: 专家点评组 (H gen + L judge)：模拟人类主导，LLM 作为“冷面评审”。
G3: 协同润色组 (H gen + L refine)：模拟“人类出灵魂，AI 出皮囊”。
G4: 深度重组组 (L gen + H refine)：模拟“AI 出毛坯，人类精装修”。
G5: 最终验收组 (L gen + H judge)：模拟人类作为“质量关口”，仅进行是非判断。
G6: 全自动组 (LLM-only)：受试者仅作为观察者评估 LLM 的独立产出。

二、实验数据统计表

1. 维度一：任务表现

说明：通过受试者的主观视角，验证笔记中提到的“成本下降、效率上升”是否与用户真实的“获得感”一致。

协作模式	感知效率 (Perceived Efficiency)	产出满意度 (Satisfaction)	认知负荷 (NASA-TLX)	感知有用性 (Perceived Usefulness)
G1: Human-only
G2: H gen + L judge
G3: H gen + L refine
G4: L gen + H refine
G5: L gen + H judge
G6: LLM-only

2. 维度二：对人类能力的影响

说明：该表重点探测笔记中关于“责任归属”和“能力退化”的心理映射。

协作模式	代理感 (Sense of Agency)	技能提升感知 (Skill Growth)	算法依赖倾向 (AI Dependency)	创作所有权感 (Ownership)
G1: Human-only
G2: H gen + L judge
G3: H gen + L refine
G4: L gen + H refine
G5: L gen + H judge
G6: LLM-only