维度 说明
实验类型 单因素被试间设计(Between-subjects design)
自变量 协作模式(6 水平:G1–G6)
因变量 • 任务表现:感知效率、满意度、NASA-TLX 负荷、感知有用性
• 能力影响:代理感、技能提升感、AI 依赖倾向、创作所有权
样本量 每组 ≥ 20 人(总 N ≥ 120),基于中等效应量(f = 0.25, α = 0.05, power = 0.8)
实验时长 约 25–30 分钟/人(含任务 + 问卷 + 简短访谈)

一、 实验分组设定方案 (Scenario-based Design)

在线上问卷中,我们通常采用情境实验法(Scenario-based Experiment)或任务后回溯法。受试者被随机分配到以下六个组别之一(对应你笔记中的协作阶梯):

  1. G1: 独立创作组 (Human-only):作为基准,衡量人类独立完成高认知任务(如写一篇科研摘要)的心理基准。
  2. G2: 专家点评组 (H gen + L judge):模拟人类主导,LLM 作为“冷面评审”。
  3. G3: 协同润色组 (H gen + L refine):模拟“人类出灵魂,AI 出皮囊”。
  4. G4: 深度重组组 (L gen + H refine):模拟“AI 出毛坯,人类精装修”。
  5. G5: 最终验收组 (L gen + H judge):模拟人类作为“质量关口”,仅进行是非判断。
  6. G6: 全自动组 (LLM-only):受试者仅作为观察者评估 LLM 的独立产出。

二、 实验数据统计表

1. 维度一:任务表现

说明:通过受试者的主观视角,验证笔记中提到的“成本下降、效率上升”是否与用户真实的“获得感”一致。

协作模式 感知效率 (Perceived Efficiency) 产出满意度 (Satisfaction) 认知负荷 (NASA-TLX) 感知有用性 (Perceived Usefulness)
G1: Human-only
G2: H gen + L judge
G3: H gen + L refine
G4: L gen + H refine
G5: L gen + H judge
G6: LLM-only

2. 维度二:对人类能力的影响

说明:该表重点探测笔记中关于“责任归属”和“能力退化”的心理映射。

协作模式 代理感 (Sense of Agency) 技能提升感知 (Skill Growth) 算法依赖倾向 (AI Dependency) 创作所有权感 (Ownership)
G1: Human-only
G2: H gen + L judge
G3: H gen + L refine
G4: L gen + H refine
G5: L gen + H judge
G6: LLM-only