儿童认知康复能力评估的游戏设计指南:从 ICF-CY 到数字疗法
当医学量表遇见游戏 #
医学视角:儿童认知康复评估依赖标准化量表(如 Conners、CPT),但量表形式枯燥,儿童配合度低,评估结果易受动机不足干扰。
工程视角:游戏天然具有吸引注意力的特性,但如果游戏机制没有映射到医学评估指标,收集到的数据就只是”玩家在玩游戏”,而非”患儿的认知能力”。
将医学量表转化为微信小游戏,属于**数字疗法(Digital Therapeutics, DTx)或严肃游戏(Serious Games)**的范畴。这不是”把测试题做成游戏画面”的简单包装——它要求游戏机制的每一层设计都能追溯到认知心理学的实验范式,实验范式又能映射到 WHO 发布的临床功能分类编码。
本文整合三个领域的权威理论,建立一套从临床标准到游戏代码的完整设计指南。
第一层:ICF-CY — 临床评估的金标准 #
来源:World Health Organization. International Classification of Functioning, Disability and Health - Children and Youth Version (ICF-CY). Geneva: WHO Press, 2007. WHO 官方页面
什么是 ICF-CY #
ICF-CY 是世界卫生组织(WHO)发布的《国际功能、残疾和健康分类》的儿童和青少年版本,是康复评估领域的金标准。它提供了一套统一的编码体系,让全球的医生、治疗师、研究者用同一种语言描述儿童的功能状态。
ICF-CY 将儿童的能力拆解为四个维度:
| 维度 | 含义 | 编码前缀 | 评估对象 |
|---|---|---|---|
| 身体功能(Body Functions) | 生理系统的功能 | b | 注意力、记忆、感知等 |
| 身体结构(Body Structures) | 解剖结构 | s | 脑结构、感官器官 |
| 活动与参与(Activities & Participation) | 执行任务和社会参与 | d | 学习、游戏、社交 |
| 环境因素(Environmental Factors) | 环境的影响 | e | 家庭、教育、辅助技术 |
游戏设计最关心的 b1 编码 #
ICF-CY 的”身体功能”中,第 1 章(b1 精神功能) 是认知康复游戏最核心的映射目标:
| ICF-CY 编码 | 功能名称 | 定义 | 评估关注点 |
|---|---|---|---|
| b140 | 注意力功能 | 保持注意力、转移注意力、分配注意力 | 持续时间、抗干扰能力 |
| b144 | 记忆功能 | 短期记忆、工作记忆、长期记忆 | 信息保持时长、容量 |
| b156 | 视知觉功能 | 识别形状、颜色、位置、运动方向 | 视觉辨别、空间定位 |
| b164 | 高级认知功能 | 判断、决策、推理、执行控制 | 抑制控制、认知灵活性 |
| b167 | 语言心理功能 | 语言理解、表达、复述 | 词汇、句法、语用 |
| b176 | 心理运动功能 | 反应速度、手眼协调 | 反应时、运动精度 |
来源:ICF-CY 编码体系详见 WHO 官方发布的 ICF-CY 编码手册,中文版可参考中国残疾人康复协会编译的《ICF-CY 应用指南》(华夏出版社, 2012)。
设计原则:关卡分类直接对应 ICF-CY 编码 #
游戏中的每个评估关卡必须能追溯到至少一个 ICF-CY 编码。这不是可选的——如果一个关卡测量的能力无法映射到 ICF-CY,它收集的数据在临床上就没有意义,医生无法据此做诊断或制定康复方案。
1 | |
第二层:认知心理学 — 范式与参数 #
来源:Sternberg, R. J. Cognitive Psychology (7th ed.). Cengage Learning, 2016. 以及 Baddeley, A. D., & Hitch, G. (1974). Working Memory. The Psychology of Learning and Motivation, 8, 47-89.
ICF-CY 告诉我们”测什么”,认知心理学告诉我们”怎么测”。每个 ICF-CY 编码对应一个或多个经过数十年实验验证的心理学范式(Paradigm)——这些范式有标准化的刺激呈现参数、试次设计和数据指标。
四个核心范式 #
1. CPT 范式(Continuous Performance Test)— 对应 b140 注意力 #
来源:Conners, C. K. et al. (2003). The revised Conners’ Continuous Performance Test (CPT). Journal of Attention Disorders, 7(4), 235-245. 以及 Rosvold, H. E. et al. (1956). A continuous performance test of brain damage. Journal of Consulting Psychology, 20(5), 343-350.
CPT 是评估持续性注意力最经典的范式。被试需要在屏幕上持续观看一系列刺激,只在特定目标出现时按键。
| 参数 | 经典值 | 来源 |
|---|---|---|
| 刺激呈现时间 | 200-800ms | Conners CPT-3 手册(2014) |
| 刺激间隔(ISI) | 1000-2000ms | Conners CPT-3 手册 |
| 总试次数 | 100-360 次 | 取决于版本 |
| 目标试次比例 | 50% 或 90% | 高目标率测警觉性,低目标率测抑制 |
| 会话时长 | 14 分钟(标准版) | Conners CPT-3 |
关键指标:
| 指标 | 含义 | 临床意义 |
|---|---|---|
| 反应时(RT) | 从刺激出现到按键的时间 | 过慢可能提示信息处理速度迟缓 |
| 反应时变异性(RT Variability / RT-SE) | 反应时的标准差 | ADHD 诊断最敏感指标,变异大提示注意力波动 |
| 漏报率(Omission Errors) | 目标出现但未反应 | 注意力不集中或信息处理迟缓 |
| 误报率(Commission Errors) | 非目标出现但反应了 | 抑制控制不足(冲动性) |
EndeavorRx 验证:Akili Interactive 在 EndeavorRx 的临床试验中使用了 RT Variability 作为主要终点指标。参见:Kollins, S. H. et al. (2020). A novel digital intervention for attention-deficit/hyperactivity disorder: A randomized controlled trial of EndeavorRx. npj Digital Medicine, 3, 57. 原文链接
2. N-back 范式 — 对应 b144 记忆功能 #
来源:Kirchner, W. K. (1958). The delay-decision task: A simple method for studying short-term memory in the monkey. Journal of the Experimental Analysis of Behavior, 1(2), 169-171. 以及 Baddeley, A. D. (1992). Working memory. Science, 255(5044), 556-559.
N-back 评估工作记忆的在线保持和更新能力。被试观看一系列刺激,判断当前刺激是否与 N 步之前的刺激相同。
| 参数 | 经典值 | 说明 |
|---|---|---|
| N 值 | 1-3(儿童从 1 开始) | N=2 对应 6-8 岁平均水平 |
| 刺激呈现时间 | 2000-3000ms | 含反应时间窗口 |
| 刺激间隔 | 500-1000ms | 间隔期是信息保持阶段 |
| 总试次数 | 20-30+ 次 | 需足够的目标试次 |
| 目标比例 | 30% | 避免被试只按”相同” |
关键指标:正确率、反应时、d’(信号检测灵敏度,综合正确率和误报率)。
3. Stroop 色词干扰范式 — 对应 b164 高级认知功能 #
来源:Stroop, J. R. (1935). Studies of interference in serial verbal reactions. Journal of Experimental Psychology, 18(6), 643-662. 以及 MacLeod, C. M. (1991). Half a century of research on the Stroop effect: An integrative review. Psychological Bulletin, 109(2), 163-203.
Stroop 范式评估执行控制中的抑制功能。经典设计:文字”红”用绿色墨水书写,被试需说出墨水颜色而非文字内容。
| 参数 | 经典值 | 说明 |
|---|---|---|
| 一致试次 | 文字与墨水颜色一致 | 基线条件 |
| 不一致试次 | 文字与墨水颜色冲突 | 干扰条件 |
| 试次比例 | 一致:不一致 = 1:1 | 平衡设计 |
| 反应窗口 | 2000ms | 超时记为遗漏 |
| 适应儿童的设计 | 用图形/动物替代文字 | 适合学龄前儿童 |
关键指标:干扰效应量(不一致试次 RT - 一致试次 RT),越大说明抑制控制越弱。
4. 视觉搜索范式 — 对应 b156 视知觉功能 #
来源:Treisman, A. M., & Gelade, G. (1980). A feature-integration theory of attention. Cognitive Psychology, 12(1), 97-136. 以及 Wolfe, J. M. (1994). Guided Search 2.0: A revised model of visual search. Psychonomic Bulletin & Review, 1(2), 202-238.
评估视觉注意和目标搜索能力。被试在多个干扰项中寻找特定目标。
| 参数 | 经典值 | 说明 |
|---|---|---|
| 搜索集大小 | 4, 8, 16, 24 项 | 控制难度梯度 |
| 特征搜索 | 颜色单一维度 | 前注意阶段(快速) |
| 联合搜索 | 颜色+形状组合 | 注意阶段(串行处理) |
| 目标存在比例 | 50% | 平衡击中率和误报率 |
关键指标:搜索斜率(反应时随搜索集大小的变化率),特征搜索斜率接近 0,联合搜索斜率显著大于 0。
第三层:数字疗法 — 游戏化的医学 #
来源:FDA De Novo classification request for EndeavorRx (AKL-T01), DEN190001. 以及 Akili Interactive 官方临床数据页面 https://www.akili.com/clinical-evidence
EndeavorRx:首个 FDA 批准的游戏疗法 #
2020 年 6 月,Akili Interactive 公司的 EndeavorRx(原名 Project: EVO)获得美国 FDA 批准,成为全球第一个以处方药形式获批的电子游戏,用于治疗 8-12 岁儿童的 ADHD。这是数字疗法领域的里程碑事件。
来源:FDA. (2020). De Novo Classification Request for EndeavorRx (AKL-T01). DEN190001. FDA 官方公告
EndeavorRx 的核心设计是多任务干扰范式(Multitasking Interference):
1 | |
来源:Davis, N. O. et al. (2018). A randomized study of Akili Interactive’s Project: EVO cognitive intervention for executive function in ADHD. Poster presented at the American Professional Society of ADHD and Related Disorders (APSARD) Annual Meeting.
MDA 框架在严肃游戏中的特殊应用 #
来源:Hunicke, R., LeBlanc, M., & Zubek, R. (2004). MDA: A Formal Approach to Game Design and Game Research. Proceedings of the AAAI Workshop on Challenges in Game AI. 论文链接
MDA 框架在娱乐游戏中用于”从机制推到体验”,但在数字疗法中方向反过来——从期望的临床效果倒推机制设计:
| MDA 层 | 娱乐游戏 | 数字疗法评估游戏 |
|---|---|---|
| Aesthetics(美学) | “想创造什么体验” | “想测量什么认知功能” |
| Dynamics(动态) | “玩家会怎么玩” | “范式如何诱发目标行为” |
| Mechanics(机制) | “代码怎么写” | “刺激参数如何设置” |
严肃游戏的 MDA 方向是 A→D→M:先确定要测量的临床功能(Aesthetics 层映射 ICF-CY),再选择心理学范式(Dynamics 层映射实验设计),最后实现游戏机制(Mechanics 层映射代码参数)。
FDA/NMPA 审批要点 #
来源:NMPA. 《医疗器械软件注册技术审查指导原则》(2022 年修订版). 以及 IMDRF/SaMD WG/N12Final:2021 “Software as a Medical Device: Clinical Evaluation”
如果游戏定位为医疗器械(用于诊断或辅助治疗),需注意:
| 维度 | FDA 要求 | NMPA 要求 |
|---|---|---|
| 临床证据 | 至少一项 RCT(随机对照试验) | 同等或更高,需中国人群数据 |
| 软件验证 | IEC 62304 软件生命周期 | GB/T 25000.51 软件质量要求 |
| 信息安全 | HIPAA 合规 | 网络安全审查 |
| 适应症 | 需明确限定(如”8-12 岁 ADHD”) | 同样需严格限定 |
如果不作为医疗器械,仅作为健康评估工具,不纳入审批范围,但仍需遵循个人信息保护法(PIPL)和《信息安全技术 个人信息安全规范》(GB/T 35273-2020)。
三领域交叉:设计映射表 #
以下表格是本指南的核心——将三个领域整合为一张可操作的映射表,游戏开发者按此表设计关卡,医生按此表解读数据。
| ICF-CY 编码 | 功能名称 | 心理学范式 | 经典参数 | 游戏化机制 | 采集指标 | 临床意义 |
|---|---|---|---|---|---|---|
| b140 | 持续注意力 | CPT | 刺激 800ms,ISI 1200ms,100+ 试次 | 打地鼠(地鼠出现 800ms,间隔 1200ms) | RT、RT-SE、漏报率、误报率 | RT 变异性是 ADHD 最敏感指标 |
| b144 | 工作记忆 | N-back (N=2) | 刺激 3000ms,ISI 500ms,30+ 试次 | 记忆翻牌(记住 2 步前的牌) | 正确率、d’、RT | 正确率低提示工作记忆缺陷 |
| b164 | 执行控制 | Stroop 色词干扰 | 一致/不一致各 50%,2000ms 反应窗口 | 色彩匹配(说出墨水颜色而非文字) | 干扰效应量、错误率 | 干扰效应大提示抑制控制弱 |
| b156 | 视知觉 | 特征/联合搜索 | 4-24 项搜索集,目标 50% | 找不同(在干扰项中找目标) | 搜索斜率、击中率 | 联合搜索斜率异常提示视觉注意缺陷 |
| b176 | 心理运动速度 | 简单反应时 | 刺激随机出现,无 ISI | 按按钮(看到信号就按) | 平均 RT、RT 分布 | RT 过慢提示信息处理速度迟缓 |
| b140+b176 | 注意力+运动 | 多任务干扰 | 主任务+干扰任务并行 | EndeavorRx 式飞船导航 | RT-SE(多任务条件) | 多任务条件下的 RT-SE 更敏感 |
映射关系的设计原则 #
- 一关一编码:每个关卡映射一个主要 ICF-CY 编码,避免”一个关卡测多个能力”导致数据无法归因
- 范式不变质:游戏化只改变视觉呈现,不改变范式的核心参数(刺激时间、间隔、试次数)
- 指标可追溯:每个采集指标必须能追溯到心理学文献中的经典定义,而非自创指标
游戏关卡设计实例 #
关卡 1:打地鼠(CPT 范式 → b140 注意力) #
1 | |
关卡 2:记忆翻牌(N-back → b144 工作记忆) #
1 | |
关卡 3:色彩小精灵(Stroop → b164 执行控制) #
1 | |
关卡 4:找小动物(视觉搜索 → b156 视知觉) #
1 | |
数据采集与常模建立 #
来源:《中国儿童康复医学指南》编委会. 中国康复医学会儿童康复专业委员会. 2023. 以及 WHO Multicentre Growth Reference Study (2006) 的常模建立方法论。
数字生物标记物 #
游戏中采集的原始数据需要转化为数字生物标记物(Digital Biomarkers)——具有临床意义的量化指标:
| 原始数据 | 转化指标 | 临床意义 |
|---|---|---|
| 每次按键的时间戳 | 反应时(RT) | 信息处理速度 |
| RT 的标准差 | RT 变异性(RT-SE) | 注意力稳定性,ADHD 核心指标 |
| 目标试次正确反应率 | 击中率 | 目标检测能力 |
| 非目标试次错误反应率 | 误报率 | 抑制控制能力 |
| 一致-不一致 RT 差值 | 干扰效应量 | 执行控制效率 |
常模建立:理论值到临床阈值 #
理论文献告诉你”RT 变异性代表注意力”,但不会告诉你”具体多少毫秒算异常”。这需要建立常模(Norm)——大量正常儿童的数据基线。
常模建立三步法:
1 | |
来源:中国常模数据可参考:王玉凤等. (2007). Conners 持续性操作测验在中国儿童中的应用. 中国心理卫生杂志, 21(3), 156-159.
数据质量控制 #
评估游戏的信效度依赖数据质量,以下是需要控制的无效变量:
| 风险 | 控制措施 |
|---|---|
| 设备延迟 | 校准触屏延迟,在数据中减去基线延迟(通常 50-100ms) |
| 非注意力的反应错误 | 排除前 5 次试次(练习效应),不计入统计 |
| 疲劳效应 | 每个关卡不超过 5 分钟,关卡间休息 30 秒 |
| 策略性猜测 | 记录反应模式(如总是按”是”的倾向),排除无效数据 |
| 儿童故意乱按 | 在试次序列中植入”校验试次”(正确率 < 50% 的数据标记为无效) |
医学专家校验流程 #
来源:用户实践建议(原始提示词中的”研发落地建议”部分)。
游戏设计文档(GDD)完成后,必须请儿童发育行为科医生或康复治疗师进行临床审查,确保没有引入可能干扰评估的无效变量。
GDD 审查清单 #
1 | |
工程化落地路径 #
三步法 #
1 | |
技术实现建议 #
| 层 | 技术选型 | 说明 |
|---|---|---|
| 前端 | 微信小游戏 / Web Canvas | 触屏交互,跨平台 |
| 计时精度 | performance.now() | 毫秒级精度,排除 Date.now() 的漂移 |
| 数据存储 | 本地缓存 + 云端同步 | 支持离线测试,网络恢复后同步 |
| 数据安全 | PIPL 合规 | 儿童数据属于敏感个人信息,需监护人同意 |
| 自适应算法 | 简单贝叶斯自适应 | 根据实时表现动态调整难度,维持心流 |
微信小游戏计时的特殊问题 #
微信小游戏的 wx.getPerformance() 提供毫秒级时间戳,但触屏事件到事件处理的延迟约 50-100ms,需要在常模建立时校准:
1 | |
触屏延迟基线值需在设备校准阶段测定,不同手机型号可能有 10-30ms 差异。
国内学术与行业实践资源 #
知网检索建议 #
来源:中国知网 (CNKI) 检索式
1 | |
推荐关注的国内机构:
| 机构 | 研究方向 |
|---|---|
| 华东师范大学特殊教育学系 | 儿童认知评估与训练 |
| 北京师范大学脑与认知科学研究院 | 认知神经科学与教育应用 |
| 北京大学第六医院儿童心理卫生中心 | ADHD 临床评估与数字干预 |
| 中国康复研究中心 | 儿童康复标准与指南 |
行业白皮书与指南 #
| 文献 | 来源 | 用途 |
|---|---|---|
| 《中国儿童康复医学指南》 | 中国康复医学会儿童康复专业委员会 (2023) | 年龄段正常发育基线数据 |
| 《医疗器械软件注册技术审查指导原则》 | NMPA (2022 修订版) | 医疗器械审批流程 |
| 《信息安全技术 个人信息安全规范》 | GB/T 35273-2020 | 儿童数据合规要求 |
总结 #
儿童认知康复评估游戏的设计是一个三领域交叉的工程:
1 | |
核心原则:
- 一关一编码——每个关卡只映射一个 ICF-CY 编码,确保数据可归因
- 范式不变质——游戏化只改变视觉呈现,不改变范式的核心参数
- 指标可追溯——每个采集指标必须能追溯到心理学文献中的经典定义
- 常模本地化——参考中国儿童常模,而非直接套用国外标准
- 医工协同——工程师设计游戏,医生校验效度,缺一不可
参考资料 #
临床评估标准 #
- [1] World Health Organization. ICF-CY: International Classification of Functioning, Disability and Health - Children and Youth Version. WHO Press, 2007.
- [2] 中国残疾人康复协会. 《ICF-CY 应用指南》. 华夏出版社, 2012.
- [3] 中国康复医学会儿童康复专业委员会. 《中国儿童康复医学指南》. 2023.
认知心理学范式 #
- [4] Sternberg, R. J. Cognitive Psychology (7th ed.). Cengage Learning, 2016.
- [5] Baddeley, A. D., & Hitch, G. “Working Memory.” The Psychology of Learning and Motivation, 8, 47-89, 1974.
- [6] Conners, C. K. et al. “The revised Conners’ Continuous Performance Test (CPT).” Journal of Attention Disorders, 7(4), 235-245, 2003.
- [7] Rosvold, H. E. et al. “A continuous performance test of brain damage.” Journal of Consulting Psychology, 20(5), 343-350, 1956.
- [8] Kirchner, W. K. “The delay-decision task.” Journal of the Experimental Analysis of Behavior, 1(2), 169-171, 1958.
- [9] Stroop, J. R. “Studies of interference in serial verbal reactions.” Journal of Experimental Psychology, 18(6), 643-662, 1935.
- [10] Treisman, A. M., & Gelade, G. “A feature-integration theory of attention.” Cognitive Psychology, 12(1), 97-136, 1980.
数字疗法 #
- [11] FDA. “De Novo Classification Request for EndeavorRx (AKL-T01).” DEN190001, 2020.
- [12] Kollins, S. H. et al. “A novel digital intervention for ADHD: A randomized controlled trial of EndeavorRx.” npj Digital Medicine, 3, 57, 2020. https://doi.org/10.1038/s41746-020-0231-8
- [13] NMPA. 《医疗器械软件注册技术审查指导原则》. 2022 修订版.
- [14] Hunicke, R., LeBlanc, M., & Zubek, R. “MDA: A Formal Approach to Game Design and Game Research.” AAAI Workshop on Challenges in Game AI, 2004.
游戏设计理论 #
- [15] Schell, J. The Art of Game Design: A Book of Lenses (3rd ed.). CRC Press, 2019.
- [16] Csikszentmihalyi, M. Flow: The Psychology of Optimal Experience. Harper & Row, 1990.
中国常模与合规 #
- [17] 王玉凤等. “Conners 持续性操作测验在中国儿童中的应用.” 中国心理卫生杂志, 21(3), 156-159, 2007.
- [18] GB/T 35273-2020. 《信息安全技术 个人信息安全规范》.
- [19] IMDRF/SaMD WG/N12Final:2021. “Software as a Medical Device: Clinical Evaluation.”