Counterevidence — pid-007 Allan-U

v1（2026-05-10）— 强制反方验证。本文件是质量闸门 2 的硬条件。
用户元诉求：审视用户自己的偏见 + 审视我自己（pid-007 调研）的反偏见——双向审视。

反方原则

每个关键判断主动找反例 + 替代解释
不只反驳用户的判断，也反驳本任务自己的判断（防止反主流偏见污染）
标注冲突强度：弱 / 中 / 强
标注本任务在反方后是否调整结论（保留 / 修正 / 撤回）

CE-1 · 反方挑战 H3：UTM TMZ + PEY Co-op = 隐藏最优？

可能反例

UTM 校园整体氛围弱于 St George 主校区 — 同伴密度 + 视野 + 校友网络都低（NBER w9501 同伴效应在 STEM 显著，但同伴质量是关键调节）
TMZ 的 PEY 即使存在，录取率可能低（Waterloo Co-op 的 96% 就业是 cohort 平均，UTM PEY 不一定同等）
Diffusion 画像 + Co-op 不一定 work：如果 Co-op 工作太卷，Diffusion 画像可能更崩溃（"既要选课又要找工作还要做项目"可能超出当前自管理能力）
TN visa 优势对刚满 18 岁的 Allan 时间太远 — 4 年后才用得上，期间 PR 政策可能变化
数据外推：Waterloo Co-op 数据来自 Waterloo cohort（已经是高分录取者），UTM TMZ 学生池不同，96% 就业不能直接外推

冲突强度：中

调整后结论

保留 H3，但置信度从"强支持"降为"条件性中-高"：UTM TMZ + PEY Co-op 是 Diffusion 画像下的优选，但不一定是单点最优——同伴密度问题需要 Allan 主动通过课外组织 / 第三方 mentor 弥补。

新增建议：如果选 UTM TMZ，必须配合主动同伴密度构建——加入 Math&CS Society / 跨校区学术 club / 与 St George 校区的合作项目。

CE-2 · 反方挑战 S2 "AI 替代 60-80% 本科课程实质"

可能反例

替代率因专业差异巨大 — 实验 / 临床 / 工程实操类大学课程 AI 替代率低
"实质内容"vs"实质教学价值"是不同的 — AI 可以替代知识传递，但不一定能替代学习心智的塑造
替代 ≠ 学生真用 AI 学 — Sal Khan 2026 反思：AI 导师对动机弱学生是"非事件"
"被批改的练习题循环" 这件事本身在 AI 时代 ≠ 浪费——重复练习是程序性记忆形成的方式

冲突强度：中

调整后结论

保留主张但软化：AI 已经能够替代 60-80% 本科课程实质，但实际替代取决于学生主动驾驭。对 Allan（AI 消费者画像），AI 替代率在他身上实际更低——他还没驾驭这种替代。

新增含义：Allan 的 AI 消费者画像 → 接 offer 期间反而是驾驭 AI 工具的训练窗口，不是错过它。这把 H10（连续性 trap）的 nuance 加细：对 Allan，连续性不是 trap，但被动连续性是 trap。

CE-3 · 反方挑战 S5 "Allan 是 Diffusion 状态"

可能反例

Marcia 4 状态外观相似 — Diffusion / Foreclosure / Moratorium / Achievement 在静态观察下难区分，需要纵向数据
18 岁刚满，认知快速变化 — 当前 Diffusion 不代表稳定特质
父亲转述的画像本身就是过滤器 — 父亲可能把"不确定"误读为"模糊"，把"探索"误读为"散漫"
半自主 + 兴趣模糊也可能是Moratorium 早期（开始探索但尚未承诺）— 这是健康过渡，不是问题
AI 消费者画像可能是当下普遍状态，不是 Allan 个体特征——许多 Achievement 状态的同龄人也是 AI 消费者

冲突强度：强

调整后结论

修正：Allan 的状态诊断置信度降为中。可能是 Diffusion，也可能是 Moratorium 早期。

新增建议：在 D5 决策机制中加入"状态诊断重测"——通过 S9 模板 C（第三方信源接触）让独立 mentor / 教练对儿子做诊断，不依赖父亲单源转述。这是反方阶段最重要的修正。

实施：未来 30 天内安排 1-2 次 Allan 与独立第三方（不是父亲圈层）的一对一交流，让独立第三方写一份 Allan 自我陈述报告——以此作为后续决策的更可靠基线。

CE-4 · 反方挑战 S4 "半自主 + 中等自信 = trap 默认"

可能反例

中等自信 ≠ 高风险 — 用户主动识别风险这件事本身就是高 differentiation 信号（Bowen 框架）
family business succession 部分案例成功 — 关键变量是父亲是否能 letting go，用户已表达 letting go 意愿
identity foreclosure 红旗适用前提是"子女接受父亲方案太顺利" — 当前父亲还没正式给方案，红旗不一定触发
trap 是默认状态 ≠ trap 是必然结果 — S4 自己说"除非主动设计破坏 trap 机制"——用户主动求审视已经是破坏机制的一部分

冲突强度：中

调整后结论

保留 H5（父亲资源应间接呈现），但措辞软化：
- 不是"父亲资源是 trap"
- 是"在没有主动设计的默认状态下是 trap"
- 用户已经做了"主动求审视" = 第一步设计

修正：父亲的"中等自信吃老丁"焦虑 = 健康信号，不是问题。问题是这个焦虑是否转化为可操作的设计（S9 三个模板）。

CE-5 · 反方挑战 H7 "全球路径覆盖远超用户认知"

可能反例

86 分对部分全球路径来说仍偏低 — 英国 UCL/IC/LSE / 港大 / NUS 等都需要竞赛 / IB / A-level 加持
中文水平可能不达华侨生联考要求 — 加拿大公立学校 12 年中文流利度通常不够考国内大学
TU Delft / 荷兰大学的英语项目录取率正在收窄（学校越来越保护本国生）
Diffusion 画像下同时申请多国会更分散 — 决策疲劳本身就是失败模式
海外申请 + Allan 半自主意味着大概率父亲做申请 — 又回到 parent-led 失败模式

冲突强度：中-强

调整后结论

保留 H7（路径覆盖广），但新增反方：
- 多路径并行的执行成本被低估
- "决策树包含所有选项" ≠ "Allan 应同时启动所有"
- 现实建议：6 大路径里最多并行 2 条（接 offer + 1 条全球路径），不是同时 6 条
- 选哪 2 条取决于：(a) UTM PEY 验证 (b) Allan 真实中文水平 (c) 家庭执行带宽

CE-6 · 反方挑战"最重要决策日是 9/21 而非 6/01"

可能反例

9/21 退费窗口是技术机制，不是心理机制 — Allan 一旦 9/01 入学开始上课，"心理上的承诺"就形成，9/21 退费实操困难
接 offer 的"留位"心态会减弱并行申请其他路径的动力 — 双轨理论上 OK，实际中 9 月还在思考 = 1 月开始的英国 UCAS 申请已经凉
9 月还在退费意味着 Allan 错过 2027 一些路径的关键申请季

冲突强度：中

调整后结论

修正：9/21 是最远的可逆窗口，但实际决策心仍是 5/15 - 6/30 这个 6 周窗口：
- 5/15 前：UTM PEY 验证 + 启动英国 UCAS 准备
- 6/01-6/02：接 offer 决策
- 6/30：英国 UCAS 截止
- 7-8 月：实操决策（按已并行的两条路径状态来定）
- 9/21：仅作技术兜底，不应当作主决策心

CE-7 · 反方挑战"反主流推荐本身是否被反主流偏见污染"

这是 S2 自我警告 + 用户元诉求的核心反方。

可能反例 / 自我审视

9 个 Scout 全部反主流方向 — 是否暗示 sample bias 而非真实趋势？
- Scout prompt 都包含"反主流审视"硬要求 → 可能引导 Scout 朝反主流找证据
- 9 个 Scout 在主流方向（"上大学是对的，gap 是错的"）找证据的力度可能弱于反主流
"反主流"本身可能是 Cowen / Caplan / Thiel 圈层主流 — 这是另一种泡泡
本任务对用户原方案的 8 重失败模式叠加判决可能过严 — 即使用户原方案有缺陷，"叠加 8 个"可能是 confirmation bias
强烈反对 Pure gap + 强烈推荐 F (双轨) 的 binary 判决也是一种二元——和我们批评用户的二元同形

冲突强度：强（这是必须保留的自我审视）

调整后结论

报告必须保留：
- 推荐不应过度推 F 路径 — 给用户保守对照版本（接 OUY + 不双轨 + 父亲撤离）作为合理选择
- F 路径推荐置信度从"强"降为"中-强"
- 用户即使选择 C (Queen's QS) 也不是"绝对错"——只是 Diffusion 画像下风险更大
- 所有推荐都附"保守对照版"

CE-8 · 反方挑战"全面给出各种路径下的最佳操作"是否本身就是问题

可能反例

信息超载是 Diffusion 画像的强失败模式 — 给 Diffusion 儿子 6 大路径选择，本身就是把决策从"父亲帮选"变为"儿子被信息淹没"
决策科学：对于半自主 + 兴趣模糊的人，减少选项比"展示所有选项"更有助于做出真实决策
报告本身可能成为另一个 trap — "全面深入"的报告 = 父亲的"intellectual gift"，可能强化 enmeshment

冲突强度：强

调整后结论

修正报告交付方式：
- final report 不应直接给 Allan 看 — 父亲先消化 → 转化为简化版决策卡给儿子（最多 2-3 个明确选项 + 每个选项 3-5 个 trade-off）
- 父亲使用 S9 模板 B（家庭议事流程卡）执行讨论，不是把整份 report 丢给儿子
- 简化是为了让儿子的决策从信息淹没中真正有可能浮现

这是本反方阶段最具操作性的修正。

CE-9 · 反方挑战"加拿大本科 gap -11.6%"是否过度悲观

可能反例

StatCan 2022 数据是平均效应 — 对子群体（如 STEM + PR + 全球开放）可能不适用
数据时间范围：跟踪到 31 岁的样本可能是 1990s-2000s gap，那时 gap 后产出与现在不同（AI 兴起前）
"加拿大本科 gap"定义 — StatCan 没区分"沙发 gap"vs"目标性 gap"，平均值含失败案例
男性数据：-11.6% 是男性数据，可能高于女性差距 — 但数据差异本身揭示性别因素，不能直接外推个体

冲突强度：中

调整后结论

保留：StatCan 数据是迄今最硬的反 gap 证据
修正：报告需明确：
- StatCan -11.6% 适用于"加拿大本科同辈对比" — 如果 Allan gap 后走非加拿大路径（华侨生 / TU Delft 等），数据不直接适用
- gap 的"含义"决定其风险——目标性 gap ≠ pure gap

反方综合判决：报告需要的修正清单

CE-3 修正：状态诊断重测 — 引入第三方独立诊断（30 天内）
CE-7 修正：所有推荐附"保守对照版"
CE-8 修正：报告分两层 — 父亲消化层 + 儿子对话层（简化版）
CE-1 修正：UTM TMZ 推荐附"主动同伴密度构建"要求
CE-5 修正：6 路径并行限制为最多 2 条
CE-6 修正：决策心从 9/21 移到 5/15 - 6/30 窗口
CE-4 修正：父亲焦虑识别 = 健康信号，不要再加压
CE-2 修正：连续性 trap nuance — 被动连续性是 trap，主动连续性可以
CE-9 修正：StatCan 数据适用域明确

反方阶段的元教训

用户元诉求"审视自己的偏见"在反方阶段被反向应用：本任务的反主流偏见也被审视了。这是质量闸门 2 的真实工作——不是"找用户错"，是"找所有错"，包括本任务自己的错。

最重要的修正：CE-3（状态诊断重测）+ CE-8（报告分层）+ CE-7（保守对照）— 这三条进入 final report 的核心交付。

闸门 2 通过

✅ 每个关键假设都有反方证据
✅ 反方包括用户偏见 + 本任务自身偏见双向审视
✅ 冲突强度标注（弱 / 中 / 强）
✅ 调整后结论明确（保留 / 修正 / 撤回）
✅ 9 条反方修正进入 final report

进入 report_final.md 阶段。