AI探秘地图 · 核心教案
难度系数:★★★☆☆
第 6 站 课时教案:怎么让 AI 当个好助手?
对应学生关卡:第 6 站《怎么让 AI 当个好助手?》(建议安排:12分钟)
课堂目标与 AI 通识背景
🎯 课堂目标
- 认知维度:理解“指令微调(Instruction Tuning)”与“人类反馈强化学习(RLHF)”对让模型听懂指令的决定性作用。
- 思维维度:掌握结构化指令(Prompt Engineering)的设计方法:角色 + 任务 + 限制条件。
- 价值观维度:树立“AI 必须由人类加以约束和对齐”的工程安全意识,体验扮演“星际教练”的掌控感。
💡 AI 通识核心背景(教师备课用)
- 从接龙到对齐(Alignment):刚刚预训练出来的原始大模型,只是个盲目的“接龙玩家”。如果你问它“请写一篇关于熊猫的作文”,它可能会顺着接龙写“请写一篇关于熊猫的作文,还有关于老虎的作文……”这被称为没有“对齐”。
- 指令微调 (Instruction Tuning) 与 RLHF:为了让模型变成听话的助手,科学家需要进行“指令微调”,即喂给它大量“问-答”配对样本;并引入人类打分反馈(RLHF),惩罚无理接龙,奖励按指令回答。
- 提示词工程 (Prompt Engineering):人类如何精准指挥对齐后的 AI?核心就是提示词架构。一个高水平的结构化提示词必须包含:角色 (Role)、任务 (Task) 和 限制条件 (Constraint)。
40分钟核心教学流程
1. 情境导入与概念激活(0-8分钟)
- 太空引入:教师引导:“采集基地的多功能机械狗阿奇动作混乱。它只学会了‘接龙’,根本听不懂主人的指令!当让它去‘搬门口的蓝色矿石’时,它开始顺着接龙,完全不干活。我们今天要扮演‘特级训导教练’,给它装入对齐芯片,并给它编写精准的结构化控制指令!”
- 生动类比:
- 问学生:“如果训练一只搜救犬,你随便对它大喊大叫、说很长的废话,它能完美搜救吗?(学生答:不能)”
- “那训犬师是怎么做的?(学生:给它特定的口令、手势,以及做对了就奖励骨头)”
- 教师小结:“对!科学家调教大模型,也是用这套‘立规矩打分’的办法!”
2. 交互探究与概念构建(8-25分钟)
- 第一阶段:两阶段芯片对比(体验微调对齐):
- 指导学生登录平台,向阿奇发送指令“请帮我搬开门口的蓝色矿石”:
- 默认阶段:观察阿奇的回答,发现它开始重复废话或者疯狂接龙,机械狗完全没有去移动矿石的物理动作。
- 微调对齐阶段:指导学生点击“装入微调对齐芯片”,再次发送指令。观察到阿奇说:“【收到指令】已将蓝色矿石移开!”并顺利完成动作。
- 指导学生登录平台,向阿奇发送指令“请帮我搬开门口的蓝色矿石”:
- 第二阶段:提示词工程挑战(设计矿石收集令):
- 引导学生扮演星际教练,在控制台设计高级提示词。
- 使用平台提供的结构化模板:
[角色]:优秀的矿石搬运工[任务]:把所有的绿色能晶安全收集起来[限制]:千万不能触碰有毒的红色岩浆!
- 编写完成后,点击“发送测试”,观察机械狗能否根据复杂的限制条件,智能且安全地完成搬运。
3. 通关挑战与真实体验(25-32分钟)
- 真实 AI 评测:点击调用真实的 DeepSeek API 进行实战训导,AI 会扮演阿奇对你的指令进行安全执行评估,得到 95 分以上即可成功通关。
- 阐述科学原理:在挑战框中写下:为什么大模型在玩接龙之外,还需要经过“指令微调”和“人类打分反馈”才能成为人类的好帮手?
- 勋章激活:成功激活“提示词工程师”勋章!
4. 归纳反思与人机研讨(32-40分钟)
- 师生研讨:请几位获得 98 分以上高分的同学上台大屏幕投影展示他们设计的“矿石收集令”,分享他们设置“限制条件”的经验。
- 备课总结:教师总结:“今天我们学习了如何把野生的接龙模型驯化为贴心的助手。AI 之所以听话,是因为人类给它装了对齐规矩。在未来的智能时代,最能驾驭 AI 的人,一定是那些能够用‘角色 + 任务 + 限制’写出完美结构化指令(提示词)的‘超级掌控者’!”
学生可能反应与引导建议
反应一:学生觉得指令越简单越好,随便说什么 AI 都会干,不需要结构化模板
- 引导建议:教师可以让学生在真实 AI 接口输入一个极其模糊的指令(如“收集东西”)和一个结构化指令(角色:安全员,任务:只收集绿色水晶,限制:避开红色石头)。对比两者的结果差异,学生会直观发现:指令越含糊,AI 越容易摸鱼犯错;指令越清晰、有限制,AI 的执行效率才越高。
反应二:调用真实 AI (DeepSeek API) 时,因网络波动响应较慢
- 引导建议:教师引导学生进行“静态反思”:“艾达的控制天线正在向星空深处的超级服务器发射我们的指令包。在它返回评价的间隙,我们可以互相检查一下身边同伴的指令里有没有写清‘不要触碰红色岩浆’这句黄金限制条件?”
课堂评价指标
- 探究参与度:对比微调前后阿奇的反应,以及结构化指令模板填写的完成度。
- 思维严密性:在挑战回答中,能否理清“原始接龙模型只懂连词,必须通过微调立规矩、人类反馈打分对齐,才能理解指令的格式和任务要求”这一核心逻辑。