UStackUStack
Vantage icon

Vantage

Vantage 是 Google Research 实验,用生成式 AI 以评分量表引导模拟对话评估“未来就绪”能力,提供技能地图与反馈。

Vantage

Vantage 是什么?

Vantage 是 Google Research 的研究实验,使用生成式 AI 评估“未来就绪”技能。它通过模拟多方对话,让学习者在开放式场景中练习技能,同时 AI 系统收集结构化证据用于评估。

该项目与纽约大学教育专家和研究人员合作开发,目标是采用可扩展方法,与核心学术科目评估实践一致。Google 表示,Vantage 旨在为高中和大学生提供沙盒环境,包括产生验证技能评分和反馈的评估方法。

主要功能

  • 与 AI 化身进行模拟多方对话:学习者在开放式任务中(如辩论准备或推销创意愿景)与 AI 化身互动,生成技能互动的可观察证据。
  • “执行 LLM”引导评估:执行 LLM 使用提供的评估量表管理对话流程,并在需要时引入针对性挑战(如反驳想法或引入冲突)。
  • 量表引导的自适应证据收集:通过监控对话状态,执行 LLM 动态选择何时引入特定挑战,确保任务结束时收集到评估所需信息。
  • 基于量表的“AI 评估器”评分:任务结束后,AI 评估器对照相同量表分析对话记录,识别并衡量技能应用的证据。
  • 带视觉评分和定性反馈的“技能地图”:学习者获得详细技能地图,将评分和书面反馈链接到对话中展示的技能及子技能。

如何使用 Vantage

  1. 在 Google Labs 注册(Vantage 提供英文版本,按页面所述)。
  2. 选择开放式场景,如辩论准备或推销创意愿景。
  3. 参与模拟对话,与 AI 化身互动,同时系统引入与评估量表一致的挑战。
  4. 对话后查看输出:获得技能地图(视觉评分加定性反馈),反映记录中体现的技能。

使用场景

  • 在受控环境中练习未来就绪技能:学生可在结构化但开放式的场景中排练沟通、协作和创造性思维行为,便于评估。
  • 通过提示分歧评估冲突解决:如果对话需分歧来评估回应,执行 LLM 可引入冲突,让学习者展示应对方式。
  • 评估协作环境中构建想法:在参与者需发展彼此想法的场景中,自适应设置可提示持续想法完善,而非在首份提案后停止。
  • 为教育者提供量表一致的证据:过程使用提供的量表引导并产生基于记录的评分,教育者可据此调整课程以匹配技能地图中的技能领域。
  • 为学生提供针对展示子技能的可操作反馈:技能地图旨在将“隐形”进步可视化,将定性反馈连接到互动中观察到的具体技能和子技能。

常见问题

Vantage 是通用聊天机器人吗?

不是。页面描述 Vantage 为评估实验,通过与 AI 化身进行量表引导的模拟对话收集“未来就绪”技能证据。

Vantage 适用于谁?

Google 表示,它专为高中和大学生设计,提供练习和验证评估的沙盒。

Vantage 支持哪些任务类型?

页面举例开放式场景,如辩论准备或推销创意愿景。

Vantage 如何生成评分?

学习者完成对话后,AI 评估器对照评估量表分析记录,学习者获得带视觉评分和定性反馈的技能地图。

Vantage 在哪里可用?

页面称 Vantage 在 Google Labs 提供英文版供注册。

替代方案

  • 人工引导的基于表现的任务评分量表:教育者可以开展讨论、辩论或小组活动,并使用评分量表打分。这可能更耗资源,且难以大规模标准化。
  • 标准化测试和固定项目评估:这些更容易实施,但可能过于僵化,无法捕捉页面所述的互动模式或思维过程。
  • 其他带有教师创建评分量表的 AI 辅导或角色扮演系统:这些工具不是专用的“自适应评估引擎”,而是侧重对话练习和反馈,评估由教师或单独的评分流程处理。
  • 专注于课程成果的学习分析平台:这些平台追踪可衡量的学习信号,但可能无法像 Vantage 中的模拟多方对话那样直接评估人际交往和创造性思维行为。
Vantage | UStack