谷歌研究推出 Vantage:利用大语言模型评估协作与创造力新方法

谷歌研究团队近日发布教育评估新模型 Vantage,旨在通过大语言模型(LLM)更准确地测量学生在协作、创造力与批判性思维等“持久技能”上的表现。该方法采用“执行 LLM”架构,由单一模型同时生成多名 AI 参与者的回应,以模拟真实团队互动并根据教育标准进行评分。研究团队招募188名18至25岁的参与者,通过与 AI 角色进行30分钟协作任务,共收集373份对话数据。纽约大学人类评审员与 AI 工具共同进行评分,结果显示 AI 评分与专家一致性较高,尤其在创造力与批判性思维方面表现突出。谷歌表示,这一方法在生态真实性与测评可靠性之间取得平衡,为未来教育评估和个性化学习提供新的工具思路。

上一篇:

下一篇:

发表回复

登录后才能评论