谷歌研究团队近日发布教育评估新模型 Vantage,旨在通过大语言模型(LLM)更准确地测量学生在协作、创造力与批判性思维等“持久技能”上的表现。该方法采用“执行 LLM”架构,由单一模型同时生成多名 AI 参与者的回应,以模拟真实团队互动并根据教育标准进行评分。研究团队招募188名18至25岁的参与者,通过与 AI 角色进行30分钟协作任务,共收集373份对话数据。纽约大学人类评审员与 AI 工具共同进行评分,结果显示 AI 评分与专家一致性较高,尤其在创造力与批判性思维方面表现突出。谷歌表示,这一方法在生态真实性与测评可靠性之间取得平衡,为未来教育评估和个性化学习提供新的工具思路。
谷歌研究推出 Vantage:利用大语言模型评估协作与创造力新方法
上一篇:OpenAI 内部信质疑 Anthropic 虚增收入 80 亿美元,称真实营收仍低于自家水平
下一篇:MiniMax Agent 桌面端升级推出 Pocket 与 Computer Use 功能,实现跨平台智能操作