谷歌研究推出 Vantage：利用大语言模型评估协作与创造力新方法

谷歌研究团队近日发布教育评估新模型 Vantage，旨在通过大语言模型（LLM）更准确地测量学生在协作、创造力与批判性思维等“持久技能”上的表现。该方法采用“执行 LLM”架构，由单一模型同时生成多名 AI 参与者的回应，以模拟真实团队互动并根据教育标准进行评分。研究团队招募188名18至25岁的参与者，通过与 AI 角色进行30分钟协作任务，共收集373份对话数据。纽约大学人类评审员与 AI 工具共同进行评分，结果显示 AI 评分与专家一致性较高，尤其在创造力与批判性思维方面表现突出。谷歌表示，这一方法在生态真实性与测评可靠性之间取得平衡，为未来教育评估和个性化学习提供新的工具思路。

谷歌研究推出 Vantage：利用大语言模型评估协作与创造力新方法

发表回复