微软旗下 GitHub 于 4 月 6 日在 Copilot CLI 中上线实验性功能 Rubber Duck,引入跨模型 AI 审查机制,为开发者提供“第二意见”支持,以提升代码质量和编程效率。该功能允许用户选用 Claude 系列模型作为主控模型,并调用 GPT-5.4 进行代码审查,从而避免单一模型偏差。根据 SWE-Bench Pro 基准测试,Claude Sonnet 4.6 结合 Rubber Duck 后性能提升显著,弥补了 74.7% 的差距,复杂任务得分比基线高出 3.8%。Rubber Duck 提供主动、被动及用户触发三种审查模式,可在关键开发阶段自动或按需执行代码核查。该功能现处于实验阶段,用户可通过安装 GitHub Copilot CLI 并运行 /experimental 命令进行体验。