工程师Manjeet Singh与Claude AI团队近日通过逆向工程,成功破解苹果M4芯片神经引擎(ANE)的算力封锁,使该硬件首次可直接执行AI模型训练任务。此次突破绕过了苹果CoreML框架限制,实现对ANE硬件的底层操控。实验显示,在M4芯片上运行单层Transformer时,峰值能效比达6.6 TFLOPS/W,远超A100与H100等专业GPU。Singh团队已在Mac mini上完成Stories110M模型的端侧训练,整机功耗低于1瓦。这一成果表明,M系列芯片具备高能效AI训练潜力,有望降低独立开发者与小型实验室的算力门槛,推动端侧AI计算的新方向。