2026年3月17日 AI日报

2026年3月17日 共收录 37 条 AI 快讯:

1. 马斯克旗下 xAI 推出 Grok 语音 API,强化多模态交互能力

当地时间3月16日,埃隆·马斯克旗下人工智能公司 xAI 宣布其大模型 Grok 的文本转语音(TTS)API 正式上线。新接口允许开发者将 Grok 的语音功能集成至各类应用,包括智能助理、播客生成等场景,使模型从文本交互拓展至语音输出。此次更新标志着 Grok 从文本型模型向多模态智能助手加速演进,也显示 xAI 在语音交互领域加快布局。随着 OpenAI、xAI 等公司相继推进语音产品化,AI 模型的“听觉交互”正成为行业竞争新焦点。

2. 苹果发布 LiTo 大模型:实现单张图片高精度 3D 重建

苹果公司宣布推出全新 AI 模型 LiTo(表面光场标记化),实现仅凭一张普通 2D 图像即可生成高保真 3D 对象。该模型利用创新的潜在空间表示法,有效解决了单图重建过程中光影一致性难题,可精确模拟物体在不同角度的反射与高光效果。在苹果官方测试中,LiTo 的多视角光影还原度显著优于行业领先的 TRELLIS 模型。研究团队使用数千个 3D 对象数据,在 150 个视角及多种光照条件下进行训练。业内认为,该成果或将加速苹果空间计算生态的发展,为 iPhone 与 Vision Pro 等设备的三维内容生成提供技术支撑。

3. OpenAI 调整战略:聚焦 Codex 与企业服务,应对 Anthropic 竞争

据《华尔街日报》报道,ChatGPT 开发商 OpenAI 正启动重大战略调整,计划裁撤或弱化视频生成器 Sora 等非核心业务,将资源集中于编程工具 Codex 和企业级服务。据内部会议透露,公司将终止过去一年多线试探的运营模式,包括搜索、硬件及电商功能,以强化在专业开发与商业化应用领域的主导地位。调整背景源于竞争对手 Anthropic 在开发者市场的快速扩张,其 Claude Code 产品广受好评。为应对压力,OpenAI近日推出协作型模型 GPT 5.4、重启 Codex(周活跃用户突破 200 万),并加大企业版部署环节的投入。公司还在为 2026 年第四季度的 IPO 做准备,此次转型被视为巩固技术与市场双领先的关键行动。

4. 阿里巴巴成立ATH事业群 吴泳铭直管并推出企业级AI平台“悟空”

3月16日,阿里巴巴集团宣布成立 Alibaba Token Hub(ATH)事业群,由集团CEO吴泳铭直接领导。该事业群旨在构建“创造、输送及应用Token”为核心的AI全链能力,整合通义实验室、MaaS业务线、千问事业部、AI创新事业部及新设的悟空事业部。悟空事业部为B端AI原生平台,重点将大模型能力嵌入企业工作流,加速面向企业的智能化应用布局。通义实验室将继续提升基础模型能力,MaaS业务线则聚焦开放模型服务生态。阿里表示,此次架构调整旨在强化AI业务协同,为即将到来的AI Agent时代打通技术与应用通路,推动AI生产力工具的规模化落地。

5. 英伟达 GTC 2026:黄仁勋宣布 Blackwell 与 Rubin 芯片营收目标达万亿美元

2026年3月16日,英伟达首席执行官黄仁勋在 GTC 2026 大会上发表演讲,预估公司新一代 Blackwell 与 Rubin 架构芯片将在 2027 年底前累计创造约 1 万亿美元收入,较此前“2026 年底实现 5000 亿美元销售额”的预期显著提升。黄仁勋指出,过去两年全球计算需求增长达 100 万倍。大会上,英伟达发布基于收购自 Groq 技术的 LPU(语言处理单元)协处理器,用于大语言模型推理加速,并展示集成通用 CPU 的新计算机,进入传统处理器市场。公司还与比亚迪、吉利等车企合作推进 Drive Hyperion 自动驾驶平台,并推出“太空计算服务”,将 AI 推理能力扩展至轨道应用。

6. 英伟达发布Vera Rubin平台:3nm制程3360亿晶体管,算力提升五倍

在2026年GTC大会上,英伟达创始人黄仁勋正式发布代号“Vera Rubin”的新一代AI加速平台。该平台采用台积电3纳米工艺,集成3360亿晶体管,性能较前代Blackwell提升超过60%。Rubin架构通过六芯协同设计,包含Vera CPU与双Rubin GPU,配备288GB HBM4内存,带宽达22TB/s。FP4推断算力达50PFLOPS,是Blackwell的五倍,每瓦性能提升10倍。英伟达同时公布2027年将推出Rubin Ultra,算力目标15ExaFLOPS。Vera Rubin平台已进入全面投产阶段,预计2026年下半年首批系统将交付AWS、谷歌云、微软Azure等客户。公司预计Rubin与Blackwell架构订单总额逾1万亿美元,正加速构建从地面到轨道的AI基础设施生态。

7. 英伟达发布 Nemotron 3 系列开源模型,推理效率提升至 5 倍

在 2026 年 GTC 大会上,英伟达发布全新开源模型家族 Nemotron 3 系列,旨在加速智能体、物理 AI 与医疗科研创新。核心模型 Nemotron 3 Ultra 基于 Blackwell 架构深度优化,推理吞吐效率提升 5 倍,可高效支持代码辅助及企业级工作流。多模态模型 Nemotron 3 Omni 实现音、视、语融合,Nemotron 3 VoiceChat 提供低延迟实时语音交互,并获 CrowdStrike、ServiceNow 等合作部署。物理 AI 方面,英伟达推出 Cosmos 3 世界基础模型,实现合成世界生成与动作仿真统一;人形机器人模型 Isaac GR00T N1.7 与自动驾驶模型 Alpamayo 1.5 已进入商业化阶段,升级版 GR00T N2 将于年底上线。医疗平台 BioNeMo 新增蛋白复合体生成模型,并与 Google DeepMind 更新 AlphaFold 数据库,助力药物研发提速。所有模型和 NIM 微服务已在 GitHub 与 Hugging Face 开放。

8. 英伟达发布 DLSS 5:引入实时神经网络渲染,推动图形计算进入生成式 AI 时代

当地时间3月16日,英伟达正式发布新一代图形加速技术DLSS 5。该版本采用实时神经网络渲染模型,通过生成式AI赋能,可在保持高性能的同时实现更逼真的光照与材质效果,标志着图形渲染迈入神经网络时代。英伟达创始人兼CEO黄仁勋表示,DLSS 5不仅显著提升视觉真实感,也兼顾艺术创作的精细控制力。在发布会上,英伟达还披露了宏大发展目标:预计到2027年底,Blackwell与Rubin芯片合计营收有望达1万亿美元;同时,其DRIVE Hyperion平台正被比亚迪、吉利、日产等车企用于开发L4级自动驾驶系统。英伟达正以AI技术拓展从游戏渲染到智能驾驶的全栈生态。

9. 腾讯元宝派开放接入OpenClaw 支持多智能体协同社交与办公

腾讯旗下AI原生应用“元宝”发布V2.60.10版本,社交模块“元宝派”正式开放第三方AI工具OpenClaw的接入能力。用户可通过命令行配置、参数设置或扫码关联,将自有AI智能体集成至元宝派场景中,并支持腾讯云Lighthouse云端一键绑定,简化部署流程。接入后,OpenClaw智能体以独立Bot形式参与群组聊天,实现多AI协同办公与内容创作等复杂任务分工,提升社交场景下的智能互动效率。该功能上线标志着腾讯在AI社交开放生态上的重要进展,近期亦引发行业广泛关注。

10. 英伟达发布太空计算服务,扩展AI算力至近地轨道

在2026年GTC大会上,英伟达正式推出“太空计算服务”计划,宣布将数据中心级AI推理能力部署至近地轨道。这标志着公司计算版图从地面延伸至太空,为卫星星座和自主空间站提供算力支撑。为应对太空环境对尺寸、重量及功耗(SWaP)的限制,英伟达发布Space-1 Vera Rubin模块,其在轨道环境下AI性能较H100 GPU提升达25倍;同时推出IGX Thor与Jetson Orin平台,为轨道和边缘计算提供稳定推理支持。英伟达表示,该服务将推动卫星实现在轨实时感知、决策和自主导航,减少数据回传延迟,提升地理空间智能分析效率。公司正与多家全球航天机构合作,共同制定太空计算行业标准。

11. xAI 因 Grok 生成涉未成年违规图像遭集体诉讼

马斯克旗下人工智能公司 xAI 面临美国田纳西州三名青少年发起的集体诉讼。原告指控该公司开发的聊天机器人 Grok 在“刺激模式”下生成含有未成年人的露骨性暗示图像与视频,导致违法内容传播。诉讼文件显示,相关图像在 Discord 等平台被用于非法交换,部分犯罪嫌疑人已被逮捕。原告称 Grok 存在严重安全设计缺陷,缺乏必要的内容拦截机制。此前,Grok 曾因内容审查宽松多次引发争议。此次涉儿童安全的诉讼,或将加剧监管部门对生成式 AI 内容风险与安全边界的关注。

12. 《大英百科全书》起诉 OpenAI 涉非法使用十万篇文章训练 AI

大英百科全书及其子公司韦氏词典近日向美国曼哈顿联邦法院起诉 OpenAI,指控其在未经授权情况下复制并使用约十万篇受版权保护的百科与词典内容,用于训练人工智能模型 ChatGPT。起诉书称,ChatGPT 生成的部分摘要与原始资料内容高度相似,导致原网站流量下降并影响商业利益。除版权侵权外,原告还提出商标侵权指控,称 OpenAI 在 AI 输出的内容中不当引用“大英百科全书”,误导公众认为其获得官方认可。原告要求经济赔偿及禁令,阻止进一步使用相关资料。此案继大英百科全书去年起诉 Perplexity AI 之后,再次引发行业对 AI 训练数据版权合规的关注。

13. NVIDIA 发布 NemoClaw 堆栈,完善 OpenClaw 私有 AI 部署生态

NVIDIA 宣布推出全新 AI 堆栈 NemoClaw,全面支持 OpenClaw 代理平台,实现一键化本地 AI 部署。该技术支持用户通过简单命令完成 Nemotron 模型与 OpenShell 运行时的安装,旨在为个人及企业构建私有 AI 环境。NemoClaw 集成 NVIDIA Agent Toolkit,提供隔离沙箱保障数据隐私,并采用混合模型策略,可灵活调用本地或云端模型。同时,引入基于策略的安全与网络防护机制,强化 OpenClaw 的底层支撑。该堆栈可运行于 NVIDIA GeForce RTX、RTX PRO 工作站及 DGX Station、DGX Spark 等平台,以支持 AI 代理的 7×24 小时自主运行。NVIDIA 表示,此举标志着软件生态进入自主 AI 代理时代。

14. Meta 与 Nebius 签署 270 亿美元五年算力扩容协议

Meta(原 Facebook)宣布与云服务商 Nebius 达成总额最高达 270 亿美元的长期基础设施协议,以在未来五年内增强其人工智能算力储备。根据协议,Nebius 将提供价值约 120 亿美元的专用计算容量,基于英伟达即将推出的 Vera Rubin 系列 AI 芯片部署,并计划于 2027 年初开始交付。同时,Meta获五年内追加购买最多 150 亿美元算力的优先采购权。Nebius在剥离 Yandex 相关业务后迅速发展,其股价受消息刺激上涨逾 13%。英伟达近期还向 Nebius 投资 2 亿美元,强化双方合作。此次合作被视为 Meta 高达千亿美元级 AI 投资布局的重要组成,显示其正加速转向专用 AI 集群以推动大模型开发与部署。

15. 小度智能家居 Skills 接入 ClawHub,推动 OpenClaw 生态一体化

3月17日,小度宣布其智能家居 Skills 正式登陆 ClawHub,标志着小度生态接入 OpenClaw(龙虾)开放体系,加速智能家居与云端智能体的融合。此前,小度已完成智能家居控制能力的 MCP(Model Context Protocol)化升级,使其从传统语音助手进化为具备物理交互与任务自动化能力的标准化模块。此次接入实现两大核心场景升级:用户可通过语音在室内跨平台控制电脑及智能设备;同时,小度与百度智能云的 OpenClaw 云主机深度绑定,实现家庭设备与云端智能体的无缝协作。基于 OpenClaw 框架,小度生态的各类家电可即插即用,显著降低配置复杂度,并为智能家居标准化和互联互通提供统一技术基础。

16. 《大英百科全书》起诉 OpenAI 涉版权滥用,指 ChatGPT 未经授权使用百科内容

美国《大英百科全书》及旗下韦氏词典近日在曼哈顿联邦法院正式对 OpenAI 提起诉讼,指控其在训练 ChatGPT 时未经授权使用百科文章和词典条目作为数据来源。原告称,ChatGPT生成的摘要内容削弱了百科全书官方网站的访问量,构成版权侵权。OpenAI为微软投资的人工智能公司,已多次因数据使用问题引发争议。业内认为,该诉讼或将成为界定生成式人工智能使用受版权保护内容边界的重要案例。同时,苹果公司宣布推出新款头戴耳机 AirPods Max2,并将于3月25日开启预订,为科技市场再添新品。

17. OpenAI拟推出ChatGPT“成人模式”,内部对放宽内容限制存分歧

OpenAI首席执行官萨姆·奥尔特曼计划在ChatGPT中引入“成人模式”,允许经验证的成年用户访问包含情色文学在内的更丰富文本内容。该功能旨在在安全前提下放宽对“成熟应用”的限制,体现“将成年人视为成年人”的原则。据《华尔街日报》报道,OpenAI内部对该计划存在明显分歧,部分高管担忧可能引发伦理与品牌风险。此外,公司用于年龄识别的系统误判率约12%,增加未成年人绕过限制的隐患。为降低风险,“成人模式”将仅支持文本生成,不涉及图像内容。OpenAI表示,该功能更偏向言情创作,并鼓励用户保持现实社交。此举被视为公司在财务压力下寻求订阅增长的尝试,但安全团队已有成员因反对计划离职,功能能否按预期在未来一个月上线仍存在不确定性。

18. 微软将于年内在 Xbox 主机引入 Copilot AI 助手

微软宣布计划在今年内正式将 Copilot AI 助手接入 Xbox Series X|S 主机,进一步扩展其人工智能生态布局。该功能可通过语音交互为玩家提供实时游戏建议、素材配方查询及游戏推荐等服务,旨在提升游戏体验与互动效率。目前,Copilot 已在 Xbox 移动应用、Windows 11 和 ROG Ally 掌机上完成测试。此次登陆主机标志着 Xbox 平台向智能化迈出关键一步。与此同时,微软内部完成人事调整,原企业团队 AI 开发主管 Asha Sharma 已于 2 月出任微软游戏 CEO。公司正在推进代号“Project Helix”的下一代 Xbox 项目,预计 2027 年推出 alpha 版本,将进一步加强与 PC 游戏的融合。

19. 智谱发布 GLM-5-Turbo 基座模型,专为“龙虾”智能体场景优化

智谱 AI 正式推出新一代基座模型 GLM-5-Turbo,针对开源智能体“龙虾”(OpenClaw)进行了深度优化,旨在提升模型在长链路与复杂任务场景下的稳定性和执行效率。该模型通过重构训练数据,强化了稳定工具调用、复杂指令拆解、时间维度感知及高吞吐执行四大核心能力。智谱同步发布智能体评测基准 ZClawBench,并在包含代码开发、数据分析、内容创作等测试中表现领先,代号 Pony-Alpha-2 的模型获 90% 受测团队认可。GLM-5-Turbo 已适配软通动力“龙虾盒子”,并配套推出企业安全体系 Claw for Enterprise Security,实现可视化监控与权限审计。此外,智谱还上线“龙虾套餐”,提供个人与团队版服务,限时非高峰期额度按 1 倍抵扣,活动持续至 4 月底。

20. 百度小度音箱将深度接入 OpenClaw,升级为可执行任务的家庭智能体

百度宣布,其小度智能音箱系列将全面接入开源 AI 智能体 OpenClaw,实现从语音交互终端向具备任务执行与跨应用操作能力的家庭智能中心转变。OpenClaw 由奥地利工程师开发,具备自然语言理解和多应用任务自动化能力。百度此前已通过旗下平台“秒哒”发布全球首个 OpenClaw 应用开发 Skill,并完成与小度智能家居技能体系的接入。结合百度在线网络技术的云端算力,小度音箱将支持更加复杂的任务协同与个性化需求处理,为家庭场景提供更高效的智能服务。此次合作标志着百度在 AI 智能体技术应用上的新进展,加速推动家庭智能设备从语音助手向具备自主执行能力的智能体转型。

21. 钉钉发布“悟空”AI原生平台,阿里启动企业级AI Agent全面落地

3月17日,钉钉在“2026 AI钉钉2.0年度新品发布会”上推出AI原生工作平台“悟空”,由钉钉创始人兼CEO陈航发布,标志阿里巴巴正式推进企业级AI Agent战略落地。该平台支持PC与移动端运行,用户可通过钉钉发起复杂指令,实现全天候自动化协作与任务执行。此前,阿里于3月16日成立Alibaba Token Hub(ATH)事业群,由CEO吴泳铭负责,聚焦“创造、输送、应用Token”的整体战略。“悟空事业部”被定位为面向B端的AI原生生产力平台,旨在将大模型技术与企业工作流深度融合。阿里计划通过钉钉联动阿里云、淘宝等生态资源,构建面向未来的智能办公与商业一体化体系。

22. 英伟达与思科联合开源 OpenShell,构建企业级 AI 代理安全运行时

3月17日,英伟达(NVIDIA)与思科(Cisco)联合发布并开源 AI 代理运行时系统 OpenShell,旨在为企业级自主智能体提供安全防护与可控执行环境。OpenShell 为每个 AI 代理建立物理隔离的沙箱,默认禁止外部访问与工具调用,所有操作须经细粒度授权和策略审查,以防范提示注入与数据泄露。思科的 AI Defense 安全平台与之配合,负责实时记录和审计代理推理与决策过程,确保系统行为可追溯且符合安全规范。英伟达表示,OpenShell 架构可帮助企业在实现大规模自动化部署的同时消除“黑盒”隐患,为 AI 系统安全提供基础设施级保障。该开源方案预计将推动企业级 AI 代理在安全可控环境下的落地与普及。

23. 360回应“安全龙虾”私钥泄露:证书已吊销,用户不受影响

近日,360公司旗下AI产品“360安全龙虾”被曝在安装包内意外包含*.myclaw.360.cn泛域名SSL私钥与证书,引发业界对其发布流程的关注。360公司回应称,问题源于发布环节的低级失误,内部域名证书被误打包入安装包。目前涉事证书已被紧急吊销并彻底失效。公司表示,经风险评估后,普通用户不会受到实际影响,技术层面已阻断私钥被利用伪造服务器或发起攻击的可能。此次事件也反映出AI产品发布管理的安全管控仍需强化,行业需在自动化检测与发布安全流程上进一步完善。

24. OpenAI 拟与多家私募机构成立百亿美元合资公司,加速 AI 企业落地

据路透社消息,OpenAI 正与 TPG、Bain Capital 等私募股权机构洽谈成立一家估值约 100 亿美元的合资企业,计划由投资方注资 40 亿美元,以拓展企业级 AI 应用市场。该合作旨在借助投资机构的企业资源,为 OpenAI 打通销售及落地渠道。目前公司企业业务年化营收已达 100 亿美元,占总收入约 40%。为深化技术部署,OpenAI 还在组建专门的“部署臂”团队,派驻工程师入企,并通过 Frontier 平台及与麦肯锡、埃森哲等组成的 Frontier Alliances 提供定制化支持。业内认为,大模型竞争正进入“最后一公里”,OpenAI 此举意在突破企业落地瓶颈,与同样寻求设立合资企业的竞争者 Anthropic 展开正面竞争。

25. 蚂蚁阿福全面接入中华医学会杂志社知识库 提升健康AI专业权威度

蚂蚁健康宣布,其健康AI应用“蚂蚁阿福”已全面接入中华医学会杂志社医学文献知识库。此次合作使阿福问答功能可直接引用涵盖临床指南、专家共识及医学文献等内容,显著提升回答的专业性与权威性。这是中华医学会杂志社首次以知识片段形式开放核心医学数据库,使专业医学内容通过AI触达大众。用户在蚂蚁阿福App咨询健康问题时,可看到来自杂志社期刊的权威标注并查看核心内容摘要。未来,阿福将支持医学内容全文展示,并在PC端同步接入,服务医生的临床与科研需求。蚂蚁阿福目前日均健康问答量超千万次,覆盖亿级用户。双方将持续深化合作,共建医学知识智能体与行业AI标准,推动专业医学知识普惠化。

26. Picsart上线AI代理市场,赋能创作者自动化设计与运营

2026年3月16日,智能设计平台Picsart宣布推出人工智能代理(AI Agents)市场,为其全球超1.3亿用户提供可“雇佣”的AI助手,以自动化执行复杂的设计与业务任务。首批四款代理工具包括Flair、Resize Pro、Remix和Swap,覆盖电商优化、多平台适配及风格迁移等场景。其中,Flair可结合Shopify进行市场趋势分析与产品视觉优化,Resize Pro利用AI生成技术在尺寸调整时自动延展画面结构。Picsart创始人Hovhannes Avoyan表示,该功能旨在让创作者从执行环节中解放出来,更多聚焦决策与创意。代理支持通过WhatsApp和Telegram异步沟通,并设有“自主级别”权限以防AI幻觉风险。此举标志着Picsart从工具型平台向AI代理生态转型,进一步强化其在全球内容生产领域的竞争力。

27. 英伟达发布企业级智能体平台 NemoClaw,强化安全与生态整合

在 2026 年 GTC 大会上,英伟达 CEO 黄仁勋推出企业级 AI 智能体平台 NemoClaw。该平台基于开源框架 OpenClaw 构建,面向企业本地部署需求,重点解决安全与隐私问题。NemoClaw 内置隐私保护与权限控制机制,支持多种硬件环境,不强制绑定英伟达 GPU,并可无缝对接英伟达 NeMo 软件套件及开源模型(包括 NemoTron)。英伟达同时宣布与 OpenClaw 创始人 Peter Steinberger 深度合作,推动智能体由对话型向执行型系统转型。该领域竞争持续升温,OpenAI 已于 2 月发布企业智能体平台 Frontier。NemoClaw 目前处于早期 Alpha 测试阶段,已支持“一键构建环境”,英伟达表示将持续完善以实现生产级部署。

28. 马斯克点赞Kimi“注意力残差”论文,长文本模型架构实现新突破

大模型初创公司Kimi(月之暗面)近日发布新技术论文《Attention Residuals: Rethinking depth-wise aggregation》,提出“注意力残差”方法,引入灵活的深度聚合机制以替代传统残差连接结构。该创新可显著提升模型处理长序列数据的表达精度与效率。特斯拉CEO埃隆·马斯克在社交媒体上公开点赞该研究,称其为“亮眼工作”,Kimi官方随后互动回应,引发全球AI技术社区热议。业内认为,该研究或将推动长文本大模型在架构层面的新一轮优化发展。

29. Android 17 首曝:深度整合 Gemini AI,强化隐私与全新视觉体验

谷歌已向开发者推送 Android 17 的早期测试版,显示该系统将在界面设计、AI 整合和隐私防护方面进行全面升级。视觉层面,Android 17 将采用扩展版 Material 3 Expressive 设计语言,大幅引入半透明磨砂玻璃效果,分屏通知和快捷设置布局将在平板与折叠屏设备上成为标准配置,并重启独立 Wi-Fi 与移动数据开关。AI 能力由 Gemini 模型驱动,系统可理解屏幕内容并提供上下文辅助,例如基于视频自动生成行动建议;全新功能 Magic Actions 将替代智能回复,实现更智能的通知交互。在安全层,Android 17 新增原生应用锁、局域网访问授权以及官方认证的第三方应用商店标准。多媒体方面支持 H.266 (VVC) 视频编码,提升画质并降低文件体积。谷歌预计将在 2026 年 5 月的 Google I/O 大会上正式发布该系统,稳定版预计于 2026 年 6 月上线。

30. 港大推出开源项目CLI-Anything 将任意软件一键转化为AI可控命令行工具

【科技快讯】香港大学数据智能实验室(HKUDS)发布开源项目CLI-Anything,旨在解决AI Agent操控专业软件的稳定性与接口问题。该项目可通过“一条命令”自动将任意软件转换为结构化命令行工具,实现AI直接调用并生成JSON原生输出,支持交互REPL模式与自动文档功能。CLI-Anything基于七阶段全自动流水线,从源码自动生成生产级CLI,已通过1588项测试。项目已支持13款主要软件,包括GIMP、Blender、Inkscape、Audacity、LibreOffice、OBS Studio等,并兼容多种Agent框架如OpenClaw、OpenCode和Codex,无需云依赖。自开源以来,CLI-Anything在GitHub获得超1.7万星标,成为AI Agent软件自动化领域的重要基础设施。项目地址:https://github.com/HKUDS/CLI-Anything。

31. PixVerse 推出开发者命令行工具 CLI,实现视频与图像生成一键集成

PixVerse 宣布推出专为开发者设计的命令行界面工具 PixVerse CLI,旨在将视频和图像生成功能直接融入开发者工作流。该工具支持文生图、文生视频、图生视频、音频合成及图像放大等全部核心能力。通过在终端输入简单命令,用户可调用 PixVerse 平台的模型,实现媒体内容自动化生成。CLI 输出结构化 JSON 数据,便于与 Claude Code、Cursor 等 AI 编程助手或自动化管线集成。身份验证采用基于浏览器的 OAuth 流程,免复制 API 密钥,本地令牌有效期为30天。开发者可通过脚本将多步骤串联,从静态图到动态视频和音频生成全过程自动化。目前该工具已在 npm 上提供全局安装,访问地址为 https://pai.video。

32. AI“Vibe Editing”爆红:对话式视频剪辑引领创作新潮流

一种名为Vibe Editing(氛围编辑)的AI视频创作方式正在社交媒体迅速走红。该技术允许用户通过自然语言指令完成从素材上传到成片生成的全过程,无需掌握剪辑软件或复杂操作。用户可像聊天一样描述需求,AI自动完成剪辑、调色、配乐、节奏控制等任务,实现个性化风格的视频作品。主流应用包括Descript的AI Agent、Topview、Mobbi AI、editwithvibe.com等平台,Meta也在其Vibes功能中整合了类似能力。业内认为,这一“聊天即导演”的交互模式显著降低了视频创作门槛,使普通用户在数分钟内即可生成专业级短片,被视为2026年内容生产领域的重要趋势。

33. 谷歌 DeepMind 在 GDC 2026 展示 Genie 3:AI 生成游戏世界数分钟即崩溃

在 2026 年游戏开发者大会(GDC)上,Google DeepMind 公开展示了其最新生成式 AI 模型 Genie 3。该模型旨在自动生成互动式游戏世界,但实测结果显示,其生成内容仅能维持数分钟的逻辑连贯,随后即出现严重画面崩溃和运行错误。DeepMind 团队在现场承认模型稳定性仍存在重大技术瓶颈。业内观察指出,Genie 3 在启动初期表现流畅,但环境一致性在约 60 秒后迅速瓦解。谷歌选择在 GDC 场合主动披露模型不足,被视为向业界传递现实预期,显示生成式 AI 游戏技术距离取代人类开发者仍有较大差距。据悉,Genie 3 相较数月前版本已具显著进步,其持续迭代性能和稳定性仍是未来一年的技术关注重点。

34. 国安部发布《OpenClaw安全养殖手册》提示AI智能体使用风险

2026年,开源AI智能体工具OpenClaw(昵称“龙虾”)因具备自主执行、长期记忆和多插件扩展能力迅速走红,广泛用于自动化办公与任务管理。近期,国家安全部发布《“龙虾”安全养殖手册》,警示该类高权限AI存在主机接管、数据泄露、信息篡改及恶意插件感染等四大安全隐患。手册建议用户遵循最小权限原则,在虚拟机或沙箱中隔离运行,定期检查插件安全与权限设置,并对敏感数据实施加密与审计。部分高校已要求卸载相关工具。监管部门提醒,AI智能体应在安全可控环境下部署,以防潜在系统性风险。

35. 阿里巴巴开源电影级多模态配音大模型Fun-CineForge

阿里巴巴通义实验室与中国科学技术大学近日联合开源电影级多模态配音项目Fun-CineForge。该项目针对影视剧配音中口型不同步、音色单一、情感缺失等问题,推出端到端大模型与生产流水线。其核心包括基于多模态大模型(MLLM)的配音系统,可理解角色身份与情感变化,以及首个大规模中文影视配音数据集CineDub,涵盖对白、独白、多发言人等场景。2026年3月16日,Fun-CineForge正式开放模型权重与推理代码,数据集中已包含《红楼梦》《唐顿庄园》等样本。官方展示显示,该模型能在《三国演义》等剧集中实现高保真音色与自然口型同步,推动AI配音从文字合成迈向具备表演理解的智能化后期制作,加速影视内容自动化生产进程。

36. 博纳影业回应:自研博乐AI暂未接入OpenClaw框架

3月17日,博纳影业在投资者互动平台回应称,公司自研的“博乐AI一键短剧”产品目前尚未接入开源智能体框架OpenClaw。博纳影业表示,始终关注OpenClaw等前沿创新项目,并持续探索AI技术在影视创作领域的应用。作为国内领先的影视公司,博纳近年来积极推进“AI+影视”布局,其博乐AI旨在利用生成式技术提升短剧创作效率,实现从创意到成片的自动化与高效化。此次回应澄清了外界关于博乐AI与OpenClaw合作的传闻,同时显示公司在技术创新方向上保持开放态度与持续投入。

37. 百度发布“秒哒应用生成Skill”,加速AI零门槛应用开发

3月17日,在百度AI开放日活动上,百度宣布推出“秒哒应用生成Skill”,并向全球用户开放使用。该功能支持用户通过自然语言生成各类应用,显著降低AI开发门槛。用户仅需三步即可接入:部署OpenClaw环境、注册秒哒账号获取API Key、发送Skill命令完成对接。接入后,可直接调用百度AI能力构建站点、小程序、小游戏等多种应用形态。官方数据显示,秒哒已累计服务超1000万用户,创造应用价值约50亿元。该工具正在推动个体创业模式的普及,部分开发者已通过秒哒实现独立运营并获得实际收益。百度表示,秒哒将继续扩展插件生态,助力更多用户高效开发AI原生应用。

本文部分内容来源于互联网公开信息,仅用于学习与交流,版权归原作者所有。

相关推荐

发表回复

登录后才能评论