自2025年8月GPT-5发布以来,OpenAI在全球互联网的数据采集规模显著扩大。行业监测数据显示,其旗下爬虫程序总体活跃度较发布前提升约300%,反映出模型对实时信息和高质量训练数据的强烈需求。内部数据指出,用于内容检索的“OAI-SearchBot”访问量已超过传统训练用“GPTBot”,显示ChatGPT正强化实时搜索反馈功能。医疗、媒体、出版等行业网站的相关访问量成倍增加,OpenAI正在优化数据采集逻辑,将新闻类查询转向实时搜索渠道。目前,OpenAI爬虫总量约为谷歌的4%,虽仍有差距,但增长速度迅猛。业内认为,这一扩张正推动AI信息采集进入新阶段,也为网站运营者在数据保护与AI流量之间的权衡带来新的挑战。