最新披露的法庭文件显示,AI公司Anthropic内部启动代号“巴拿马项目”(Project Panama)的数据获取计划,大量从二手书商和实体书店采购书籍,通过切除书脊进行破坏性扫描,将内容转为PDF后再将纸质书送往回收销毁,以构建大规模训练数据集。该项目由曾参与Google Books计划的高管参与推进,目标是获取尽可能全面的图书语料。Anthropic表示,此举基于“首次销售原则”和“合理使用”,扫描文件仅用于内部模型训练。此前公司因使用盗版电子书网站LibGen数据遭作家起诉,并在2025年支付约15亿美元达成和解。目前,美国法律界对AI训练是否构成合理使用仍无定论,多家AI公司正面临类似版权争议。