Anthropic封杀OpenClaw+DeepSeek V4灰度+Mercor训练数据泄露:4月4日AI圈三件事,每一件都在改规则

2026年4月4日 · AI动态

前言

2026年4月4日,AI圈没有给任何人喘息的机会。昨天微软MAI三件套+Qwen3.6+Gemma 4三连爆的热度还没散,今天又来了三颗炸弹——而且每一颗都在改写行业规则。

事件一:Anthropic宣布Claude订阅不再覆盖OpenClaw等第三方工具的使用量,从今天太平洋时间中午12点起正式生效。数百万用Claude订阅跑OpenClaw的开发者,一夜之间成本从$20/月变成了按量付费。

事件二:DeepSeek V4灰度测试曝光,SWE-bench Verified 83.7%,超过GPT-5和Claude Opus。自研Engram记忆机制、338种编程语言支持、百万级上下文——如果这些数据属实,开源编程模型的格局要变了。

事件三:AI数据供应商Mercor确认被TeamPCP黑客组织通过LiteLLM供应链攻击入侵,可能泄露了Meta、OpenAI、Anthropic的专有训练数据。Meta已暂停合作,OpenAI紧急调查。这不是普通的数据泄露——是AI行业的"原料配方"可能流入了暗网。

三件事看似不相关,但串在一起看指向同一个趋势:AI行业正在从"野蛮生长"进入"规则重塑"阶段。 Anthropic在收紧计费规则,DeepSeek在重写开源规则,Mercor事件则在敲响数据安全的警钟。

事件一:Anthropic封杀OpenClaw——$20/月的"无限量"时代结束了

发生了什么

Anthropic在4月3日宣布,从4月4日太平洋时间中午12点(北京时间4月5日凌晨3点)起,Claude的订阅服务(Pro $20/月、Max $100/月)将不再覆盖通过第三方工具(如OpenClaw、Cline等)产生的使用量。

变更项旧政策新政策
订阅覆盖范围Claude官网+第三方工具仅限Claude官网和官方产品
第三方工具费用包含在月费内按量付费(PAYG)
生效时间2026年4月4日
受影响工具OpenClaw、Cline(Claude模式)等主要为OpenClaw

Anthropic官方给出的理由是:第三方工具给系统带来了"超乎寻常的压力"(outsized strain),影响了核心用户的体验。

对开发者的实际影响

这件事看起来只是改了个计费规则,但对AI编程工具生态的影响是地震级的。

直接受影响的用户:所有用Claude订阅(而非API)在OpenClaw上工作的开发者。此前,你付$20/月Pro订阅,可以在OpenClaw上无限使用Claude Sonnet。现在,这部分使用量要单独按API价格计算——Claude Sonnet的API价格是$3/MTok输入、$15/MTok输出。一个重度用户每月可能多花$30-80。

Anthropic提供的过渡方案:

补偿方案内容截止时间
一次性抵扣金相当于一个月订阅费的额度4月17日前兑换
预购折扣使用额度包最高30%折扣持续有效
全额退款不接受新条款可取消订阅并获得全额退款4月17日前申请

Anthropic的真实意图

Anthropic不是在"惩罚"第三方工具,而是在重新定义Claude的价值边界

Claude Code和Claude Cowork是Anthropic的官方产品,订阅收入直接归Anthropic。OpenClaw是第三方工具,Claude的使用量通过OpenClaw的API调用产生——Anthropic从中获得的收入远低于直接订阅。

更重要的是,OpenClaw的使用模式是"挂机式"的——Agent自动执行任务,token消耗量远超人类对话。一个OpenClaw用户一晚上的token消耗,可能相当于100个Claude官网用户一周的用量。这对Anthropic的算力成本来说是巨大的负担。

使用场景平均token消耗/会话Anthropic收入/会话
Claude官网对话5K-20K$20/月(订阅费)
Claude Code(官方)50K-500K$20/月(订阅费)
OpenClaw Agent任务200K-2M$0(使用订阅额度)

OpenClaw用户用$20/月消耗了Anthropic价值$50-200的算力。这个商业模型不可持续——Anthropic必须改。

对AI编程工具格局的影响

这个政策变更的直接后果是:

谁不受影响

事件二:DeepSeek V4灰度测试——开源编程模型要变天了

核心性能数据

DeepSeek V4的灰度测试数据已经在多个渠道曝光。如果这些数据属实,它将成为目前最强的开源编程模型——没有之一。

基准测试DeepSeek V4GPT-5.4 ProClaude Opus 4.6Qwen3.6-Plus
SWE-bench Verified83.7%86%80.8%78.8%
HumanEval87.6%
上下文长度100万token128K200K100万token
编程语言支持338种~100种~80种~200种
设计图转代码92%准确率无此功能无此功能~60%(估计)

几个关键信息:

第一,SWE-bench 83.7%,已经超过了Claude Opus 4.6(80.8%),逼近GPT-5.4 Pro(86%)。考虑到V4还是灰度版本、未完全调优,正式版可能更高。开源模型在编程能力上追平闭源,这是第一次。

第二,Engram长期记忆机制是最大的架构创新。传统Transformer的记忆瓶颈在于:上下文窗口越大,推理成本指数级上升。DeepSeek的Engram机制将知识存储与推理解耦,实现近乎O(1)复杂度的知识检索——这意味着百万token上下文不再是"塞进去然后祈祷模型记得住",而是"存起来随时精确调用"。

第三,338种编程语言支持。这个数字几乎是GPT-5.4(约100种)的3.4倍。对于使用小众语言(Rust、Elixir、Haskell等)的开发者来说,DeepSeek V4可能是唯一能"理解"他们代码的模型。

第四,Design2Code功能——给一张UI设计图,直接生成前端代码,准确率92%。我们之前测试Qwen3.6-Plus的多模态编程时,估计准确率约60%。如果DeepSeek V4真的能做到92%,这意味着前端开发者的生产力可能再次跃升。

架构创新:MoE + Engram

特性DeepSeek V3.2DeepSeek V4(灰度)
架构MoE(混合专家)MoE + Engram记忆模块
参数量671B(37B激活)万亿级(具体未公布)
上下文128K100万token
记忆机制无(标准上下文窗口)Engram条件记忆
多模态文本+图像理解文本+图像+视频端到端
知识更新需要重新训练动态知识库更新

Engram是DeepSeek自研的记忆机制,名字来源于神经科学中的"记忆印迹"(Engram)概念。它的核心思想是:不要让模型"记住"所有东西,而是把知识存储在外部模块里,推理时按需检索。

对AI编程工具生态的影响

如果DeepSeek V4正式发布且性能达标,AI编程工具的性价比格局将再次被改写:

方案模型SWE-bench估算月费推荐度
Claude Code ProClaude Sonnet 4.679.6%~$40⭐⭐⭐⭐⭐
Cline + DeepSeek V4DeepSeek V483.7%~$5-10⭐⭐⭐⭐⭐
Cursor ProClaude Opus 4.680.8%~$60⭐⭐⭐⭐
Cline + Qwen3.6-PlusQwen3.6-Plus78.8%~$5⭐⭐⭐⭐

Cline + DeepSeek V4可能在SWE-bench上超过Claude Code Pro,而成本只有八分之一。 这将是AI编程工具有史以来最大的性价比颠覆。

不过有一个重要提醒:灰度数据≠正式版数据。DeepSeek V3发布前的爆料数据和最终版差距不大,但V4的架构跨度更大(新增Engram模块),灰度和正式版之间可能有调整。建议等正式发布后再做最终判断。

发布时间线

时间事件
2026年1月小参数版灰度测试启动(部分社区适配)
2026年4月3日多个渠道曝光大参数版灰度数据
2026年4月上旬(预计)正式发布(概率75%)
原计划2026年春节(2月中旬),已跳票

DeepSeek创始人梁文锋亲自带队研发。此前V1到V3都是"按计划发布",V4是第一次大幅跳票——说明架构创新确实有技术难度。

事件三:Mercor训练数据泄露——AI行业的"原料配方"流入了暗网

事件链条

这是三件事里最令人不安的一个。

TeamPCP黑客组织

→ 入侵LiteLLM(AI API代理工具) → 在两个版本(1.82.7/1.82.8)中植入恶意代码 → 植入凭证窃取+K8s横向移动后门 → 影响数千家使用LiteLLM的组织 → Mercor(AI数据供应商)中招 → 专有训练数据可能泄露至暗网

LiteLLM是一个AI API代理工具,月下载量9500万次,大量AI公司用它来统一管理不同模型的API调用。攻击者在LiteLLM的两个版本中植入了后门代码——任何使用这两个版本的组织,其系统凭证和环境变量都可能被窃取。

Mercor是谁,为什么它泄露的数据这么重要

Mercor是一家价值100亿美元的AI数据服务公司,核心业务是为大型AI实验室提供定制化的专有训练数据。它的客户包括:

客户状态
Meta已暂停合作,无限期停工
OpenAI紧急调查中,尚未暂停
Anthropic未置评
其他AI实验室重新评估合作关系

Mercor做的事情,本质上是"AI模型的饲料加工厂"。大型AI实验室(OpenAI、Meta、Anthropic)雇Mercor雇佣数千名人工承包商,为AI模型生成定制化的训练数据集——如何回答特定领域的问题、如何执行特定任务、如何验证答案的正确性。

这些数据集是AI模型的核心商业机密。 知道一家公司用什么数据、怎么训练的,就等于知道了它的"配方"。如果竞争对手拿到这些数据,可以复现类似的能力,甚至找到针对性攻击的方法。

泄露了什么

冒充Lapsus$的黑客在暗网声称拥有以下数据(真实性未完全确认):

数据类型声称大小
数据库200GB+
源代码近1TB
视频和其他文件3TB

如果这些数据确实包含Mercor为AI实验室生成的专有训练数据集,后果将是灾难性的。这相当于可口可乐的配方被公开了——虽然你有了配方,但你的生产线和品牌还是比不过可口可乐。不过,竞争对手可以基于这些数据更快地追赶,甚至找到你的模型在特定任务上的弱点。

为什么这件事和3月29日的LiteLLM事件有关联

3月29日的新闻速报里,我报道过LiteLLM遭TeamPCP供应链攻击的事件。当时的影响范围是"9500万月下载量受影响,3小时暴露窗口"。现在看来,那次攻击的实际影响远比当时报道的严重——Mercor就是那次攻击的最大受害者之一

对比3月29日报道4月4日更新
攻击方式LiteLLM供应链攻击同一事件,影响扩大
受影响范围"数千家组织"确认包括Mercor($100亿公司)
数据泄露未确认专有AI训练数据可能泄露
行业影响安全警告级别Meta暂停合作,OpenAI紧急调查

对普通用户的影响

好消息:泄露的是AI模型训练数据,不是用户个人数据。OpenAI已声明用户对话数据未受影响。

坏消息:如果训练数据真的流入暗网,它可能被用于:

对AI开发者来说,这件事是一个严重的安全警示:你的AI工具链上的每一个环节——模型、API代理、数据供应商——都可能成为攻击入口。

三件事串在一起看

事件改写的规则对用户的影响
Anthropic封杀OpenClawAI编程工具的计费规则成本上升,但更公平
DeepSeek V4灰度开源模型的性能天花板性价比颠覆,$5挑战$40
Mercor数据泄露AI训练数据的安全底线行业信任危机,供应链安全升级

三个事件分别从商业、技术、安全三个维度重塑AI行业的规则:

商业维度:Anthropic的"订阅不再覆盖第三方工具"政策,标志着AI公司开始精细化运营——不再做"一个价格无限使用"的赔本买卖。未来其他厂商(包括OpenAI)可能跟进类似策略。

技术维度:DeepSeek V4的Engram记忆机制,如果效果如宣传所言,将从根本上改变大模型的记忆方式。百万token上下文+O(1)检索,意味着Agent可以"真正记住"跨会话的信息,而不是每次都从零开始。

安全维度:Mercor事件暴露了AI行业的供应链脆弱性。LiteLLM一个工具被攻破,就能影响数千家公司、泄露价值数百亿美元的专有数据。AI行业的"安全"不应该只关注模型本身,更要关注整个工具链。

本周AI动态速览

FAQ

Q1:Claude订阅不覆盖OpenClaw后,我的成本会增加多少?

A:取决于你的使用量。轻度用户(每月通过OpenClaw消耗约50万token)额外成本约$10-20/月。重度用户(每月数百万token)可能额外增加$50-100。建议:优先使用Claude Code(官方产品,订阅覆盖),或用DeepSeek API替代(成本更低)。如果用Cline接入DeepSeek V3.2,每月只需$5左右。

Q2:DeepSeek V4什么时候正式发布?值得等吗?

A:预计4月上旬发布(概率75%),但DeepSeek V3也跳票过。如果V4的SWE-bench 83.7%数据属实,它将是目前性价比最高的编程模型——开源免费,性能超过Claude Opus。建议现在开始熟悉Cline的使用(如果还没用的话),等V4发布后直接接入。

Q3:Mercor数据泄露会影响ChatGPT或Claude的安全性吗?

A:不会直接影响。泄露的是训练数据("怎么教模型的"),不是用户对话数据("你和模型说了什么")。你用ChatGPT或Claude的对话记录是安全的。但长期看,如果训练数据被竞争对手获取,他们可以更快地追赶,这可能间接加速AI模型的能力扩散。

Q4:LiteLLM安全事件和Mercor泄露有什么关系?

A:因果关系。TeamPCP黑客组织通过在LiteLLM的两个版本中植入恶意代码(供应链攻击),窃取了使用这些版本的组织的系统凭证。Mercor恰好使用了被植入后门的LiteLLM版本,导致其系统被入侵。这和3月29日我们报道的是同一事件的后续——当时只知LiteLLM被攻击,现在知道了最大的受害者是Mercor。

Q5:AI编程工具现在应该怎么选?

A:结合今天三条新闻,更新推荐方案:追求综合效率选Claude Code Pro($20/月,订阅完全覆盖);追求性价比等DeepSeek V4正式发布后再决定(目前先用Cline+Qwen3.6-Plus,$5/月);使用第三方工具(OpenClaw等)的用户考虑切换到官方API或直接用Claude Code。不推荐:继续用Claude订阅跑OpenClaw(成本即将大幅上升)。

总结

2026年4月4日,三条新闻同时重塑AI行业的三个维度:

对开发者的行动建议:

持续关注AI工具宝箱获取最新AI工具评测和行业动态。