【导读】刚刚,xAI 正式上线 Grok 3 API,一次性推出4种模型,以适配不同应用场景,定价策略灵活,用户可按需选择。同日,谷歌、Anthropic等也推出新的定价策略。
GenAI竞争,越来越激烈了。
据Similar Web统计,在日活跃用户方面,Grok与Gemini展开了激烈竞争。两者都已经超过50万日活跃用户,差距不足5万。

就在昨天,谷歌面向开发者推出全新套餐体系,其中标准套餐对个人开发者免费开放,可免费使用 Gemini 代码助手。

谈及API价格策略,AI巨头各出奇招:
- Grok-3 推出2款模型,支持2种调用模式,衍生出 4 种定价套餐;
- Anthropic推出100美元的Max套餐,主打高端服务;
- 谷歌Gemini 2.5 需付费解锁使用限制,以高性价比吸引用户;
- Meta开源Llama 3,成本优势显著,平均每百万token仅需0.36 美元 。
Grok-3:4种模型,各取所需
xAI,正式向公众开放了Grok 3系列API!
目前,Grok 3和 Grok 3 Mini均处于Beta测试阶段,支持常规模式与快速模式。
- Grok 3 适用于企业应用场景,如数据抽取、编程、文本处理等。其价格为:每输入100万token收费3美元,每输出100万token收费15美元。
- Grok 3 MINI属于轻量级模型,适用于对深度领域知识无需求的简单任务。价格为:每输入100万token收费0.3美元,每输出100万token收费 0.5 美元。

Grok-3和Grok-3-fast使用的是相同的基座模型,提供相同的响应质量。
它们的区别在于服务方式:Grok-3-fast运行在更快的基础设施上,响应速度显著高于标准版grok-3,但其输出token的成本也更高。
Grok-3和grok-3-fast指向的是相同的模型。
- 如果需要低延迟的应用,选择grok-3-fast;
- 如果想降低成本,可以选择grok-3。
对于grok-3-mini和grok-3-mini-fast也是如此。
它们本质上是相同的模型,唯一的区别是响应延迟。
可用模型列表:
grok-3-beta(标准版):输入3美元/百万token,输出15美元/百万token
grok-3-fast-beta(标准版,快速响应):输入5美元/百万token,输出25美元/百万token
grok-3-mini-beta(轻量版):输入0.3美元/百万token,输出0.5美元/百万token
grok-3-mini-fast-beta(轻量版,快速响应):输入0.6美元/百万token,输出4美元/百万token

在文档中,xAI展示了几个示例。
比如对话补全,可以流式传输响应,用户向xAI API端点发送请求。
API处理该请求后返回完整的响应。

响应:

AI巨头,各显神通
Gemini系列模型推出了免费的Gemini 2.5 Pro、 2.0 Flash等最新模型。
而且除了使用的模型不同,以及部分功能每日请求次数的限制,免费版几乎和付费版没有什么不同

今天,Anthropic推出了Max套餐:最低100美元,专为那些重度使用Claude并且需要更多使用次数,完成重要工作的用户设计。
Llama 4 Maverick 相较于平均水平更为便宜,定价为每百万token为0.36美元。
Llama 4 Maverick输入令牌价格:每百万个令牌0.20美元
Llama 4 Maverick输出令牌价格:每百万个令牌0.82美元

在ARC-AGI的半私有评估中,Llama 4 Maverick非常具有性价比:
- ARC-AGI-1:每个任务只要0.0078美元
- ARC-AGI-2:每个任务只要0.0121美元

此前,o3被爆出在ARC-AGI测试中烧3万美元解决一道题,试错1024次!
参考资料:
https://x.com/Similarweb/status/1909947139301482768
https://x.com/testingcatalog/status/1910101992887771342
https://www.reddit.com/r/singularity/comments/1jvbgea/google_developer_program_plans_pricing/
https://x.com/arcprize/status/1909659233324548402%20%20
https://www.anthropic.com/news/max-plan
本文来自微信公众号“新智元”,编辑:KingHZ ,36氪经授权发布。