Claude Opus 4.7 核心信息汇总
一、发布时间与迭代节奏
于 2026年4月16日 正式发布,延续了 Anthropic 每两个月一次的稳定迭代节奏
。
二、核心升级亮点
软件工程能力飞跃
在 SWE-bench Pro 基准测试中,得分从 Opus4.6 的 53.4% 跃升至 64.3%,大幅领先 GPT-5.4(57.7%)和 Gemini3.1Pro(54.2%);SWE-bench Verified 得分达 87.6%,CursorBench 从 58% 升至 70%
。
首次通过“隐含需求测试”,能自主推断所需工具或行动,早期用户评价其“像一个更好的同事”
。
多模态与视觉能力增强
支持最高 2,576 像素长边(约 375 万像素)的图像输入,是前代的 3 倍以上,可处理密集截图、复杂图表数据提取等精细视觉任务
。
严格按字面意思理解指令,需重新调整旧提示词以适配新模型
。
智能体与自动化功能
ClaudeCode 新增 Routines 功能,支持定时、API、GitHub 三路触发,可 7×24 小时云端运行复杂任务,无需依赖本地电脑
。
在金融分析、法律 AI 等领域表现突出,金融代理测试全球最高分,法律 BigLaw 基准得分 90.9%
。
三、Token 消耗与成本变化
新分词器使相同内容的 Token 消耗增至 1.0~1.35 倍,高算力模式下输出 Token 亦增加,实际成本变相上涨 10%-35%
。
定价与 Opus4.6 一致:每百万输入 Token 5 美元,输出 Token 25 美元
。
四、用户评价与局限
编程能力获认可:复杂编码任务可放心交付,减少人工监督需求
。
Token 消耗争议:部分用户反馈输入 Token 飙升至前代的 3 倍,且长上下文检索能力下降
。
非全面领先:Agenticsearch 评测被 GPT-5.4 反超,与 Anthropic 最强模型 ClaudeMythosPreview 存在全方位能力差距