Claude 4.6 比 3.5 强多少？

在 SWE-bench (代码) 上：Sonnet 4.6 = 77.2%，Sonnet 3.5 = 49.0%（提升 57%）。GPQA (科学推理): 4.6 = 84.5%，3.5 = 65.0%。HumanEval (代码生成): 4.6 = 96.4%，3.5 = 92.0%。整体大幅领先，尤其是复杂代码与多步骤推理。

如何从 3.5 迁移到 4.6？

只需修改模型 ID：claude-3-5-sonnet-20241022 → claude-sonnet-4.6。其余代码完全不变。注意 4.6 默认 max_output 提升到 16K（Sonnet）/ 32K（Opus）。

Claude 3.5 还能用吗？

仍然可用（向后兼容），但 Anthropic 已停止更新 3.5 系列。新项目强烈建议直接用 4.6，价格相同、能力更强。

Claude 3.5 vs 4.6 — 完整基准对比与迁移指南

Claude 4.6 vs 3.5: SWE-bench 77.2% vs 49%、GPQA 84.5% vs 65%、HumanEval 96.4% vs 92%。一行代码迁移。

🇬🇧 Read in English 🇷🇺 Читать на русском

基准对比

基准	Sonnet 3.5	Sonnet 4.6	Opus 4.7
SWE-bench (代码)	49.0%	77.2%	82.0%
GPQA (科学推理)	65.0%	84.5%	87.7%
HumanEval (代码生成)	92.0%	96.4%	97.5%
MATH	71.1%	86.5%	91.0%
MMLU	88.7%	91.2%	93.4%

迁移指南

只需替换模型 ID：

# 旧
model = "claude-3-5-sonnet-20241022"

# 新
model = "claude-sonnet-4.6"

价格 1:1 对齐，能力大幅提升。新项目建议直接用 4.6，老项目可灰度切换。

新模型 ID

claude-opus-4.7 — 旗舰模型
claude-sonnet-4.6 — 推荐默认
claude-haiku-4.5 — 最快最便宜

准备好开始了吗？

2 分钟即可获得 Claude 全系列模型 API 接入。

查看价格