Claude API 速率限制 — RPM / TPM 与最佳实践
ClaudeStore 默认 60 RPM / 200K TPM,Pro 升级至 300 RPM / 1M TPM。HTTP 429 处理、retry-after 解析、指数退避策略。
速率限制表
| 套餐 | RPM | TPM | 并发 |
|---|---|---|---|
| Starter | 60 | 200,000 | 10 |
| Pro | 300 | 1,000,000 | 30 |
| Business | 600 | 2,000,000 | 60 |
| Enterprise | 定制 | 定制 | 定制 |
HTTP 429 处理
当超过限额时,API 返回:
HTTP/1.1 429 Too Many Requests
retry-after: 8
{"error": {"type": "rate_limit_error", "message": "..."}}客户端应解析 retry-after 头并等待对应秒数后重试。建议结合指数退避(最多 5 次重试)。
最佳实践
- 使用 客户端排队(p-limit / bottleneck)控制并发
- 启用 Prompt Caching 降低 TPM 消耗
- 多 Key 分流:每个项目 / 服务独立 Key
- 升级 Pro / Business 套餐获得更高限额
Cursor / Claude Code 默认会处理 429,无需用户干预。如果频繁触发,请升级套餐。