速率限制
为保障平台服务的稳定性与公平性,所有 API 请求均受速率限制(Rate Limiting)策略约束。本指南旨在帮助开发者理解限流机制、避免触发惩罚性措施,并提供限流配额提升的申请流程。
限流机制说明
1. 限流单位:账户级别
重要提示
速率限制按账户维度进行管控,而非按 API Key。即使为同一账户申请多个 API Key,也不会增加总限流额度。请合理规划调用策略,避免因误解导致配额超支。
2. 429 错误的常见原因
即便您的账户已提升限流配额,仍可能偶发收到 HTTP 429(Too Many Requests)响应。此类情况通常由以下原因导致:
- OpenAI 侧服务负载过高:属于第三方服务临时性瓶颈,平台无法干预。
- 建议应对策略:实施指数退避重试机制(Exponential Backoff),避免高频重试加剧系统压力。
各模型默认限流值(TPM/RPM)请登录控制台 →「模型列表」页面查看实时配置。
请求失败惩罚机制
⚠️ 警告:滥用配额将触发惩罚
为防止恶意或低效调用消耗公共资源,平台对 4xx 类客户端错误(如 400 Bad Request)实施惩罚性配额扣除机制:
- 单次 4xx 错误将消耗数倍于正常请求的限流配额。
- 常见触发场景包括:
- 超出模型最大 Token 限制
- 参数格式错误
- 不支持的模型或功能调用
重要建议:如遇 4xx 错误,请立即停止重试,检查并修正请求参数后再行调用,否则可能导致账户配额在短时间内被耗尽。
限流配额提升申请流程(企业用户)
如您的业务场景需高并发调用 API(如批量数据处理、AI 产品集成等),可申请提升 TPM(Tokens Per Minute)或 RPM(Requests Per Minute)配额。当前该流程需人工审核,以确保资源合理分配。
申请方式
企业客户如需提升速率限制请发送邮件至客服邮箱(support@ak46.com)