速率限制

为保障平台服务的稳定性与公平性，所有 API 请求均受速率限制（Rate Limiting）策略约束。本指南旨在帮助开发者理解限流机制、避免触发惩罚性措施，并提供限流配额提升的申请流程。

限流机制说明

重要提示
速率限制按账户维度进行管控，而非按 API Key。即使为同一账户申请多个 API Key，也不会增加总限流额度。请合理规划调用策略，避免因误解导致配额超支。

即便您的账户已提升限流配额，仍可能偶发收到 HTTP 429（Too Many Requests）响应。此类情况通常由以下原因导致：

各模型默认限流值（TPM/RPM）请登录控制台 →「模型列表」页面查看实时配置。

⚠️ 警告：滥用配额将触发惩罚

为防止恶意或低效调用消耗公共资源，平台对 4xx 类客户端错误（如 400 Bad Request）实施惩罚性配额扣除机制：

重要建议：如遇 4xx 错误，请立即停止重试，检查并修正请求参数后再行调用，否则可能导致账户配额在短时间内被耗尽。

如您的业务场景需高并发调用 API（如批量数据处理、AI 产品集成等），可申请提升 TPM（Tokens Per Minute）或 RPM（Requests Per Minute）配额。当前该流程需人工审核，以确保资源合理分配。

企业客户如需提升速率限制请发送邮件至客服邮箱（support@ak46.com）