Rate limit (omezení počtu požadavků)
Maximální počet API požadavků, které lze odeslat za dané časové období, než server dočasně přeruší přístup.
Co je rate limit?
Rate limit (omezení rychlosti) je maximální počet požadavků, které lze odeslat na API za dané časové období - nejčastěji za minutu nebo za den. Pokud limit překročíte, API vrátí chybu 429 Too Many Requests a dočasně zablokuje přístup.
Typické jednotky rate limitů
- RPM (Requests Per Minute) - počet volání za minutu
- TPM (Tokens Per Minute) - počet tokenů za minutu (u LLM API)
- RPD (Requests Per Day) - celkový denní limit
Jak rate limit řešit v automatizacích
- Přidat pauzu (delay) mezi požadavky
- Implementovat logiku opakování (retry) s exponenciálním čekáním
- Navýšit plán předplatného u poskytovatele API
- Rozložit zpracování do fronty (queue)