API Security / Performance

Rate Limiting

Token Bucket, Sliding Window, Redis Lua scripts, Kong/Nginx/AWS Gateway — ochrona API przed przeciążeniem i DDoS.

Token Bucket

Burst-friendly

Leaky Bucket

Stały output

Redis

Distributed cache

Cloudflare

Edge protection

6 algorytmów rate limiting

Każdy algorytm oferuje inny trade-off między precyzją, zużyciem pamięci i obsługą burst ruchu.

Algorytm	Złożoność	Pamięć	Burst	Implementacja	Kto używa
Fixed Window Counter	O(1)	O(1) per user	Boundary burst problem	INCR + EXPIRE w Redis	Proste systemy
Token Bucket	O(1)	O(1) per user	Dozwolony (tokeny)	Redis Lua script	Stripe, AWS, ogólne
Leaky Bucket	O(1)	O(1) per user	Niedozwolony (stały output)	Queue + timer	Traffic shaping, QoS
Sliding Window Log	O(N)	O(N requests)	Precyzyjny brak burst	Redis ZADD + ZCARD	Precyzyjne API, fintech
Sliding Window Counter	O(1)	O(1) per user	Aproksymacja sliding	Hybrid INCR	Balance precision/cost
GCRA (Generic Cell Rate)	O(1)	O(1) per user	Konfigurowalny burst	Redis Cell moduł	Telecom, cloud providers

Często zadawane pytania

Co to jest rate limiting i throttling — czym się różnią?

Rate Limiting: ograniczenie liczby żądań w określonym czasie. 100 req/min per user. Throttling: spowolnienie requestów gdy przekroczą limit (zamiast odrzucania). Zwolnij do 10 req/min zamiast odrzucić. Cele rate limiting: ochrona przed DDoS i brute force. Sprawiedliwy podział zasobów między użytkowników. Ograniczenie kosztów API (billing per request). Compliance (GDPR, PCI DSS — limity prób logowania). Typy rate limiting: By IP Address — prosta ochrona, łatwa do obejścia przez proxy. By User ID — bardziej precyzyjne, wymaga autentykacji. By API Key — idealne dla B2B API. By Endpoint — różne limity per endpoint (/login ściślejszy niż /search). By Client (Mobile/Web) — różne limity per typ klienta. Compound (kombinacje): 100 req/min per user per IP. Odpowiedzi HTTP: 429 Too Many Requests. Retry-After header (kiedy można spróbować). X-RateLimit-Limit — maksymalny limit. X-RateLimit-Remaining — pozostałe żądania. X-RateLimit-Reset — timestamp resetu. RateLimit-Policy (RFC 9110) — standardowy header. Graceful degradation: zamiast 429 — zwróć cached response lub uproszczone dane.

Token Bucket vs Leaky Bucket vs Sliding Window — algorytmy rate limiting?

Fixed Window Counter: zlicz requesty w oknie czasowym (np. 1 minuta). Reset licznika co minutę. Problem: burst na granicy okna (99 req o 00:59, 100 req o 01:01 = 199 req w 2 sekundy). Token Bucket: wiadro ma N tokenów. Każdy request zużywa 1 token. Tokeny uzupełniane w stałym tempie (rate). Jeśli brak tokenu -> 429. Zalety: burst jest dozwolony (jeśli tokeny dostępne), smoothing. Stripe, AWS API Gateway. Leaky Bucket: requesty wlewają się do wiadra. Wiadro 'przecieka' w stałym tempie (rate). Przepełnione wiadro -> 429. Zalety: absolutnie stały output rate. Wada: nie pozwala na burst. Sliding Window Log: zapisuj timestamp każdego requestu. Dla nowego requestu: policz ile requestów w ostatnim oknie (teraz - 1 min). Jeśli > limit -> 429. Precyzyjny, ale duże zużycie pamięci (per user log). Sliding Window Counter: hybryda Fixed Window i Sliding Window Log. Interpolacja między poprzednim i bieżącym oknem. Mniej pamięci niż pełny log. Rekomendacja: Token Bucket — ogólny cel, burst allowance. Fixed Window — proste implementacje, tolerancja boundary burst. Sliding Window — precyzyjne limity bez boundary burst. Leaky Bucket — gdy konieczny absolutnie stały output.

Jak zaimplementować rate limiting z Redis?

Redis Fixed Window (INCR + EXPIRE): INCR ratelimit:user:123:2024041315. EXPIRE ratelimit:user:123:2024041315 60. Sprawdź czy wartość > limit. Problem: race condition między INCR a EXPIRE (użyj Lua script). Redis Lua Script (atomowy Fixed Window): local current = redis.call('incr', key). if current == 1 then redis.call('expire', key, window). end. return current. Porównaj z limitem. Redis Sliding Window Log: ZADD ratelimit:user:123 timestamp timestamp. ZREMRANGEBYSCORE ratelimit:user:123 0 (now-window). count = ZCARD ratelimit:user:123. Jeśli count >= limit -> 429. EXPIRE dla cleanup. Redis Token Bucket (Lua script): atomic get-and-set tokenów i timestamp. Redis sorted sets dla Sliding Window Log. Redis Cell (moduł): gotowy algorytm rate limiting (GCRA — Generic Cell Rate Algorithm). CL.THROTTLE user:123 100 1 60 1 -> [allowed, limit, remaining, retry-after, reset]. Redis Rate Limiting z Nginx: nginx-limit-req-module. limit_req_zone $binary_remote_addr zone=api:10m rate=10r/s. limit_req zone=api burst=20 nodelay. Envoy Rate Limiting: lyft/ratelimit service. Envoy wysyła request do ratelimit service (gRPC). ratelimit odpowiada allowed/over_limit. Redis backend. Distributed Rate Limiting: każda instancja aplikacji korzysta z centralnego Redis. Zapewnia spójność limitów w całym klastrze.

Rate limiting w API Gateway — Kong, AWS API Gateway, Nginx?

Kong Rate Limiting Plugin: config.minute — limit per minutę. config.hour — limit per godzinę. config.policy — local (per-node), redis (distributed), cluster. Credentials — per consumer lub per service. Consumer Groups — różne limity dla różnych klientów. Priority — Consumer > Route > Service hierarchy. AWS API Gateway: Usage Plans — przypisz API Key do Usage Plan. Throttle rate (requests per second). Burst limit (krótkoterminowy spike). Stage-level default limits. Odpowiedź 429 ThrottlingException. Nginx rate limiting: limit_req_zone — definiuje zone w shared memory. limit_req — stosuj rate limit do lokacji. burst — bufor dla krótkich spike'ów. nodelay — nie kolejkuj, odrzuć od razu. Traefik Rate Limiting Middleware: middlares.api-rate.ratelimit.average = 100. middlares.api-rate.ratelimit.period = 1m. Cloudflare Rate Limiting: Rules -> Rate Limiting. Per IP/ASN/Country. Custom response. DDoS L7 protection. Fastly Rate Limiting: VCL custom logic. Edge rate limiting (przed trafieniem do origin). Prezentacja rate limitów: Tier-based limits — Free: 100/h, Pro: 1000/h, Enterprise: unlimited. Per-endpoint limits — /auth: 5/min, /api: 1000/min. Dokumentacja limitsów w OpenAPI/Swagger spec.

Jak unikać problemów z rate limiting w klientach API?

Exponential Backoff: przy 429 -> czekaj 2^attempt * base_delay + jitter. Jitter (losowość): bez jitter wszystkie klienty czekają tyle samo -> synchronized retry storm. Full Jitter: sleep = random(0, 2^attempt * base). Decorrelated Jitter (AWS recommendation): sleep = random(base, prev_sleep * 3). Circuit Breaker dla rate limits: po N kolejnych 429 -> otwórz circuit breaker. Nie wysyłaj requestów przez X sekund. Proactive Rate Limiting (Client-side): klient sam limituje swoje requesty. Token Bucket na kliencie. Nie czekaj na 429 od serwera. Retry-After header: serwer mówi kiedy można spróbować. Klient czeka dokładnie tyle. Batching: zamiast N requestów per item -> jeden request z N items. /batch endpoint lub GraphQL. Caching po stronie klienta: nie odpytuj API gdy dane są w lokalnym cache. Webhooks zamiast polling: serwer popycha dane przy zmianach. Zero polling = zero rate limit issues. SDK z wbudowanym rate limiting: oficjalne SDK (Stripe, Twilio, AWS) mają wbudowane retry i rate limiting. Używaj oficjalnych SDK. Monitoring po stronie klienta: śledzenie X-RateLimit-Remaining. Alert gdy < 20% pozostałego limitu. Automatyczna redukcja requestów. Load testing: zidentyfikuj rate limits przed produkcją. Twoje limity != limitów API gateway.

Czytaj dalej