Rate Limiting and Throttling

import time
from collections import defaultdict
from threading import Lock

class TokenBucketRateLimiter:
    def __init__(self, capacity, refill_rate):
        """
        capacity: max tokens in bucket
        refill_rate: tokens per second
        """
        self.capacity = capacity
        self.refill_rate = refill_rate
        self.tokens = capacity
        self.last_refill = time.time()
        self.lock = Lock()

    def try_consume(self, tokens=1):
        """Try to consume tokens, return True if successful"""
        with self.lock:
            self._refill()

            if self.tokens >= tokens:
                self.tokens -= tokens
                return True, "Request allowed"
            else:
                wait_time = (tokens - self.tokens) / self.refill_rate
                return False, f"Rate limited. Retry after {wait_time:.1f}s"

    def _refill(self):
        """Refill tokens based on elapsed time"""
        now = time.time()
        elapsed = now - self.last_refill
        tokens_to_add = elapsed * self.refill_rate
        self.tokens = min(self.capacity, self.tokens + tokens_to_add)
        self.last_refill = now

    def get_status(self):
        with self.lock:
            self._refill()
            return {"tokens": self.tokens, "capacity": self.capacity}

class PerUserRateLimiter:
    def __init__(self, default_capacity=100, default_rate=10):
        self.limiters = defaultdict(
            lambda: TokenBucketRateLimiter(default_capacity, default_rate)
        )
        self.lock = Lock()

    def check_limit(self, user_id, tokens=1):
        """Check if user can make request"""
        with self.lock:
            limiter = self.limiters[user_id]
        return limiter.try_consume(tokens)

    def set_user_limit(self, user_id, capacity, rate):
        """Set custom limit for user (e.g., premium tier)"""
        with self.lock:
            self.limiters[user_id] = TokenBucketRateLimiter(capacity, rate)

class DistributedRateLimiter:
    """Rate limiter with IP-based limits"""
    def __init__(self):
        self.ip_limiters = defaultdict(
            lambda: TokenBucketRateLimiter(capacity=100, refill_rate=10)
        )
        self.global_limiter = TokenBucketRateLimiter(capacity=10000, refill_rate=1000)

    def check_limit(self, client_ip):
        """Check both IP and global limits"""
        # Check global limit first (cheap check)
        global_ok, global_msg = self.global_limiter.try_consume()
        if not global_ok:
            return False, "Service rate limit exceeded (429)"

        # Check per-IP limit
        ip_ok, ip_msg = self.ip_limiters[client_ip].try_consume()
        if not ip_ok:
            return False, f"IP rate limit exceeded: {ip_msg}"

        return True, "Request allowed"

# Example usage
limiter = PerUserRateLimiter(capacity=100, default_rate=10)

# Simulate requests from different users
for i in range(150):
    user = "user-1" if i < 50 else "user-2"
    allowed, msg = limiter.check_limit(user)
    if not allowed:
        print(f"Request {i} ({user}): {msg}")

print("User-1 status:", limiter.limiters["user-1"].get_status())
print("User-2 status:", limiter.limiters["user-2"].get_status())

package main

import (
    "fmt"
    "sync"
    "time"
)

type TokenBucketRateLimiter struct {
    capacity   float64
    refillRate float64
    tokens     float64
    lastRefill time.Time
    mu         sync.Mutex
}

func NewTokenBucketRateLimiter(capacity float64, refillRate float64) *TokenBucketRateLimiter {
    return &TokenBucketRateLimiter{
        capacity:   capacity,
        refillRate: refillRate,
        tokens:     capacity,
        lastRefill: time.Now(),
    }
}

func (tbl *TokenBucketRateLimiter) refill() {
    now := time.Now()
    elapsed := now.Sub(tbl.lastRefill).Seconds()
    tokensToAdd := elapsed * tbl.refillRate
    tbl.tokens = math.Min(tbl.capacity, tbl.tokens+tokensToAdd)
    tbl.lastRefill = now
}

func (tbl *TokenBucketRateLimiter) TryConsume(tokens float64) (bool, string) {
    tbl.mu.Lock()
    defer tbl.mu.Unlock()

    tbl.refill()

    if tbl.tokens >= tokens {
        tbl.tokens -= tokens
        return true, "Request allowed"
    }

    waitTime := (tokens - tbl.tokens) / tbl.refillRate
    return false, fmt.Sprintf("Rate limited. Retry after %.1fs", waitTime)
}

type PerUserRateLimiter struct {
    limiters map[string]*TokenBucketRateLimiter
    mu       sync.Mutex
}

func NewPerUserRateLimiter() *PerUserRateLimiter {
    return &PerUserRateLimiter{
        limiters: make(map[string]*TokenBucketRateLimiter),
    }
}

func (purl *PerUserRateLimiter) CheckLimit(userID string) (bool, string) {
    purl.mu.Lock()

    limiter, exists := purl.limiters[userID]
    if !exists {
        limiter = NewTokenBucketRateLimiter(100, 10)
        purl.limiters[userID] = limiter
    }

    purl.mu.Unlock()

    return limiter.TryConsume(1)
}

func main() {
    limiter := NewPerUserRateLimiter()

    for i := 0; i < 150; i++ {
        user := "user-1"
        if i >= 50 {
            user = "user-2"
        }

        allowed, msg := limiter.CheckLimit(user)
        if !allowed {
            fmt.Printf("Request %d (%s): %s\n", i, user, msg)
        }
    }
}

class TokenBucketRateLimiter {
    constructor(capacity, refillRate) {
        this.capacity = capacity;
        this.refillRate = refillRate; // tokens per second
        this.tokens = capacity;
        this.lastRefill = Date.now();
    }

    refill() {
        const now = Date.now();
        const elapsed = (now - this.lastRefill) / 1000; // seconds
        const tokensToAdd = elapsed * this.refillRate;
        this.tokens = Math.min(this.capacity, this.tokens + tokensToAdd);
        this.lastRefill = now;
    }

    tryConsume(tokens = 1) {
        this.refill();

        if (this.tokens >= tokens) {
            this.tokens -= tokens;
            return [true, 'Request allowed'];
        } else {
            const waitTime = (tokens - this.tokens) / this.refillRate;
            return [false, `Rate limited. Retry after ${waitTime.toFixed(1)}s`];
        }
    }

    getStatus() {
        this.refill();
        return {
            tokens: Math.floor(this.tokens),
            capacity: this.capacity,
            refillRate: this.refillRate
        };
    }
}

class PerUserRateLimiter {
    constructor(defaultCapacity = 100, defaultRate = 10) {
        this.limiters = new Map();
        this.defaultCapacity = defaultCapacity;
        this.defaultRate = defaultRate;
    }

    checkLimit(userId) {
        if (!this.limiters.has(userId)) {
            this.limiters.set(
                userId,
                new TokenBucketRateLimiter(this.defaultCapacity, this.defaultRate)
            );
        }

        const limiter = this.limiters.get(userId);
        return limiter.tryConsume(1);
    }

    setUserLimit(userId, capacity, rate) {
        this.limiters.set(userId, new TokenBucketRateLimiter(capacity, rate));
    }

    getUserStatus(userId) {
        if (!this.limiters.has(userId)) {
            return null;
        }
        return this.limiters.get(userId).getStatus();
    }
}

// Example usage
const limiter = new PerUserRateLimiter(100, 10);

// Simulate requests
for (let i = 0; i < 150; i++) {
    const user = i < 50 ? 'user-1' : 'user-2';
    const [allowed, msg] = limiter.checkLimit(user);
    if (!allowed) {
        console.log(`Request ${i} (${user}): ${msg}`);
    }
}

console.log('User-1 status:', limiter.getUserStatus('user-1'));
console.log('User-2 status:', limiter.getUserStatus('user-2'));

Rate Limiting and Throttling

TL;DR

Learning Objectives

Motivating Scenario

Core Concepts

Practical Example

When to Use vs. When NOT to Use

Patterns and Pitfalls

Design Review Checklist

Self-Check

Next Steps

References

Rate Limiting and Throttling

TL;DR​

Learning Objectives​

Motivating Scenario​

Core Concepts​

Practical Example​

When to Use vs. When NOT to Use​

Patterns and Pitfalls​

Design Review Checklist​

Self-Check​

Next Steps​

References​

TL;DR

Learning Objectives

Motivating Scenario

Core Concepts

Practical Example

When to Use vs. When NOT to Use

Patterns and Pitfalls

Design Review Checklist

Self-Check

Next Steps

References