AI Design Patterns Quick Reference

Quick lookup for common patterns. See individual chapters for detailed implementation.

Retrieval Patterns

Pattern	Use Case	Key Tradeoff
Basic RAG	Simple Q&A over documents	Easy to implement, limited accuracy
Hybrid Search	Combining semantic + keyword	Better recall, more complexity
Reranking	High-precision retrieval	Accuracy vs latency
Query Expansion	Ambiguous queries	Better recall, more tokens
HyDE	No direct matches expected	Creative, but can hallucinate
Parent-Child Chunking	Need surrounding context	Memory overhead

Query → Embed → Vector Search → Rerank → Top-K → Generate
              ↓
         BM25 Search ─────────┘ (hybrid)

Generation Patterns

Pattern	Use Case	Key Tradeoff
Zero-Shot	Simple tasks	Fast, less reliable
Few-Shot	Need format control	Token cost
Chain-of-Thought	Reasoning tasks	Latency, shows work
Self-Consistency	High-stakes answers	3-5x cost
Structured Output	API responses	Constrained creativity

Agent Patterns

Pattern	Use Case	Complexity
ReAct	Tool-using agents	Medium
Plan-and-Execute	Multi-step tasks	High
Multi-Agent Debate	Verification	High
Human-in-the-Loop	High-stakes actions	Medium

┌─────────────────────────────────────────┐
│              REACT LOOP                  │
│                                         │
│  Observe → Think → Act → Observe → ...  │
│              ↓                          │
│         [Tool Call]                     │
│              ↓                          │
│         [Result]                        │
└─────────────────────────────────────────┘

Reliability Patterns

Pattern	Problem Solved	Implementation
Retry with Backoff	Transient failures	Exponential backoff
Circuit Breaker	Cascading failures	Fail-fast after threshold
Fallback Model	Primary unavailable	Secondary model
Timeout	Slow responses	Cancel + fallback
Bulkhead	Resource isolation	Separate pools

# Reliability stack
@circuit_breaker(failure_threshold=5)
@retry(max_attempts=3, backoff=exponential)
@timeout(seconds=30)
@fallback(model="gpt-4o-mini")
async def generate(prompt):
    return await primary_model.generate(prompt)

Caching Patterns

Pattern	Hit Rate	Use Case
Exact Match	Low	Identical queries
Semantic Cache	Medium	Similar queries
KV Cache	High	Same prefix
Response Cache	Varies	Deterministic outputs

Security Patterns

Pattern	Threat	Implementation
Input Validation	Prompt injection	Sanitize, detect
Output Filtering	Data leakage	PII detection, blocklists
Tenant Isolation	Cross-tenant access	Filter at query time
Rate Limiting	Abuse	Per-user/tenant limits

Input → Validate → Sanitize → LLM → Filter → Validate → Output

Evaluation Patterns

Pattern	Use Case	Metrics
Golden Set	Regression testing	Pass rate
LLM-as-Judge	Quality scoring	1-5 scale
Human Eval	Ground truth	Agreement rate
A/B Testing	Production comparison	User metrics

Cost Optimization Patterns

Pattern	Savings	Tradeoff
Model Routing	50-70%	Complexity
Caching	20-40%	Staleness
Prompt Compression	10-30%	Quality risk
Batch Processing	30-50%	Latency

Query → Classify → Route → [Small Model] or [Large Model]
                      ↓
              [Cheap: 80%]  [Expensive: 20%]

Anti-Patterns to Avoid

Anti-Pattern	Problem	Better Approach
Context Stuffing	Token waste	Retrieve relevant only
Retry Forever	Resource exhaustion	Circuit breaker
Trust All Output	Hallucination	Verify, ground
Single Model	Single point of failure	Multi-provider
No Observability	Blind debugging	Trace everything

Pattern Selection Guide

Starting a new project?

Begin with Basic RAG
Add reranking when precision matters
Add hybrid search for keyword-heavy content

Need reliability?

Start with retry + timeout
Add circuit breaker for external calls
Add fallback models for critical paths

Cost concerns?

Implement semantic caching first
Add model routing for query complexity
Batch where latency allows

See 15-ai-design-patterns/ for detailed implementations

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

AI Design Patterns Quick Reference

Retrieval Patterns

Generation Patterns

Agent Patterns

Reliability Patterns

Caching Patterns

Security Patterns

Evaluation Patterns

Cost Optimization Patterns

Anti-Patterns to Avoid

Pattern Selection Guide

FilesExpand file tree

PATTERNS.md

Latest commit

History

PATTERNS.md

File metadata and controls

AI Design Patterns Quick Reference

Retrieval Patterns

Generation Patterns

Agent Patterns

Reliability Patterns

Caching Patterns

Security Patterns

Evaluation Patterns

Cost Optimization Patterns

Anti-Patterns to Avoid

Pattern Selection Guide