Performance Internals¶

Indexing Cost Drivers¶

Driver	Effect
Chunk Size	Number of embeddings & DB rows
Overlap	Redundant text & embedding cost
Batch Size	HTTP call amortization

Aspect	Guidance
Connection Pool	Keep small (indexer short-lived)
Vector Index Lists	Increase with data volume for recall
Autovacuum	Ensure aggressive enough for large churn

Idea	Benefit
Parallel provider processing	Reduce wall-clock time
Embedding caching	Skip duplicate identical text segments
Adaptive chunk sizing	Optimize for document variance
Rerank thresholding	Trim answer prompt size