AI Agent Context¶

This document is a concise reference for LLM-based automation or code-assist tools interacting with DocDuck.

Core Components¶

Concern	Location	Key Types
Index Orchestration	`src/Indexer/MultiProviderIndexerService.cs`	`MultiProviderIndexerService`
Provider Abstraction	`src/Indexer/Providers/IDocumentProvider.cs`	`IDocumentProvider`, `ProviderDocument`
Text Extraction	`src/Indexer/Services/TextExtraction`	`TextExtractionService`, `ITextExtractor`
Embeddings & AI	`src/Providers.Shared/Ai/ModelAgnosticAiService.cs`	`ModelAgnosticAiService`
Storage	`src/Indexer/Services/VectorRepository.cs`	`VectorRepository`
Query API	`src/Api/Program.cs`	Minimal API endpoints
Search Logic	`src/Api/Services/VectorSearchService.cs`	`VectorSearchService`
Chat Orchestration	`src/Api/Services/ChatService.cs`	`ChatService`

Endpoint	Method	Purpose
`/health`	GET	Health & counts
`/providers`	GET	Active providers list
`/query`	POST	Q&A over indexed chunks
`/docsearch`	POST	Document-level search
`/chat`	POST	Conversational interface (SSE optional)

Environment variable ingestion in src/Api/Program.cs and src/Indexer/Program.cs
Provider enabling: PROVIDER_<TYPE>_ENABLED
Chunk tuning: CHUNK_SIZE, CHUNK_OVERLAP
Force reindex: FORCE_FULL_REINDEX

Area	Strategy
Alternative Embeddings	Add second client & model field in metadata
Reranking	Post-process search results before answer synthesis
Access Control	Add provider-level ACL filter in search query
Caching	Cache question embedding & top-K hits by hash