🧠 Add Agent Memory System with PostgreSQL + Qdrant + Cohere

Features: - Three-tier memory architecture (short/mid/long-term) - PostgreSQL schema for conversations, events, memories - Qdrant vector database for semantic search - Cohere embeddings (embed-multilingual-v3.0, 1024 dims) - FastAPI Memory Service with full CRUD - External Secrets integration with Vault - Kubernetes deployment manifests Components: - infrastructure/database/agent-memory-schema.sql - infrastructure/kubernetes/apps/qdrant/ - infrastructure/kubernetes/apps/memory-service/ - services/memory-service/ (FastAPI app) Also includes: - External Secrets Operator - Traefik Ingress Controller - Cert-Manager with Let's Encrypt - ArgoCD for GitOps
2026-01-10 07:52:32 -08:00
parent 12545a7c76
commit 90758facae
16 changed files with 2769 additions and 579 deletions
--- a/services/memory-service/app/vector_store.py
+++ b/services/memory-service/app/vector_store.py
@@ -0,0 +1,325 @@
+"""
+DAARION Memory Service - Qdrant Vector Store
+"""
+from typing import List, Optional, Dict, Any
+from uuid import UUID, uuid4
+import structlog
+from qdrant_client import QdrantClient
+from qdrant_client.http import models as qmodels
+
+from .config import get_settings
+from .embedding import get_query_embedding, get_document_embeddings
+from .models import MemoryCategory, QdrantPayload
+
+logger = structlog.get_logger()
+settings = get_settings()
+
+
+class VectorStore:
+    """Qdrant vector store for semantic search"""
+    
+    def __init__(self):
+        self.client = QdrantClient(
+            host=settings.qdrant_host,
+            port=settings.qdrant_port
+        )
+        self.memories_collection = settings.qdrant_collection_memories
+        self.messages_collection = settings.qdrant_collection_messages
+        
+    async def initialize(self):
+        """Initialize collections if they don't exist"""
+        await self._ensure_collection(
+            self.memories_collection,
+            settings.embedding_dimensions
+        )
+        await self._ensure_collection(
+            self.messages_collection,
+            settings.embedding_dimensions
+        )
+        logger.info("vector_store_initialized")
+        
+    async def _ensure_collection(self, name: str, dimensions: int):
+        """Create collection if it doesn't exist"""
+        collections = self.client.get_collections().collections
+        exists = any(c.name == name for c in collections)
+        
+        if not exists:
+            self.client.create_collection(
+                collection_name=name,
+                vectors_config=qmodels.VectorParams(
+                    size=dimensions,
+                    distance=qmodels.Distance.COSINE
+                )
+            )
+            
+            # Create payload indexes for filtering
+            self.client.create_payload_index(
+                collection_name=name,
+                field_name="org_id",
+                field_schema=qmodels.PayloadSchemaType.KEYWORD
+            )
+            self.client.create_payload_index(
+                collection_name=name,
+                field_name="user_id",
+                field_schema=qmodels.PayloadSchemaType.KEYWORD
+            )
+            self.client.create_payload_index(
+                collection_name=name,
+                field_name="agent_id",
+                field_schema=qmodels.PayloadSchemaType.KEYWORD
+            )
+            self.client.create_payload_index(
+                collection_name=name,
+                field_name="type",
+                field_schema=qmodels.PayloadSchemaType.KEYWORD
+            )
+            self.client.create_payload_index(
+                collection_name=name,
+                field_name="category",
+                field_schema=qmodels.PayloadSchemaType.KEYWORD
+            )
+            
+            logger.info("collection_created", name=name, dimensions=dimensions)
+            
+    async def index_memory(
+        self,
+        memory_id: UUID,
+        text: str,
+        org_id: UUID,
+        user_id: UUID,
+        category: MemoryCategory,
+        agent_id: Optional[UUID] = None,
+        workspace_id: Optional[UUID] = None,
+        thread_id: Optional[UUID] = None,
+        metadata: Dict[str, Any] = {}
+    ) -> str:
+        """
+        Index a memory item in Qdrant.
+        
+        Returns:
+            Qdrant point ID
+        """
+        # Get embedding
+        embeddings = await get_document_embeddings([text])
+        if not embeddings:
+            raise ValueError("Failed to generate embedding")
+            
+        vector = embeddings[0]
+        point_id = str(uuid4())
+        
+        # Build payload
+        payload = {
+            "org_id": str(org_id),
+            "user_id": str(user_id),
+            "memory_id": str(memory_id),
+            "type": "memory",
+            "category": category.value,
+            "text": text,
+            **metadata
+        }
+        
+        if agent_id:
+            payload["agent_id"] = str(agent_id)
+        if workspace_id:
+            payload["workspace_id"] = str(workspace_id)
+        if thread_id:
+            payload["thread_id"] = str(thread_id)
+            
+        # Upsert point
+        self.client.upsert(
+            collection_name=self.memories_collection,
+            points=[
+                qmodels.PointStruct(
+                    id=point_id,
+                    vector=vector,
+                    payload=payload
+                )
+            ]
+        )
+        
+        logger.info(
+            "memory_indexed",
+            memory_id=str(memory_id),
+            point_id=point_id,
+            category=category.value
+        )
+        
+        return point_id
+        
+    async def index_summary(
+        self,
+        summary_id: UUID,
+        text: str,
+        thread_id: UUID,
+        org_id: UUID,
+        user_id: UUID,
+        agent_id: Optional[UUID] = None,
+        workspace_id: Optional[UUID] = None
+    ) -> str:
+        """Index a thread summary"""
+        embeddings = await get_document_embeddings([text])
+        if not embeddings:
+            raise ValueError("Failed to generate embedding")
+            
+        vector = embeddings[0]
+        point_id = str(uuid4())
+        
+        payload = {
+            "org_id": str(org_id),
+            "user_id": str(user_id),
+            "thread_id": str(thread_id),
+            "summary_id": str(summary_id),
+            "type": "summary",
+            "text": text
+        }
+        
+        if agent_id:
+            payload["agent_id"] = str(agent_id)
+        if workspace_id:
+            payload["workspace_id"] = str(workspace_id)
+            
+        self.client.upsert(
+            collection_name=self.memories_collection,
+            points=[
+                qmodels.PointStruct(
+                    id=point_id,
+                    vector=vector,
+                    payload=payload
+                )
+            ]
+        )
+        
+        logger.info("summary_indexed", summary_id=str(summary_id), point_id=point_id)
+        return point_id
+        
+    async def search_memories(
+        self,
+        query: str,
+        org_id: UUID,
+        user_id: UUID,
+        agent_id: Optional[UUID] = None,
+        workspace_id: Optional[UUID] = None,
+        categories: Optional[List[MemoryCategory]] = None,
+        include_global: bool = True,
+        top_k: int = 10
+    ) -> List[Dict[str, Any]]:
+        """
+        Semantic search for memories.
+        
+        Args:
+            query: Search query
+            org_id: Organization filter
+            user_id: User filter
+            agent_id: Agent filter (None = include global)
+            workspace_id: Workspace filter
+            categories: Filter by memory categories
+            include_global: Include memories without agent_id
+            top_k: Number of results
+            
+        Returns:
+            List of results with scores
+        """
+        # Get query embedding
+        query_vector = await get_query_embedding(query)
+        if not query_vector:
+            return []
+            
+        # Build filter
+        must_conditions = [
+            qmodels.FieldCondition(
+                key="org_id",
+                match=qmodels.MatchValue(value=str(org_id))
+            ),
+            qmodels.FieldCondition(
+                key="user_id",
+                match=qmodels.MatchValue(value=str(user_id))
+            )
+        ]
+        
+        if workspace_id:
+            must_conditions.append(
+                qmodels.FieldCondition(
+                    key="workspace_id",
+                    match=qmodels.MatchValue(value=str(workspace_id))
+                )
+            )
+            
+        if categories:
+            must_conditions.append(
+                qmodels.FieldCondition(
+                    key="category",
+                    match=qmodels.MatchAny(any=[c.value for c in categories])
+                )
+            )
+            
+        # Agent filter with global option
+        if agent_id and not include_global:
+            must_conditions.append(
+                qmodels.FieldCondition(
+                    key="agent_id",
+                    match=qmodels.MatchValue(value=str(agent_id))
+                )
+            )
+        elif agent_id and include_global:
+            # Include both agent-specific and global (no agent_id)
+            # This requires a should clause
+            pass  # Will handle in separate query if needed
+            
+        search_filter = qmodels.Filter(must=must_conditions)
+        
+        # Search
+        results = self.client.search(
+            collection_name=self.memories_collection,
+            query_vector=query_vector,
+            query_filter=search_filter,
+            limit=top_k,
+            with_payload=True
+        )
+        
+        logger.info(
+            "memory_search",
+            query_preview=query[:50],
+            results_count=len(results)
+        )
+        
+        return [
+            {
+                "point_id": str(r.id),
+                "score": r.score,
+                **r.payload
+            }
+            for r in results
+        ]
+        
+    async def delete_memory(self, memory_id: UUID):
+        """Delete memory from index by memory_id"""
+        self.client.delete(
+            collection_name=self.memories_collection,
+            points_selector=qmodels.FilterSelector(
+                filter=qmodels.Filter(
+                    must=[
+                        qmodels.FieldCondition(
+                            key="memory_id",
+                            match=qmodels.MatchValue(value=str(memory_id))
+                        )
+                    ]
+                )
+            )
+        )
+        logger.info("memory_deleted_from_index", memory_id=str(memory_id))
+        
+    async def get_collection_stats(self) -> Dict[str, Any]:
+        """Get collection statistics"""
+        memories_info = self.client.get_collection(self.memories_collection)
+        
+        return {
+            "memories": {
+                "points_count": memories_info.points_count,
+                "vectors_count": memories_info.vectors_count,
+                "indexed_vectors_count": memories_info.indexed_vectors_count
+            }
+        }
+
+
+# Global instance
+vector_store = VectorStore()