# ๐Ÿง  Agent Memory Module โ€” Status Report **ะ”ะฐั‚ะฐ:** 2026-01-10 **ะ’ะตั€ัั–ั ะดะพะบัƒะผะตะฝั‚ะฐ:** 2.0.0 **ะžัั‚ะฐะฝะฝั” ะพะฝะพะฒะปะตะฝะฝั:** 17:30 CET --- ## ๐Ÿ“Š ะ—ะฐะณะฐะปัŒะฝะธะน ัั‚ะฐั‚ัƒั | ะšะพะผะฟะพะฝะตะฝั‚ | NODE1 | NODE2 | NODE3 | |-----------|:-----:|:-----:|:-----:| | **PostgreSQL** | โœ… K8s (CloudNativePG) | โŒ | โœ… Docker | | **Qdrant** | โœ… K8s | โœ… Docker | โœ… Docker | | **Neo4j** | โœ… K8s | โœ… Docker | โœ… Docker | | **Ollama** | โœ… v0.13.5 | โœ… v0.12.11 | โœ… v0.13.5 | | **NVIDIA GPU** | โœ… RTX 4000 SFF Ada | โŒ (Apple M4) | โœ… RTX 3090 | | **CUDA** | โœ… 13.1 | N/A | โœ… 13.0 | --- ## ๐Ÿ–ฅ๏ธ NODE1 โ€” Production Server (Hetzner) **IP:** `144.76.224.179` **OS:** Ubuntu 24.04.3 LTS **Role:** K8s Master (K3s), Primary Database Host ### Hardware ``` GPU: NVIDIA RTX 4000 SFF Ada Generation (20GB VRAM) Driver: 590.48.01 CUDA: 13.1 ``` ### Memory System Components #### โœ… PostgreSQL (CloudNativePG) ``` Status: Running (1/1) Pod: daarion-postgres-1 Namespace: daarion Storage: PVC-backed Port: 5432 (internal) ``` **ะขะฐะฑะปะธั†ั– (Agent Memory Schema):** | ะขะฐะฑะปะธั†ั | ะŸั€ะธะทะฝะฐั‡ะตะฝะฝั | |---------|-------------| | `organizations` | ะœัƒะปัŒั‚ะธั‚ะตะฝะฐะฝั‚ะฝั–ัั‚ัŒ | | `workspaces` | ะŸั€ะพั”ะบั‚ะธ ะฒ ะพั€ะณะฐะฝั–ะทะฐั†ั–ั— | | `users` | ะšะพั€ะธัั‚ัƒะฒะฐั‡ั– ัะธัั‚ะตะผะธ | | `agents` | AI ะฐะณะตะฝั‚ะธ | | `conversation_threads` | ะšะพะฝั‚ะตะบัั‚ ั€ะพะทะผะพะฒ (Short-term) | | `conversation_events` | ะกะธั€ะธะน ะปะพะณ ะฟะพะฒั–ะดะพะผะปะตะฝัŒ (Short-term) | | `thread_summaries` | ะŸั–ะดััƒะผะบะธ ั‚ั€ะตะดั–ะฒ (Mid-term) | | `long_term_memory_items` | ะคะฐะบั‚ะธ, ะฟั€ะตั„ะตั€ะตะฝั†ั–ั— (Long-term) | | `memory_feedback` | ะšะพั€ะตะบั†ั–ั— ะบะพั€ะธัั‚ัƒะฒะฐั‡ั–ะฒ | #### โœ… Qdrant (Vector Database) ``` Status: Running (1/1) Pod: qdrant-5d45444569-hfbzg Namespace: qdrant Port: 6333 (internal), 30333 (NodePort) Collection: memories (1024-dim, Cosine) ``` #### โœ… Neo4j (Graph Database) ``` Status: Running (1/1) Pod: neo4j-76f9cbbd87-nphr5 Namespace: neo4j HTTP: 7474 (internal), 30474 (NodePort) Bolt: 7687 (internal), 30687 (NodePort) Auth: neo4j/DaarionNeo4j2026! Plugins: APOC ``` #### โœ… External Secrets (Vault Integration) ``` postgres-credentials: SecretSynced โœ… memory-service-secrets: SecretSynced โœ… ``` #### โœ… Ollama ``` Version: 0.13.5 Service: systemd (enabled, running) API: http://127.0.0.1:11434 GPU: NVIDIA RTX 4000 SFF Ada (CUDA 13.1) ``` --- ## ๐Ÿ’ป NODE2 โ€” MacBook M4 (Development) **Type:** Apple MacBook Pro M4 **OS:** macOS Darwin 25.2.0 **Role:** Development, Local Testing ### Memory System Components #### โŒ PostgreSQL ``` Status: NOT INSTALLED Note: Can use NODE1's PostgreSQL via SSH tunnel ``` #### โœ… Qdrant (Docker) ``` Container: qdrant-vector-db Status: Running โœ… Ports: 6333-6335 Image: qdrant/qdrant:latest ``` #### โœ… Neo4j (Docker) ``` Container: neo4j-daarion Status: Running โœ… HTTP: 7474 Bolt: 7687 Auth: neo4j/DaarionNeo4j2026! Image: neo4j:5.15-community Plugins: APOC ``` #### โœ… Ollama ``` Version: 0.12.11 Location: /opt/homebrew/bin/ollama ``` **ะ—ะฐะฒะฐะฝั‚ะฐะถะตะฝั– ะผะพะดะตะปั–:** | Model | Size | Modified | |-------|------|----------| | deepseek-r1:70b | 42 GB | 7 weeks ago | | qwen2.5-coder:32b | 19 GB | 7 weeks ago | | deepseek-coder:33b | 18 GB | 7 weeks ago | | gemma2:27b | 15 GB | 7 weeks ago | | gpt-oss:latest | 13 GB | 7 weeks ago | | llava:13b | 8.0 GB | 6 weeks ago | | mistral-nemo:12b | 7.1 GB | 7 weeks ago | | phi3:latest | 2.2 GB | 7 weeks ago | | starcoder2:3b | 1.7 GB | 7 weeks ago | --- ## ๐ŸŽฎ NODE3 โ€” AI/ML Workstation **IP:** `80.77.35.151:33147` **OS:** Linux (Ubuntu) **Role:** GPU Compute, ML Inference, GitLab Host ### Hardware ``` GPU: NVIDIA GeForce RTX 3090 (24GB VRAM) Driver: 580.95.05 CUDA: 13.0 ``` ### Memory System Components #### โœ… PostgreSQL (Docker) ``` Container: postgres-daarion Image: postgres:16-alpine Status: Running โœ… Port: 5432 Database: daarion_main Auth: postgres/DaarionPostgres2026! Schema: Agent Memory Schema (9 tables) ``` #### โœ… Qdrant (Docker) ``` Container: qdrant-daarion Image: qdrant/qdrant:v1.7.4 Status: Running โœ… Ports: 6333, 6334 Collection: memories (1024-dim, Cosine) ``` #### โœ… Neo4j (Docker) ``` Container: neo4j-daarion Image: neo4j:5.15-community Status: Running โœ… HTTP: 7474 Bolt: 7687 Auth: neo4j/DaarionNeo4j2026! Plugins: APOC ``` #### โœ… Ollama ``` Version: 0.13.5 Location: /usr/local/bin/ollama GPU: RTX 3090 (CUDA enabled) ``` **ะ—ะฐะฒะฐะฝั‚ะฐะถะตะฝั– ะผะพะดะตะปั–:** | Model | Size | Modified | |-------|------|----------| | qwen3:32b | 20 GB | 25 hours ago | | llama3:latest | 4.7 GB | 2 days ago | --- ## ๐Ÿ”— ะั€ั…ั–ั‚ะตะบั‚ัƒั€ะฐ Memory Module ``` โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”‚ AGENT MEMORY SYSTEM โ”‚ โ”œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ค โ”‚ โ”‚ โ”‚ โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”‚ โ”‚ โ”‚ SHORT-TERM โ”‚ โ”‚ MID-TERM โ”‚ โ”‚ LONG-TERM โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ conversation โ”‚ โ”‚ thread โ”‚ โ”‚ memory โ”‚ โ”‚ โ”‚ โ”‚ _events โ”‚โ”€โ”€โ”€โ–ถโ”‚ _summaries โ”‚โ”€โ”€โ”€โ–ถโ”‚ _items โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ (raw log) โ”‚ โ”‚ (rolling โ”‚ โ”‚ (distilled โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ summaries) โ”‚ โ”‚ facts) โ”‚ โ”‚ โ”‚ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ–ผ โ”‚ โ”‚ โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”‚ โ”‚ โ”‚ PostgreSQL โ”‚ โ”‚ โ”‚ โ”‚ NODE1 (K8s) + NODE3 (Docker) โ”‚ โ”‚ โ”‚ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ–ผ โ”‚ โ”‚ โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”‚ โ”‚ โ”‚ Qdrant โ”‚ โ”‚ โ”‚ โ”‚ NODE1 (K8s) + NODE2 (Docker) + NODE3 (Docker) โ”‚ โ”‚ โ”‚ โ”‚ Semantic Search (1024-dim) โ”‚ โ”‚ โ”‚ โ”‚ Cohere embed-multilingual-v3.0 โ”‚ โ”‚ โ”‚ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ–ผ โ”‚ โ”‚ โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”‚ โ”‚ โ”‚ Neo4j โ”‚ โ”‚ โ”‚ โ”‚ NODE1 (K8s) + NODE2 (Docker) + NODE3 (Docker) โ”‚ โ”‚ โ”‚ โ”‚ Knowledge Graph + Relationships โ”‚ โ”‚ โ”‚ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ”‚ โ”‚ โ”‚ โ”œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ค โ”‚ INFERENCE LAYER โ”‚ โ”‚ โ”‚ โ”‚ โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”‚ โ”‚ โ”‚ NODE1 โ”‚ โ”‚ NODE2 โ”‚ โ”‚ NODE3 โ”‚ โ”‚ โ”‚ โ”‚ Ollama โ”‚ โ”‚ Ollama โ”‚ โ”‚ Ollama โ”‚ โ”‚ โ”‚ โ”‚ (RTX 4000) โ”‚ โ”‚ (M4) โ”‚ โ”‚ (RTX 3090) โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ โ”‚ 20GB VRAM โ”‚ โ”‚ 9 models โ”‚ โ”‚ 24GB VRAM โ”‚ โ”‚ โ”‚ โ”‚ CUDA 13.1 โ”‚ โ”‚ (42GB max) โ”‚ โ”‚ CUDA 13.0 โ”‚ โ”‚ โ”‚ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ”‚ โ”‚ โ”‚ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ ``` --- ## ๐Ÿ“‹ TODO / Recommendations ### โœ… ะ’ะธะบะพะฝะฐะฝะพ (2026-01-10) - [x] **NODE1** โ€” ะ’ัั‚ะฐะฝะพะฒะปะตะฝะพ Neo4j ะฒ K8s - [x] **NODE1** โ€” NVIDIA ะดั€ะฐะนะฒะตั€ะธ ั‚ะฐ CUDA 13.1 - [x] **NODE2** โ€” ะ’ะธะฟั€ะฐะฒะปะตะฝะพ Neo4j ะบะพะฝั‚ะตะนะฝะตั€ - [x] **NODE2** โ€” ะŸะตั€ะตะทะฐะฟัƒั‰ะตะฝะพ Qdrant - [x] **NODE3** โ€” ะ’ัั‚ะฐะฝะพะฒะปะตะฝะพ Qdrant - [x] **NODE3** โ€” ะ’ัั‚ะฐะฝะพะฒะปะตะฝะพ Neo4j - [x] **NODE3** โ€” ะ—ะฐัั‚ะพัะพะฒะฐะฝะพ Agent Memory Schema ### ะ ะตะบะพะผะตะฝะดะพะฒะฐะฝั– - [ ] **NODE1** โ€” ะ—ะฐะฒะฐะฝั‚ะฐะถะธั‚ะธ ะฑะฐะทะพะฒัƒ ะผะพะดะตะปัŒ ะฒ Ollama (e.g., `llama3:8b`) - [ ] ะะฐะปะฐัˆั‚ัƒะฒะฐั‚ะธ ั€ะตะฟะปั–ะบะฐั†ั–ัŽ PostgreSQL NODE1 โ†” NODE3 - [ ] ะ ะพะทะณะพั€ะฝัƒั‚ะธ Memory Service (FastAPI) ะฒ K8s - [ ] ะ†ะฝั‚ะตะณั€ัƒะฒะฐั‚ะธ Cohere API ะดะปั ะฐะฒั‚ะพะผะฐั‚ะธั‡ะฝะพะณะพ ะตะผะฑะตะดะธะฝะณัƒ ### ะžะฟั†ั–ะพะฝะฐะปัŒะฝั– - [ ] ะะฐะปะฐัˆั‚ัƒะฒะฐั‚ะธ Neo4j ะบะปะฐัั‚ะตั€ ะผั–ะถ ะฝะพะดะฐะผะธ - [ ] ะ’ัั‚ะฐะฝะพะฒะธั‚ะธ pgvector ะดะปั PostgreSQL - [ ] ะะฐะปะฐัˆั‚ัƒะฒะฐั‚ะธ backup ะดะปั ะฒัั–ั… ะฑะฐะท ะดะฐะฝะธั… --- ## ๐Ÿ” Credentials Reference | Service | Location | Auth | |---------|----------|------| | PostgreSQL NODE1 | K8s (daarion ns) | Via Vault โ†’ External Secrets | | PostgreSQL NODE3 | Docker | postgres/DaarionPostgres2026! | | Qdrant NODE1 | K8s (qdrant ns) | No auth (internal) | | Qdrant NODE2 | Docker :6333 | No auth | | Qdrant NODE3 | Docker :6333 | No auth | | Neo4j NODE1 | K8s :30474/:30687 | neo4j/DaarionNeo4j2026! | | Neo4j NODE2 | Docker :7474/:7687 | neo4j/DaarionNeo4j2026! | | Neo4j NODE3 | Docker :7474/:7687 | neo4j/DaarionNeo4j2026! | | Ollama NODE1 | localhost:11434 | No auth | | Ollama NODE2 | localhost:11434 | No auth | | Ollama NODE3 | localhost:11434 | SSH tunnel required | | Cohere API | Memory Service | nOdOXnuepLku2ipJWpe6acWgAsJCsDhMO0RnaEJB | --- ## ๐Ÿ“ Related Files - `infrastructure/database/agent-memory-schema.sql` โ€” PostgreSQL schema - `infrastructure/kubernetes/apps/qdrant/deployment.yaml` โ€” Qdrant K8s config - `infrastructure/kubernetes/neo4j/` โ€” Neo4j K8s config - `services/memory-service/` โ€” FastAPI Memory Service (not deployed yet) - `INFRASTRUCTURE.md` โ€” Main infrastructure documentation --- *ะ”ะพะบัƒะผะตะฝั‚ ะพะฝะพะฒะปะตะฝะพ: 2026-01-10 17:30 CET*