Some checks failed
Build and Deploy Docs / build-and-deploy (push) Has been cancelled
- NODE2: PostgreSQL + Agent Memory Schema ✅ - NODE3: ComfyUI installed (v0.8.2, PyTorch+CUDA) ✅ - All nodes now have full memory stack - Added critical TODOs: Memory Service & Cohere API
13 KiB
13 KiB
🧠 Agent Memory Module — Status Report
Дата: 2026-01-10 Версія документа: 2.1.0 Останнє оновлення: 18:00 CET
📊 Загальний статус
| Компонент | NODE1 | NODE2 | NODE3 |
|---|---|---|---|
| PostgreSQL | ✅ K8s (CloudNativePG) | ✅ Docker | ✅ Docker |
| ComfyUI | ❌ | ❌ | ✅ Running |
| Qdrant | ✅ K8s | ✅ Docker | ✅ Docker |
| Neo4j | ✅ K8s | ✅ Docker | ✅ Docker |
| Ollama | ✅ v0.13.5 | ✅ v0.12.11 | ✅ v0.13.5 |
| NVIDIA GPU | ✅ RTX 4000 SFF Ada | ❌ (Apple M4) | ✅ RTX 3090 |
| CUDA | ✅ 13.1 | N/A | ✅ 13.0 |
🖥️ NODE1 — Production Server (Hetzner)
IP: 144.76.224.179
OS: Ubuntu 24.04.3 LTS
Role: K8s Master (K3s), Primary Database Host
Hardware
GPU: NVIDIA RTX 4000 SFF Ada Generation (20GB VRAM)
Driver: 590.48.01
CUDA: 13.1
Memory System Components
✅ PostgreSQL (CloudNativePG)
Status: Running (1/1)
Pod: daarion-postgres-1
Namespace: daarion
Storage: PVC-backed
Port: 5432 (internal)
Таблиці (Agent Memory Schema):
| Таблиця | Призначення |
|---|---|
organizations |
Мультитенантність |
workspaces |
Проєкти в організації |
users |
Користувачі системи |
agents |
AI агенти |
conversation_threads |
Контекст розмов (Short-term) |
conversation_events |
Сирий лог повідомлень (Short-term) |
thread_summaries |
Підсумки тредів (Mid-term) |
long_term_memory_items |
Факти, преференції (Long-term) |
memory_feedback |
Корекції користувачів |
✅ Qdrant (Vector Database)
Status: Running (1/1)
Pod: qdrant-5d45444569-hfbzg
Namespace: qdrant
Port: 6333 (internal), 30333 (NodePort)
Collection: memories (1024-dim, Cosine)
✅ Neo4j (Graph Database)
Status: Running (1/1)
Pod: neo4j-76f9cbbd87-nphr5
Namespace: neo4j
HTTP: 7474 (internal), 30474 (NodePort)
Bolt: 7687 (internal), 30687 (NodePort)
Auth: neo4j/DaarionNeo4j2026!
Plugins: APOC
✅ External Secrets (Vault Integration)
postgres-credentials: SecretSynced ✅
memory-service-secrets: SecretSynced ✅
✅ Ollama
Version: 0.13.5
Service: systemd (enabled, running)
API: http://127.0.0.1:11434
GPU: NVIDIA RTX 4000 SFF Ada (CUDA 13.1)
💻 NODE2 — MacBook M4 (Development)
Type: Apple MacBook Pro M4 OS: macOS Darwin 25.2.0 Role: Development, Local Testing
Memory System Components
✅ PostgreSQL (Docker)
Container: dagi-postgres
Status: Running (healthy) ✅
Port: 5432
Database: daarion_main
Schema: Agent Memory Schema (9 tables)
✅ Qdrant (Docker)
Container: qdrant-vector-db
Status: Running ✅
Ports: 6333-6335
Image: qdrant/qdrant:latest
✅ Neo4j (Docker)
Container: neo4j-daarion
Status: Running ✅
HTTP: 7474
Bolt: 7687
Auth: neo4j/DaarionNeo4j2026!
Image: neo4j:5.15-community
Plugins: APOC
✅ Ollama
Version: 0.12.11
Location: /opt/homebrew/bin/ollama
Завантажені моделі:
| Model | Size | Modified |
|---|---|---|
| deepseek-r1:70b | 42 GB | 7 weeks ago |
| qwen2.5-coder:32b | 19 GB | 7 weeks ago |
| deepseek-coder:33b | 18 GB | 7 weeks ago |
| gemma2:27b | 15 GB | 7 weeks ago |
| gpt-oss:latest | 13 GB | 7 weeks ago |
| llava:13b | 8.0 GB | 6 weeks ago |
| mistral-nemo:12b | 7.1 GB | 7 weeks ago |
| phi3:latest | 2.2 GB | 7 weeks ago |
| starcoder2:3b | 1.7 GB | 7 weeks ago |
🎮 NODE3 — AI/ML Workstation
IP: 80.77.35.151:33147
OS: Linux (Ubuntu)
Role: GPU Compute, ML Inference, GitLab Host
Hardware
GPU: NVIDIA GeForce RTX 3090 (24GB VRAM)
Driver: 580.95.05
CUDA: 13.0
Memory System Components
✅ PostgreSQL (Docker)
Container: postgres-daarion
Image: postgres:16-alpine
Status: Running ✅
Port: 5432
Database: daarion_main
Auth: postgres/DaarionPostgres2026!
Schema: Agent Memory Schema (9 tables)
✅ Qdrant (Docker)
Container: qdrant-daarion
Image: qdrant/qdrant:v1.7.4
Status: Running ✅
Ports: 6333, 6334
Collection: memories (1024-dim, Cosine)
✅ Neo4j (Docker)
Container: neo4j-daarion
Image: neo4j:5.15-community
Status: Running ✅
HTTP: 7474
Bolt: 7687
Auth: neo4j/DaarionNeo4j2026!
Plugins: APOC
✅ Ollama
Version: 0.13.5
Location: /usr/local/bin/ollama
GPU: RTX 3090 (CUDA enabled)
Завантажені моделі:
| Model | Size | Modified |
|---|---|---|
| qwen3:32b | 20 GB | 25 hours ago |
| llama3:latest | 4.7 GB | 2 days ago |
✅ ComfyUI
Location: /home/zevs/ComfyUI
Status: Running ✅
Port: 8188
Version: 0.8.2
Frontend: 1.36.13
GPU: RTX 3090 (CUDA enabled)
Python: 3.12.3
PyTorch: 2.5.1+cu121
URL: http://80.77.35.151:8188 (via SSH tunnel)
🔗 Архітектура Memory Module
┌─────────────────────────────────────────────────────────────────┐
│ AGENT MEMORY SYSTEM │
├─────────────────────────────────────────────────────────────────┤
│ │
│ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │
│ │ SHORT-TERM │ │ MID-TERM │ │ LONG-TERM │ │
│ │ │ │ │ │ │ │
│ │ conversation │ │ thread │ │ memory │ │
│ │ _events │───▶│ _summaries │───▶│ _items │ │
│ │ │ │ │ │ │ │
│ │ (raw log) │ │ (rolling │ │ (distilled │ │
│ │ │ │ summaries) │ │ facts) │ │
│ └──────────────┘ └──────────────┘ └──────────────┘ │
│ │ │ │ │
│ └───────────────────┼───────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ PostgreSQL │ │
│ │ NODE1 (K8s) + NODE3 (Docker) │ │
│ └─────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ Qdrant │ │
│ │ NODE1 (K8s) + NODE2 (Docker) + NODE3 (Docker) │ │
│ │ Semantic Search (1024-dim) │ │
│ │ Cohere embed-multilingual-v3.0 │ │
│ └─────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ Neo4j │ │
│ │ NODE1 (K8s) + NODE2 (Docker) + NODE3 (Docker) │ │
│ │ Knowledge Graph + Relationships │ │
│ └─────────────────────────────────────────────────────────┘ │
│ │
├─────────────────────────────────────────────────────────────────┤
│ INFERENCE LAYER │
│ │
│ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │
│ │ NODE1 │ │ NODE2 │ │ NODE3 │ │
│ │ Ollama │ │ Ollama │ │ Ollama │ │
│ │ (RTX 4000) │ │ (M4) │ │ (RTX 3090) │ │
│ │ │ │ │ │ │ │
│ │ 20GB VRAM │ │ 9 models │ │ 24GB VRAM │ │
│ │ CUDA 13.1 │ │ (42GB max) │ │ CUDA 13.0 │ │
│ └──────────────┘ └──────────────┘ └──────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
📋 TODO / Recommendations
✅ Виконано (2026-01-10)
- NODE1 — Встановлено Neo4j в K8s
- NODE1 — NVIDIA драйвери та CUDA 13.1
- NODE2 — Виправлено Neo4j контейнер
- NODE2 — Перезапущено Qdrant
- NODE2 — Застосовано Agent Memory Schema
- NODE3 — Встановлено Qdrant
- NODE3 — Встановлено Neo4j
- NODE3 — Застосовано Agent Memory Schema
- NODE3 — Встановлено ComfyUI (v0.8.2, PyTorch+CUDA)
🔴 Критичні (НЕ ЗРОБЛЕНО)
- Запустити Memory Service (FastAPI) на всіх нодах
- Налаштувати Cohere API для embeddings (ключ:
nOdOXnuepLku2ipJWpe6acWgAsJCsDhMO0RnaEJB)
Рекомендовані
- NODE1 — Завантажити базову модель в Ollama (e.g.,
llama3:8b) - Налаштувати реплікацію PostgreSQL NODE1 ↔ NODE3
- Створити systemd service для ComfyUI на NODE3
Опціональні
- Налаштувати Neo4j кластер між нодами
- Встановити pgvector для PostgreSQL
- Налаштувати backup для всіх баз даних
🔐 Credentials Reference
| Service | Location | Auth |
|---|---|---|
| PostgreSQL NODE1 | K8s (daarion ns) | Via Vault → External Secrets |
| PostgreSQL NODE2 | Docker :5432 | postgres (local) |
| PostgreSQL NODE3 | Docker :5432 | postgres/DaarionPostgres2026! |
| ComfyUI NODE3 | :8188 | No auth (SSH tunnel) |
| Qdrant NODE1 | K8s (qdrant ns) | No auth (internal) |
| Qdrant NODE2 | Docker :6333 | No auth |
| Qdrant NODE3 | Docker :6333 | No auth |
| Neo4j NODE1 | K8s :30474/:30687 | neo4j/DaarionNeo4j2026! |
| Neo4j NODE2 | Docker :7474/:7687 | neo4j/DaarionNeo4j2026! |
| Neo4j NODE3 | Docker :7474/:7687 | neo4j/DaarionNeo4j2026! |
| Ollama NODE1 | localhost:11434 | No auth |
| Ollama NODE2 | localhost:11434 | No auth |
| Ollama NODE3 | localhost:11434 | SSH tunnel required |
| Cohere API | Memory Service | nOdOXnuepLku2ipJWpe6acWgAsJCsDhMO0RnaEJB |
📁 Related Files
infrastructure/database/agent-memory-schema.sql— PostgreSQL schemainfrastructure/kubernetes/apps/qdrant/deployment.yaml— Qdrant K8s configinfrastructure/kubernetes/neo4j/— Neo4j K8s configservices/memory-service/— FastAPI Memory Service (not deployed yet)INFRASTRUCTURE.md— Main infrastructure documentation
Документ оновлено: 2026-01-10 17:30 CET