Files
microdao-daarion/docs/MEMORY-MODULE-STATUS.md
Apple f4ccf7c570
Some checks failed
Build and Deploy Docs / build-and-deploy (push) Has been cancelled
🧠 Complete Memory Stack setup across all nodes
- NODE1: Neo4j (K8s), NVIDIA RTX 4000 + CUDA 13.1
- NODE2: Fixed Neo4j & Qdrant containers
- NODE3: Full stack (PostgreSQL + Qdrant + Neo4j)
- Updated MEMORY-MODULE-STATUS.md v2.0.0
2026-01-10 08:26:42 -08:00

12 KiB

🧠 Agent Memory Module — Status Report

Дата: 2026-01-10 Версія документа: 2.0.0 Останнє оновлення: 17:30 CET


📊 Загальний статус

Компонент NODE1 NODE2 NODE3
PostgreSQL K8s (CloudNativePG) Docker
Qdrant K8s Docker Docker
Neo4j K8s Docker Docker
Ollama v0.13.5 v0.12.11 v0.13.5
NVIDIA GPU RTX 4000 SFF Ada (Apple M4) RTX 3090
CUDA 13.1 N/A 13.0

🖥️ NODE1 — Production Server (Hetzner)

IP: 144.76.224.179 OS: Ubuntu 24.04.3 LTS Role: K8s Master (K3s), Primary Database Host

Hardware

GPU: NVIDIA RTX 4000 SFF Ada Generation (20GB VRAM)
Driver: 590.48.01
CUDA: 13.1

Memory System Components

PostgreSQL (CloudNativePG)

Status: Running (1/1)
Pod: daarion-postgres-1
Namespace: daarion
Storage: PVC-backed
Port: 5432 (internal)

Таблиці (Agent Memory Schema):

Таблиця Призначення
organizations Мультитенантність
workspaces Проєкти в організації
users Користувачі системи
agents AI агенти
conversation_threads Контекст розмов (Short-term)
conversation_events Сирий лог повідомлень (Short-term)
thread_summaries Підсумки тредів (Mid-term)
long_term_memory_items Факти, преференції (Long-term)
memory_feedback Корекції користувачів

Qdrant (Vector Database)

Status: Running (1/1)
Pod: qdrant-5d45444569-hfbzg
Namespace: qdrant
Port: 6333 (internal), 30333 (NodePort)
Collection: memories (1024-dim, Cosine)

Neo4j (Graph Database)

Status: Running (1/1)
Pod: neo4j-76f9cbbd87-nphr5
Namespace: neo4j
HTTP: 7474 (internal), 30474 (NodePort)
Bolt: 7687 (internal), 30687 (NodePort)
Auth: neo4j/DaarionNeo4j2026!
Plugins: APOC

External Secrets (Vault Integration)

postgres-credentials: SecretSynced ✅
memory-service-secrets: SecretSynced ✅

Ollama

Version: 0.13.5
Service: systemd (enabled, running)
API: http://127.0.0.1:11434
GPU: NVIDIA RTX 4000 SFF Ada (CUDA 13.1)

💻 NODE2 — MacBook M4 (Development)

Type: Apple MacBook Pro M4 OS: macOS Darwin 25.2.0 Role: Development, Local Testing

Memory System Components

PostgreSQL

Status: NOT INSTALLED
Note: Can use NODE1's PostgreSQL via SSH tunnel

Qdrant (Docker)

Container: qdrant-vector-db
Status: Running ✅
Ports: 6333-6335
Image: qdrant/qdrant:latest

Neo4j (Docker)

Container: neo4j-daarion
Status: Running ✅
HTTP: 7474
Bolt: 7687
Auth: neo4j/DaarionNeo4j2026!
Image: neo4j:5.15-community
Plugins: APOC

Ollama

Version: 0.12.11
Location: /opt/homebrew/bin/ollama

Завантажені моделі:

Model Size Modified
deepseek-r1:70b 42 GB 7 weeks ago
qwen2.5-coder:32b 19 GB 7 weeks ago
deepseek-coder:33b 18 GB 7 weeks ago
gemma2:27b 15 GB 7 weeks ago
gpt-oss:latest 13 GB 7 weeks ago
llava:13b 8.0 GB 6 weeks ago
mistral-nemo:12b 7.1 GB 7 weeks ago
phi3:latest 2.2 GB 7 weeks ago
starcoder2:3b 1.7 GB 7 weeks ago

🎮 NODE3 — AI/ML Workstation

IP: 80.77.35.151:33147 OS: Linux (Ubuntu) Role: GPU Compute, ML Inference, GitLab Host

Hardware

GPU: NVIDIA GeForce RTX 3090 (24GB VRAM)
Driver: 580.95.05
CUDA: 13.0

Memory System Components

PostgreSQL (Docker)

Container: postgres-daarion
Image: postgres:16-alpine
Status: Running ✅
Port: 5432
Database: daarion_main
Auth: postgres/DaarionPostgres2026!
Schema: Agent Memory Schema (9 tables)

Qdrant (Docker)

Container: qdrant-daarion
Image: qdrant/qdrant:v1.7.4
Status: Running ✅
Ports: 6333, 6334
Collection: memories (1024-dim, Cosine)

Neo4j (Docker)

Container: neo4j-daarion
Image: neo4j:5.15-community
Status: Running ✅
HTTP: 7474
Bolt: 7687
Auth: neo4j/DaarionNeo4j2026!
Plugins: APOC

Ollama

Version: 0.13.5
Location: /usr/local/bin/ollama
GPU: RTX 3090 (CUDA enabled)

Завантажені моделі:

Model Size Modified
qwen3:32b 20 GB 25 hours ago
llama3:latest 4.7 GB 2 days ago

🔗 Архітектура Memory Module

┌─────────────────────────────────────────────────────────────────┐
│                        AGENT MEMORY SYSTEM                       │
├─────────────────────────────────────────────────────────────────┤
│                                                                  │
│  ┌──────────────┐    ┌──────────────┐    ┌──────────────┐       │
│  │  SHORT-TERM  │    │   MID-TERM   │    │  LONG-TERM   │       │
│  │              │    │              │    │              │       │
│  │ conversation │    │   thread     │    │   memory     │       │
│  │   _events    │───▶│  _summaries  │───▶│   _items     │       │
│  │              │    │              │    │              │       │
│  │  (raw log)   │    │ (rolling     │    │ (distilled   │       │
│  │              │    │  summaries)  │    │  facts)      │       │
│  └──────────────┘    └──────────────┘    └──────────────┘       │
│         │                   │                   │                │
│         └───────────────────┼───────────────────┘                │
│                             │                                    │
│                             ▼                                    │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │                    PostgreSQL                            │    │
│  │           NODE1 (K8s) + NODE3 (Docker)                   │    │
│  └─────────────────────────────────────────────────────────┘    │
│                             │                                    │
│                             ▼                                    │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │                      Qdrant                              │    │
│  │        NODE1 (K8s) + NODE2 (Docker) + NODE3 (Docker)     │    │
│  │              Semantic Search (1024-dim)                  │    │
│  │              Cohere embed-multilingual-v3.0              │    │
│  └─────────────────────────────────────────────────────────┘    │
│                             │                                    │
│                             ▼                                    │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │                      Neo4j                               │    │
│  │        NODE1 (K8s) + NODE2 (Docker) + NODE3 (Docker)     │    │
│  │              Knowledge Graph + Relationships             │    │
│  └─────────────────────────────────────────────────────────┘    │
│                                                                  │
├─────────────────────────────────────────────────────────────────┤
│                        INFERENCE LAYER                           │
│                                                                  │
│  ┌──────────────┐    ┌──────────────┐    ┌──────────────┐       │
│  │   NODE1      │    │    NODE2     │    │    NODE3     │       │
│  │   Ollama     │    │    Ollama    │    │    Ollama    │       │
│  │ (RTX 4000)   │    │    (M4)      │    │  (RTX 3090)  │       │
│  │              │    │              │    │              │       │
│  │  20GB VRAM   │    │  9 models    │    │  24GB VRAM   │       │
│  │  CUDA 13.1   │    │  (42GB max)  │    │  CUDA 13.0   │       │
│  └──────────────┘    └──────────────┘    └──────────────┘       │
│                                                                  │
└─────────────────────────────────────────────────────────────────┘

📋 TODO / Recommendations

Виконано (2026-01-10)

  • NODE1 — Встановлено Neo4j в K8s
  • NODE1 — NVIDIA драйвери та CUDA 13.1
  • NODE2 — Виправлено Neo4j контейнер
  • NODE2 — Перезапущено Qdrant
  • NODE3 — Встановлено Qdrant
  • NODE3 — Встановлено Neo4j
  • NODE3 — Застосовано Agent Memory Schema

Рекомендовані

  • NODE1 — Завантажити базову модель в Ollama (e.g., llama3:8b)
  • Налаштувати реплікацію PostgreSQL NODE1 ↔ NODE3
  • Розгорнути Memory Service (FastAPI) в K8s
  • Інтегрувати Cohere API для автоматичного ембедингу

Опціональні

  • Налаштувати Neo4j кластер між нодами
  • Встановити pgvector для PostgreSQL
  • Налаштувати backup для всіх баз даних

🔐 Credentials Reference

Service Location Auth
PostgreSQL NODE1 K8s (daarion ns) Via Vault → External Secrets
PostgreSQL NODE3 Docker postgres/DaarionPostgres2026!
Qdrant NODE1 K8s (qdrant ns) No auth (internal)
Qdrant NODE2 Docker :6333 No auth
Qdrant NODE3 Docker :6333 No auth
Neo4j NODE1 K8s :30474/:30687 neo4j/DaarionNeo4j2026!
Neo4j NODE2 Docker :7474/:7687 neo4j/DaarionNeo4j2026!
Neo4j NODE3 Docker :7474/:7687 neo4j/DaarionNeo4j2026!
Ollama NODE1 localhost:11434 No auth
Ollama NODE2 localhost:11434 No auth
Ollama NODE3 localhost:11434 SSH tunnel required
Cohere API Memory Service nOdOXnuepLku2ipJWpe6acWgAsJCsDhMO0RnaEJB

  • infrastructure/database/agent-memory-schema.sql — PostgreSQL schema
  • infrastructure/kubernetes/apps/qdrant/deployment.yaml — Qdrant K8s config
  • infrastructure/kubernetes/neo4j/ — Neo4j K8s config
  • services/memory-service/ — FastAPI Memory Service (not deployed yet)
  • INFRASTRUCTURE.md — Main infrastructure documentation

Документ оновлено: 2026-01-10 17:30 CET