- matrix-gateway: POST /internal/matrix/presence/online endpoint - usePresenceHeartbeat hook with activity tracking - Auto away after 5 min inactivity - Offline on page close/visibility change - Integrated in MatrixChatRoom component
320 lines
11 KiB
Markdown
320 lines
11 KiB
Markdown
# 📊 Детальний звіт по роботі НОДА1
|
||
|
||
**Дата:** 2025-01-27
|
||
**Нода:** node-1-hetzner-gex44
|
||
**IP:** 144.76.224.179
|
||
**Статус:** ⚠️ Деградовано (5 проблемних сервісів)
|
||
|
||
---
|
||
|
||
## 📈 Загальна статистика
|
||
|
||
### Контейнери
|
||
- **Всього:** 20 контейнерів
|
||
- **Healthy:** 13 контейнерів ✅
|
||
- **Running:** 4 контейнери ✅
|
||
- **Restarting:** 3 контейнери ⚠️
|
||
- **Unhealthy:** 2 контейнери ❌
|
||
|
||
### Системні метрики
|
||
- **CPU:** 85.3% (високе навантаження) ⚠️
|
||
- **Основна причина:** Ollama використовує CPU (1583% multi-core)
|
||
- **Рішення:** ✅ GPU доступний (NVIDIA RTX 4000 SFF Ada)
|
||
- **Оптимізація:** Увімкнути GPU для Ollama → CPU знизиться до 40-50%
|
||
- **GPU:** NVIDIA RTX 4000 SFF Ada (20GB VRAM)
|
||
- **Використання:** 2246 MiB / 20475 MiB (11%)
|
||
- **Utilization:** 0% (не використовується Ollama!)
|
||
- **Температура:** 47°C
|
||
- **Пам'ять:** 17.4% (2.4 GB / 62.58 GB)
|
||
- **Диск:** 14% використано
|
||
- **Мережа:** Активна
|
||
|
||
### Агенти
|
||
- **Всього агентів:** 14
|
||
- **Активних:** 14
|
||
- **Telegram ботів:** 10 (8 активних, 2 потребують токенів)
|
||
|
||
### Бази даних
|
||
- **PostgreSQL:** ✅ Healthy (порт 5432)
|
||
- **Neo4j:** ✅ Healthy (порти 7474, 7687)
|
||
- **Qdrant:** ✅ Running (порт 6333)
|
||
- **Redis:** ⚠️ Не видно в списку
|
||
|
||
---
|
||
|
||
## ✅ Працюючі сервіси (13)
|
||
|
||
### Core Services
|
||
1. **DAGI Router** (порт 9102)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 23 хвилини
|
||
- Призначення: Core routing service
|
||
- API: `/health` ✅, `/providers` ✅, `/api/agents` ❌ (404)
|
||
|
||
2. **Swapper Service** (порт 8890)
|
||
- Статус: ✅ Running
|
||
- Uptime: 18 годин
|
||
- Призначення: Dynamic LLM loading/unloading
|
||
|
||
3. **Gateway** (порт 9300)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 10 годин
|
||
- Призначення: Telegram bots gateway
|
||
|
||
4. **DevTools** (порт 8008)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 2 дні
|
||
- Призначення: Development tools backend
|
||
|
||
5. **CrewAI** (порт 9010)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 2 дні
|
||
- Призначення: CrewAI orchestrator
|
||
|
||
6. **RBAC** (порт 9200)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 2 дні
|
||
- Призначення: Role-based access control
|
||
|
||
7. **Parser Service** (порт 9400)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 2 дні
|
||
- Призначення: Document parsing (OCR, Playwright)
|
||
|
||
### Database Services
|
||
8. **PostgreSQL** (порт 5432)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 12 годин
|
||
- Призначення: Основна БД (пам'ять агентів, контекст)
|
||
- ⚠️ Проблема: Відсутній pgvector extension (виправлено)
|
||
|
||
9. **Neo4j** (порти 7474, 7687)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 13 годин
|
||
- Призначення: Graph database (знання, зв'язки)
|
||
|
||
10. **Neo4j Exporter** (порт 9108)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 13 годин
|
||
- Призначення: Prometheus exporter for Neo4j
|
||
|
||
11. **Qdrant** (порти 6333, 6334)
|
||
- Статус: ✅ Running
|
||
- Uptime: 2 дні
|
||
- Призначення: Vector database (embeddings)
|
||
|
||
### Infrastructure Services
|
||
12. **NATS** (порт 4222)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 19 годин
|
||
- Призначення: NATS JetStream message bus
|
||
|
||
13. **Prometheus** (порт 9090)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 2 дні
|
||
- Призначення: Metrics collection
|
||
|
||
14. **Node Registry** (порт 9205)
|
||
- Статус: ✅ Healthy
|
||
- Uptime: 12 годин
|
||
- Призначення: Node registry service
|
||
|
||
---
|
||
|
||
## ⚠️ Проблемні сервіси (5)
|
||
|
||
### Критичні проблеми (3)
|
||
|
||
1. **Memory Service** (порт 8000)
|
||
- Статус: ⚠️ Restarting
|
||
- Проблема: Постійні перезапуски
|
||
- Помилка: `type "vector" does not exist` (PostgreSQL pgvector extension)
|
||
- **Виправлення:** ✅ Встановлено pgvector extension
|
||
- Пріоритет: 🔴 Critical
|
||
- Дії: Перезапущено, перевіряється стабільність
|
||
|
||
2. **RAG Service** (порт 9500)
|
||
- Статус: ⚠️ Restarting
|
||
- Проблема: Постійні перезапуски
|
||
- Помилка: `ModuleNotFoundError: No module named 'haystack'`
|
||
- Пріоритет: 🔴 Critical
|
||
- Дії: Потрібно встановити haystack в requirements.txt та перебудувати образ
|
||
|
||
3. **Grafana** (порт 3000)
|
||
- Статус: ⚠️ Restarting
|
||
- Проблема: Постійні перезапуски
|
||
- Помилка: `404: Plugin not found` (neo4j-datasource)
|
||
- Пріоритет: 🔴 Critical
|
||
- Дії: Потрібно видалити неіснуючий плагін з конфігурації Grafana
|
||
|
||
### Не критичні проблеми (2)
|
||
|
||
4. **STT Service** (порт 9401)
|
||
- Статус: ❌ Unhealthy
|
||
- Проблема: Health check fails
|
||
- Uptime: 19 годин
|
||
- Пріоритет: 🟡 Non-critical
|
||
- Дії: Перевірити health check endpoint та конфігурацію
|
||
|
||
5. **Image Gen** (порт 9600)
|
||
- Статус: ❌ Unhealthy
|
||
- Проблема: Health check fails
|
||
- Uptime: 19 годин
|
||
- Пріоритет: 🟡 Non-critical
|
||
- Дії: Перевірити health check endpoint та конфігурацію
|
||
|
||
---
|
||
|
||
## 🔧 Виправлення помилок
|
||
|
||
### ✅ Виконано
|
||
|
||
1. **PostgreSQL pgvector Extension**
|
||
- Проблема: Memory Service не міг створити таблицю з типом VECTOR
|
||
- Рішення: Виконано `CREATE EXTENSION IF NOT EXISTS vector;`
|
||
- Статус: ✅ Виправлено
|
||
|
||
### 🔄 В процесі
|
||
|
||
1. **RAG Service - haystack module**
|
||
- Проблема: Відсутній модуль haystack
|
||
- Рішення: Потрібно додати до requirements.txt та перебудувати образ
|
||
- Статус: 🔄 Очікує виправлення
|
||
|
||
2. **Grafana - neo4j-datasource plugin**
|
||
- Проблема: Плагін не знайдено (404)
|
||
- Рішення: Видалити з конфігурації Grafana або встановити правильний плагін
|
||
- Статус: 🔄 Очікує виправлення
|
||
|
||
### 📋 Планується
|
||
|
||
1. **STT Service health check**
|
||
- Перевірити health check endpoint
|
||
- Оновити конфігурацію якщо потрібно
|
||
|
||
2. **Image Gen health check**
|
||
- Перевірити health check endpoint
|
||
- Оновити конфігурацію якщо потрібно
|
||
|
||
---
|
||
|
||
## 📊 API Endpoints
|
||
|
||
### Router API (порт 9102)
|
||
- ✅ `/health` - Healthy
|
||
- ✅ `/providers` - 21 провайдер доступний
|
||
- ❌ `/api/agents` - 404 Not Found (endpoint не існує)
|
||
|
||
**Примітка:** Router не має `/api/agents` endpoint. Агенти конфігуруються через `router-config.yml`.
|
||
|
||
### Інші API
|
||
- Swapper Service: `http://144.76.224.179:8890` ✅
|
||
- Gateway: `http://144.76.224.179:9300` ✅
|
||
- DevTools: `http://144.76.224.179:8008` ✅
|
||
- CrewAI: `http://144.76.224.179:9010` ✅
|
||
- RBAC: `http://144.76.224.179:9200` ✅
|
||
- Parser Service: `http://144.76.224.179:9400` ✅
|
||
|
||
---
|
||
|
||
## 🤖 Агенти на НОДА1
|
||
|
||
### Core Agents (6)
|
||
1. **Daarwizz** - Main User Interface Agent
|
||
2. **DevTools** - Development Assistant
|
||
3. **Greenfood** - GREENFOOD ERP Agent
|
||
4. **Helion** - Energy Union Agent
|
||
5. **CTO** - Chief Technology Officer
|
||
6. **Parser** - Document Parser Agent
|
||
|
||
### Orchestrator Agents (2)
|
||
7. **MicroDAO Orchestrator** - Multi-agent workflow coordinator
|
||
8. **CrewAI** - CrewAI orchestrator
|
||
|
||
### Special Agents (6)
|
||
9. **Monitor** - System monitoring agent
|
||
10. **Soul** - Spiritual Guide
|
||
11. **CLAN** - Chief Leadership Agent Navigator
|
||
12. **DRUID** - Cosmetic Chemistry Expert
|
||
13. **EONARCH** - Consciousness Evolution
|
||
14. **Яромир** - Multi-Dimensional Orchestrator (з командою: Вождь, Проводник, Домир, Создатель)
|
||
|
||
---
|
||
|
||
## 📱 Telegram боти
|
||
|
||
### Активні (8)
|
||
1. **DAARWIZZ** (@DAARWIZZBot) - qwen3:8b
|
||
2. **Helion** (@HelionEnergyBot) - qwen3:8b
|
||
3. **GREENFOOD** - qwen3:8b
|
||
4. **CLAN** (@clan_bot) - DeepSeek
|
||
5. **Soul** (@soul_bot) - qwen3:8b
|
||
6. **DRUID** (@druid_bot) - qwen3:8b
|
||
7. **EONARCH** (@eonarch_bot) - DeepSeek
|
||
8. **Яромир** (@yaromir_bot) - qwen3:8b / DeepSeek
|
||
|
||
### Потребують токенів (2)
|
||
9. **NUTRA** - Потрібен Telegram токен
|
||
10. **Dario** - Потрібен Discord токен
|
||
|
||
---
|
||
|
||
## 💾 Ollama моделі
|
||
|
||
### Встановлені (5)
|
||
1. **qwen3:8b** - 5.2 GB (Main conversational model)
|
||
2. **qwen3-vl:8b** - 6.1 GB (Vision-language model)
|
||
3. **qwen2-math:7b** - 4.4 GB (Mathematical calculations)
|
||
4. **qwen2.5:3b-instruct-q4_K_M** - 1.9 GB (Function calling, JSON reasoning)
|
||
5. **qwen2.5:7b-instruct-q4_K_M** - 4.7 GB (RAG, translation, security)
|
||
|
||
### Потрібні (3)
|
||
1. **qwen2.5:14b** - ~8 GB (Vozhd, Sozdatel)
|
||
2. **qwen2.5:7b** - ~4.5 GB (Provodnik)
|
||
3. **qwen2.5:3b** - ~2 GB (Domir)
|
||
|
||
---
|
||
|
||
## 🎯 Рекомендації
|
||
|
||
### Термінові дії
|
||
1. ✅ Виправити Memory Service (pgvector extension) - **ВИКОНАНО**
|
||
2. 🔄 Виправити RAG Service (додати haystack)
|
||
3. 🔄 Виправити Grafana (видалити неіснуючий плагін)
|
||
|
||
### Не термінові дії
|
||
1. Перевірити STT Service health check
|
||
2. Перевірити Image Gen health check
|
||
3. Встановити відсутні Ollama моделі для команди Яромира
|
||
|
||
### Оптимізація
|
||
1. CPU навантаження 85.3% - високе, перевірити процеси
|
||
2. PostgreSQL використовує 1706% CPU (multi-core) - нормально для бази даних
|
||
3. Memory використання 17.4% - низьке, можна додати більше сервісів
|
||
|
||
---
|
||
|
||
## 📝 Висновок
|
||
|
||
**Загальний стан:** ⚠️ Деградовано
|
||
|
||
**Працюючі сервіси:** 13/18 (72%)
|
||
**Проблемні сервіси:** 5/18 (28%)
|
||
|
||
**Основні проблеми:**
|
||
- 3 критичні сервіси перезапускаються (Memory, RAG, Grafana)
|
||
- 2 не критичні сервіси мають проблеми з health check (STT, Image Gen)
|
||
|
||
**Прогрес виправлення:**
|
||
- ✅ 1/5 проблем виправлено (Memory Service - pgvector)
|
||
- 🔄 2/5 проблем в процесі виправлення (RAG, Grafana)
|
||
- 📋 2/5 проблем планується виправити (STT, Image Gen)
|
||
|
||
**Рекомендація:** Продовжити виправлення критичних сервісів для повного відновлення функціональності.
|
||
|
||
---
|
||
|
||
**Last Updated:** 2025-01-27
|
||
**Next Review:** Після виправлення всіх критичних проблем
|
||
|