11 KiB
11 KiB
Чеклист для повноцінної роботи агентів DAARION
Дата створення: 2025-11-18
Статус: У розробці
✅ Що вже працює
1. Інфраструктура
- ✅ DAGI Router (9102) - маршрутизація до агентів та провайдерів
- ✅ NATS (4222) - event streaming
- ✅ PostgreSQL (5432) - основна БД
- ✅ Telegram Gateway (8000) - Long Polling для 3 ботів
- ✅ Local Telegram Bot API (8081) - зменшення латентності
- ✅ Prometheus (9090) - збір метрик
- ✅ Grafana (3000) - візуалізація
2. LLM Infrastructure
- ✅ Ollama - локальна генерація (Qwen3:8b, Qwen2.5:14b)
- ✅ OpenRouter - fallback (DeepSeek-Chat)
- ✅ LLM Provider в Router - вибір оптимального провайдера
3. Агенти (Telegram боти)
- ✅ DAARWIZZ (
@DAARWIZZBot) - microDAO оркестратор - ✅ Helion (
@energyunionBot) - Energy Union - ✅ GREENFOOD (
@greenfoodliveBot) - ERP для виробників (13 sub-agents)
4. Сервіси AI/ML
- ✅ CrewAI (9010) - multi-agent workflows
- ✅ Vision Encoder (8001) - розпізнавання зображень
- ✅ DevTools (8008) - інструменти розробника
- ⚠️ Parser (9400) - OCR/PDF (працює, unhealthy через curl)
- ⚠️ STT (9000) - Speech-to-Text (працює, unhealthy)
- ⚠️ TTS (9101) - Text-to-Speech (працює, unhealthy)
- ⚠️ Qdrant (6333) - Vector DB (працює, unhealthy)
- ⏸️ RAG Service - зупинено (потрібен рефакторинг Haystack 2.x)
5. Інтеграції
- ✅ Memory Service - зберігання контексту діалогів
- ✅ RBAC Service (9200) - управління правами
- ✅ Gateway Service (9300) - HTTP API
🔧 Що потрібно доопрацювати
1. Voice Processing (STT/TTS)
STT (Speech-to-Text)
- Статус: Сервіс працює, але потрібна інтеграція
- Що зробити:
- Перевірити чи
telegram-gatewayвикликає STT для голосових повідомлень - Додати логування STT викликів
- Протестувати українською та англійською
- Оптимізувати модель Whisper (tiny/base для швидкості)
- Перевірити чи
- Пріоритет: 🔴 Високий (для голосової взаємодії)
TTS (Text-to-Speech)
- Статус: Сервіс працює, але не інтегровано
- Що зробити:
- Додати TTS endpoint в
telegram-gateway - Опція для користувачів: отримувати відповіді голосом
- Підтримка української/англійської мов
- Додати TTS endpoint в
- Пріоритет: 🟡 Середній (nice-to-have)
2. Document Processing (Parser + RAG)
Parser Service
- Статус: ✅ Працює (але unhealthy через відсутність
curl) - Що зробити:
- Додати curl в Dockerfile
- Rebuild контейнера
- Перевірити парсинг PDF через Telegram
- Пріоритет: 🟢 Низький (технічна проблема, не функціональна)
RAG Service
- Статус: ⏸️ Зупинено (проблеми з Haystack 2.x API)
- Що зробити:
- Рефакторинг
ingest_pipeline.pyдля Haystack 2.x - Виправити
async/awaitсинтаксис - Додати тести
- Перезапустити сервіс
- Рефакторинг
- Пріоритет: 🔴 Високий (для RAG queries по документах)
3. CrewAI Workflows
GREENFOOD Crew (13 agents)
- Статус: ✅ Агенти створені, але не підключені до Router
- Що зробити:
- Додати tools для агентів (API виклики, БД queries)
- Створити Tasks для кожного Crew
- Інтеграція з Router (
mode: "crew",scenario: "onboard_vendor") - Тестування всіх 4 Crews
- Пріоритет: 🟡 Середній (GREENFOOD assistant працює через LLM, Crew - для складних сценаріїв)
Інші Crews
- DAARWIZZ Crew (microDAO workflows)
- Helion Crew (Energy Union workflows)
- Пріоритет: 🟢 Низький (поки LLM достатньо)
4. Memory & Context Management
Memory Service
- Статус: ✅ Працює (контекст діалогів, user facts)
- Що зробити:
- Додати довгострокову пам'ять (summaries старих діалогів)
- Інтеграція з RAG для semantic memory
- User preferences storage
- Пріоритет: 🟡 Середній
Session Management
- Статус: ✅ Базова імплементація (
session_id = telegram:{chat_id}) - Що зробити:
- Підтримка multi-device (один user, кілька чатів)
- Session expiry та cleanup
- Cross-channel sessions (Telegram + Web)
- Пріоритет: 🟢 Низький
5. Monitoring & Observability
Prometheus Metrics
- Статус: ✅ DAGI Router та Telegram Gateway
- Що зробити:
- Додати
/metricsв інші сервіси (Parser, STT, TTS, CrewAI) - Створити custom metrics (LLM tokens, agent requests, STT duration)
- Налаштувати alerting (Slack/Telegram notifications)
- Додати
- Пріоритет: 🟡 Середній
Grafana Dashboards
- Статус: ⏳ Grafana встановлено, дашбордів немає
- Що зробити:
- DAGI Router Dashboard (requests, latency, errors)
- Telegram Gateway Dashboard (messages, active chats)
- LLM Performance Dashboard (tokens, providers usage)
- System Dashboard (CPU, RAM, disk)
- Пріоритет: 🟡 Середній
Logging
- Статус: ⚠️ Логи є, але не централізовані
- Що зробити:
- Додати Loki для централізованих логів
- Інтеграція Grafana + Loki
- Structured logging (JSON format)
- Пріоритет: 🟢 Низький
6. Безпека та RBAC
Authentication
- Статус: ⚠️ Telegram auth через bot token, немає JWT для HTTP API
- Що зробити:
- JWT authentication для
/api/*endpoints - OAuth2 для frontend
- API keys для external integrations
- JWT authentication для
- Пріоритет: 🔴 Високий (для production)
RBAC
- Статус: ✅ RBAC Service працює (9200)
- Що зробити:
- Інтеграція RBAC з усіма агентами
- Перевірка прав доступу до MicroDAO actions
- Audit log для всіх RBAC операцій
- Пріоритет: 🔴 Високий (для multi-user microDAO)
7. Performance & Scalability
LLM Optimization
- Статус: ⚠️ Одна Ollama інстанція, no rate limiting
- Що зробити:
- LLM Load Balancer (кілька Ollama nodes)
- Rate limiting (запобігання abuse)
- LLM response caching (Redis)
- Smart routing (urgent queries → fast model)
- Пріоритет: 🟡 Середній (для масштабування до 100+ користувачів)
Message Queue
- Статус: ✅ NATS працює, але синхронна обробка
- Що зробити:
- Async processing через NATS JetStream
- Retry mechanism для failed requests
- Dead letter queue
- Пріоритет: 🟢 Низький (поточний throughput достатній)
8. Тестування
Unit Tests
- Статус: ❌ Відсутні
- Що зробити:
- Тести для Router (
routing_engine.py) - Тести для LLM Provider
- Тести для Memory Service
- Тести для Router (
- Пріоритет: 🟡 Середній
Integration Tests
- Статус: ❌ Відсутні
- Що зробити:
- End-to-end тест (Telegram → Router → LLM → Response)
- STT pipeline test
- Document processing test (PDF → Parser → RAG → Query)
- Пріоритет: 🟡 Середній
Load Testing
- Статус: ❌ Не проводилось
- Що зробити:
- Simulate 100 одночасних діалогів
- Тест STT під навантаженням
- LLM throughput benchmark
- Пріоритет: 🟢 Низький (для pre-production)
🎯 Пріоритизація (що робити далі)
🔴 Критично (наступні 1-2 дні)
- ✅ Додати
/metricsв Router та Gateway - 🔄 Перевірити голосовий чат (STT)
- 🔄 Виправити RAG Service (Haystack 2.x)
- ⏳ Додати JWT authentication для HTTP API
🟡 Важливо (наступні 1-2 тижні)
- Завершити GREENFOOD Crew (додати tools та tasks)
- Створити Grafana дашборди
- Додати TTS інтеграцію
- RBAC інтеграція з агентами
- Memory Service improvements
🟢 Потім (1-2 місяці)
- LLM Load Balancer
- Centralized Logging (Loki)
- Unit & Integration Tests
- Load Testing
- Масштабування до 1000+ агентів
📊 Поточний статус
| Компонент | Статус | Готовність |
|---|---|---|
| Core Router | ✅ Працює | 95% |
| Telegram Bots | ✅ 3 боти | 90% |
| LLM (Ollama) | ✅ Працює | 85% |
| STT (Whisper) | ⚠️ Потребує тестування | 70% |
| TTS | ⚠️ Не інтегровано | 50% |
| Parser/OCR | ✅ Працює | 80% |
| RAG | ⏸️ Зупинено | 40% |
| CrewAI | ⚠️ Базова імплементація | 60% |
| Monitoring | ✅ Prometheus + Grafana | 75% |
| RBAC | ✅ Працює | 80% |
| Memory | ✅ Працює | 75% |
| Security | ⚠️ Базова (Telegram) | 50% |
| Tests | ❌ Відсутні | 10% |
Загальна готовність: ~70% для MVP
Для production: ~50%