- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
3.2 KiB
3.2 KiB
📄 Встановлення Datalab Chandra на НОДА1
Дата: 2026-01-12
✅ Це нормально!
Так, встановлення Datalab Chandra — відмінна ідея!
Chandra доповнить поточну обробку документів (doc_service.py) і надасть:
- ✅ Обробку складних таблиць (зберігає структуру)
- ✅ Розпізнавання рукописного тексту
- ✅ Обробку форм та документів
- ✅ Збереження макету документа (bounding boxes, метадані)
- ✅ Вихід у форматах: Markdown, HTML, JSON
📊 Поточна ситуація
НОДА1:
- ✅ GPU: NVIDIA RTX 4000 SFF Ada (20GB VRAM) — достатньо для Chandra Small
- ✅ Обробка документів:
gateway-bot/services/doc_service.py - ✅ Інтеграція: Router → Parser Agent → Memory Service
Що додасть Chandra:
- Покращена обробка таблиць
- Розпізнавання рукопису
- Обробка складних форм
- Детальні метадані документа
🔧 Варіанти встановлення
Варіант 1: Docker контейнер (рекомендовано)
- Використовувати офіційний inference контейнер Datalab
- Інтегрувати через HTTP API
- Налаштувати в
docker-compose.node1.yml
Варіант 2: HuggingFace модель
- Завантажити модель через HuggingFace
- Запустити локально через Python
- Інтегрувати через API wrapper
📝 План встановлення
-
Отримати ліцензію (якщо потрібна повна версія)
- Або використати open-source версію
- Або
chandra-small(менше вимог до VRAM)
-
Завантажити Docker образ
- Використати офіційний образ Datalab
- Або створити власний з HuggingFace моделлю
-
Налаштувати контейнер на НОДА1
- Додати в
docker-compose.node1.yml - Налаштувати GPU доступ
- Налаштувати порт та мережу
- Додати в
-
Інтегрувати з doc_service
- Додати метод для виклику Chandra API
- Обробка результатів (Markdown/HTML/JSON)
- Передача в Router/Memory Service
-
Протестувати
- Обробка таблиць
- Обробка форм
- Розпізнавання рукопису
🎯 Інтеграція з поточною системою
Поточна обробка:
Gateway → doc_service.parse_document() → Router → Parser Agent → Memory Service
З Chandra:
Gateway → doc_service.parse_document() → Chandra API → Обробка результатів → Router → Memory Service
Готовий почати встановлення!
Оновлено: 2026-01-12