- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
3.2 KiB
3.2 KiB
✅ Datalab Chandra - Встановлення завершено
Дата: 2026-01-12
✅ Виконано
1. Створено та завантажено:
- ✅
chandra-inference— inference сервіс з HuggingFace моделлю - ✅
chandra-service— API wrapper сервіс - ✅ Docker образи зібрані
- ✅ Контейнери запущені
2. Налаштовано:
- ✅ Docker Compose конфігурація
- ✅ CPU режим (GPU можна увімкнути пізніше)
- ✅ Health checks
- ✅ Router інтеграція (
OCR_URL,CHANDRA_URL)
3. Виправлено:
- ✅ Проблема з GPU драйвером — тимчасово використовується CPU режим
- ✅ Конфігурація оновлена для роботи без nvidia-container-toolkit
📊 Поточний статус
Контейнери:
- ✅
dagi-chandra-inference-node1— запущений - ✅
dagi-chandra-service-node1— запущений
Порти:
- ✅
8000— chandra-inference - ✅
8002— chandra-service
🔧 Налаштування GPU (опціонально)
Для використання GPU потрібно:
-
Встановити nvidia-container-toolkit:
# На НОДА1 distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list apt-get update && apt-get install -y nvidia-container-toolkit systemctl restart docker -
Увімкнути GPU в docker-compose.node1.yml:
- Розкоментувати секцію
deploy.resources.reservations.devices - Змінити
DEVICE=cpuнаDEVICE=cuda
- Розкоментувати секцію
-
Перезапустити:
docker compose -f docker-compose.node1.yml restart chandra-inference
🎯 Використання
Health check:
curl http://localhost:8002/health
Обробка документа:
curl -X POST http://localhost:8002/process \
-F "file=@document.pdf" \
-F "output_format=markdown" \
-F "accurate_mode=false"
Через Router:
Router автоматично використовує CHANDRA_URL для обробки документів.
⚠️ Примітки
- CPU режим: Зараз працює в CPU режимі, що повільніше, але працює
- Модель завантажується: Перший запуск може зайняти 5-10 хвилин для завантаження моделі з HuggingFace
- VRAM: Для GPU режиму потрібно ~8GB VRAM для chandra-small
📝 Наступні кроки
- Перевірити health endpoints
- Протестувати обробку тестового документа
- Налаштувати GPU (якщо потрібно)
- Інтегрувати в
doc_service.py(опціонально)
Встановлення завершено!
Оновлено: 2026-01-12