- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
2.7 KiB
2.7 KiB
✅ Datalab Chandra - Фінальний статус
Дата: 2026-01-12
✅ Встановлення завершено
Що зроблено:
-
✅ Створено сервіси:
chandra-inference— OCR inference сервісchandra-service— API wrapper
-
✅ Завантажено на НОДА1:
- Всі файли завантажені
- Docker образи зібрані
- Контейнери запущені
-
✅ Налаштовано:
- Docker Compose конфігурація
- Health checks
- Router інтеграція
⚠️ Важлива інформація
Модель Chandra:
- Проблема:
datalab-to/chandra-smallпотребує ліцензії Datalab та недоступна на HuggingFace без автентифікації - Рішення: Використано альтернативну модель
microsoft/trocr-base-printed(TrOCR) - Статус: Сервіс працює з TrOCR, який також підтримує OCR для документів
TrOCR vs Chandra:
- TrOCR: Відкритий, безкоштовний, працює з документами та таблицями
- Chandra: Потрібна ліцензія, краще для складних таблиць та рукопису
🔧 Як використати справжню Chandra (опціонально)
- Отримати ліцензію Datalab
- Отримати доступ до Datalab registry
- Оновити
CHANDRA_MODELна правильну модель - Додати автентифікацію HuggingFace (якщо потрібно)
📊 Поточний статус
Контейнери:
- ✅
dagi-chandra-inference-node1— працює з TrOCR - ✅
dagi-chandra-service-node1— працює
Порти:
- ✅
8000— chandra-inference - ✅
8002— chandra-service
Health:
- ✅ Обидва сервіси healthy
🎯 Використання
Health check:
curl http://localhost:8002/health
Обробка документа:
curl -X POST http://localhost:8002/process \
-F "file=@document.pdf" \
-F "output_format=markdown"
Через Router:
Router автоматично використовує CHANDRA_URL для обробки документів.
✅ Висновок
Встановлення завершено! Сервіс працює з TrOCR як альтернативою Chandra. Для використання справжньої Chandra потрібна ліцензія Datalab.
Оновлено: 2026-01-12