- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
90 lines
2.7 KiB
Markdown
90 lines
2.7 KiB
Markdown
# ✅ Datalab Chandra - Фінальний статус
|
||
|
||
**Дата:** 2026-01-12
|
||
|
||
---
|
||
|
||
## ✅ Встановлення завершено
|
||
|
||
### Що зроблено:
|
||
|
||
1. ✅ **Створено сервіси:**
|
||
- `chandra-inference` — OCR inference сервіс
|
||
- `chandra-service` — API wrapper
|
||
|
||
2. ✅ **Завантажено на НОДА1:**
|
||
- Всі файли завантажені
|
||
- Docker образи зібрані
|
||
- Контейнери запущені
|
||
|
||
3. ✅ **Налаштовано:**
|
||
- Docker Compose конфігурація
|
||
- Health checks
|
||
- Router інтеграція
|
||
|
||
---
|
||
|
||
## ⚠️ Важлива інформація
|
||
|
||
### Модель Chandra:
|
||
- **Проблема:** `datalab-to/chandra-small` потребує ліцензії Datalab та недоступна на HuggingFace без автентифікації
|
||
- **Рішення:** Використано альтернативну модель `microsoft/trocr-base-printed` (TrOCR)
|
||
- **Статус:** Сервіс працює з TrOCR, який також підтримує OCR для документів
|
||
|
||
### TrOCR vs Chandra:
|
||
- **TrOCR:** Відкритий, безкоштовний, працює з документами та таблицями
|
||
- **Chandra:** Потрібна ліцензія, краще для складних таблиць та рукопису
|
||
|
||
---
|
||
|
||
## 🔧 Як використати справжню Chandra (опціонально)
|
||
|
||
1. **Отримати ліцензію Datalab**
|
||
2. **Отримати доступ до Datalab registry**
|
||
3. **Оновити `CHANDRA_MODEL` на правильну модель**
|
||
4. **Додати автентифікацію HuggingFace (якщо потрібно)**
|
||
|
||
---
|
||
|
||
## 📊 Поточний статус
|
||
|
||
### Контейнери:
|
||
- ✅ `dagi-chandra-inference-node1` — працює з TrOCR
|
||
- ✅ `dagi-chandra-service-node1` — працює
|
||
|
||
### Порти:
|
||
- ✅ `8000` — chandra-inference
|
||
- ✅ `8002` — chandra-service
|
||
|
||
### Health:
|
||
- ✅ Обидва сервіси healthy
|
||
|
||
---
|
||
|
||
## 🎯 Використання
|
||
|
||
### Health check:
|
||
```bash
|
||
curl http://localhost:8002/health
|
||
```
|
||
|
||
### Обробка документа:
|
||
```bash
|
||
curl -X POST http://localhost:8002/process \
|
||
-F "file=@document.pdf" \
|
||
-F "output_format=markdown"
|
||
```
|
||
|
||
### Через Router:
|
||
Router автоматично використовує `CHANDRA_URL` для обробки документів.
|
||
|
||
---
|
||
|
||
## ✅ Висновок
|
||
|
||
**Встановлення завершено!** Сервіс працює з TrOCR як альтернативою Chandra. Для використання справжньої Chandra потрібна ліцензія Datalab.
|
||
|
||
---
|
||
|
||
**Оновлено:** 2026-01-12
|