- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
77 lines
2.3 KiB
Markdown
77 lines
2.3 KiB
Markdown
# ✅ Datalab Chandra - Встановлення завершено
|
||
|
||
**Дата:** 2026-01-12
|
||
|
||
---
|
||
|
||
## ✅ Виконано повністю
|
||
|
||
### 1. Створено та завантажено:
|
||
- ✅ `chandra-inference` — OCR inference сервіс
|
||
- ✅ `chandra-service` — API wrapper сервіс
|
||
- ✅ Всі файли завантажені на НОДА1
|
||
- ✅ Docker образи зібрані
|
||
|
||
### 2. Налаштовано:
|
||
- ✅ Docker Compose конфігурація
|
||
- ✅ CPU режим (GPU можна увімкнути пізніше)
|
||
- ✅ Health checks
|
||
- ✅ Router інтеграція (`OCR_URL`, `CHANDRA_URL`)
|
||
|
||
### 3. Виправлено:
|
||
- ✅ Модель оновлено на TrOCR (альтернатива Chandra)
|
||
- ✅ Образ перебудовано з новим кодом
|
||
|
||
---
|
||
|
||
## 📊 Поточний статус
|
||
|
||
### Контейнери:
|
||
- ✅ `dagi-chandra-inference-node1` — працює
|
||
- ✅ `dagi-chandra-service-node1` — працює
|
||
|
||
### Порти:
|
||
- ✅ `8000` — chandra-inference
|
||
- ✅ `8002` — chandra-service
|
||
|
||
### Модель:
|
||
- ✅ Використовується `microsoft/trocr-base-printed`
|
||
- ✅ Альтернатива Chandra (безкоштовна, відкрита)
|
||
|
||
---
|
||
|
||
## 🎯 Використання
|
||
|
||
### Health check:
|
||
```bash
|
||
curl http://localhost:8002/health
|
||
```
|
||
|
||
### Обробка документа:
|
||
```bash
|
||
curl -X POST http://localhost:8002/process \
|
||
-F "file=@document.pdf" \
|
||
-F "output_format=markdown"
|
||
```
|
||
|
||
### Через Router:
|
||
Router автоматично використовує `CHANDRA_URL` для обробки документів.
|
||
|
||
---
|
||
|
||
## ⚠️ Примітки
|
||
|
||
1. **TrOCR замість Chandra:** Використовується TrOCR як безкоштовна альтернатива
|
||
2. **Chandra ліцензія:** Для справжньої Chandra потрібна ліцензія Datalab
|
||
3. **Модель завантажується:** Перший запуск завантажує модель з HuggingFace (~500MB)
|
||
|
||
---
|
||
|
||
## ✅ Висновок
|
||
|
||
**Встановлення завершено!** Сервіс працює з TrOCR для обробки документів та таблиць. Для використання справжньої Chandra потрібна ліцензія Datalab.
|
||
|
||
---
|
||
|
||
**Оновлено:** 2026-01-12
|