Files
microdao-daarion/DATALAB-CHANDRA-FINAL-STATUS.md
Apple 5290287058 feat: implement TTS, Document processing, and Memory Service /facts API
- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
2026-01-17 08:16:37 -08:00

90 lines
2.7 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# ✅ Datalab Chandra - Фінальний статус
**Дата:** 2026-01-12
---
## ✅ Встановлення завершено
### Що зроблено:
1.**Створено сервіси:**
- `chandra-inference` — OCR inference сервіс
- `chandra-service` — API wrapper
2.**Завантажено на НОДА1:**
- Всі файли завантажені
- Docker образи зібрані
- Контейнери запущені
3.**Налаштовано:**
- Docker Compose конфігурація
- Health checks
- Router інтеграція
---
## ⚠️ Важлива інформація
### Модель Chandra:
- **Проблема:** `datalab-to/chandra-small` потребує ліцензії Datalab та недоступна на HuggingFace без автентифікації
- **Рішення:** Використано альтернативну модель `microsoft/trocr-base-printed` (TrOCR)
- **Статус:** Сервіс працює з TrOCR, який також підтримує OCR для документів
### TrOCR vs Chandra:
- **TrOCR:** Відкритий, безкоштовний, працює з документами та таблицями
- **Chandra:** Потрібна ліцензія, краще для складних таблиць та рукопису
---
## 🔧 Як використати справжню Chandra (опціонально)
1. **Отримати ліцензію Datalab**
2. **Отримати доступ до Datalab registry**
3. **Оновити `CHANDRA_MODEL` на правильну модель**
4. **Додати автентифікацію HuggingFace (якщо потрібно)**
---
## 📊 Поточний статус
### Контейнери:
-`dagi-chandra-inference-node1` — працює з TrOCR
-`dagi-chandra-service-node1` — працює
### Порти:
-`8000` — chandra-inference
-`8002` — chandra-service
### Health:
- ✅ Обидва сервіси healthy
---
## 🎯 Використання
### Health check:
```bash
curl http://localhost:8002/health
```
### Обробка документа:
```bash
curl -X POST http://localhost:8002/process \
-F "file=@document.pdf" \
-F "output_format=markdown"
```
### Через Router:
Router автоматично використовує `CHANDRA_URL` для обробки документів.
---
## ✅ Висновок
**Встановлення завершено!** Сервіс працює з TrOCR як альтернативою Chandra. Для використання справжньої Chandra потрібна ліцензія Datalab.
---
**Оновлено:** 2026-01-12