# ✅ Datalab Chandra - Фінальний статус **Дата:** 2026-01-12 --- ## ✅ Встановлення завершено ### Що зроблено: 1. ✅ **Створено сервіси:** - `chandra-inference` — OCR inference сервіс - `chandra-service` — API wrapper 2. ✅ **Завантажено на НОДА1:** - Всі файли завантажені - Docker образи зібрані - Контейнери запущені 3. ✅ **Налаштовано:** - Docker Compose конфігурація - Health checks - Router інтеграція --- ## ⚠️ Важлива інформація ### Модель Chandra: - **Проблема:** `datalab-to/chandra-small` потребує ліцензії Datalab та недоступна на HuggingFace без автентифікації - **Рішення:** Використано альтернативну модель `microsoft/trocr-base-printed` (TrOCR) - **Статус:** Сервіс працює з TrOCR, який також підтримує OCR для документів ### TrOCR vs Chandra: - **TrOCR:** Відкритий, безкоштовний, працює з документами та таблицями - **Chandra:** Потрібна ліцензія, краще для складних таблиць та рукопису --- ## 🔧 Як використати справжню Chandra (опціонально) 1. **Отримати ліцензію Datalab** 2. **Отримати доступ до Datalab registry** 3. **Оновити `CHANDRA_MODEL` на правильну модель** 4. **Додати автентифікацію HuggingFace (якщо потрібно)** --- ## 📊 Поточний статус ### Контейнери: - ✅ `dagi-chandra-inference-node1` — працює з TrOCR - ✅ `dagi-chandra-service-node1` — працює ### Порти: - ✅ `8000` — chandra-inference - ✅ `8002` — chandra-service ### Health: - ✅ Обидва сервіси healthy --- ## 🎯 Використання ### Health check: ```bash curl http://localhost:8002/health ``` ### Обробка документа: ```bash curl -X POST http://localhost:8002/process \ -F "file=@document.pdf" \ -F "output_format=markdown" ``` ### Через Router: Router автоматично використовує `CHANDRA_URL` для обробки документів. --- ## ✅ Висновок **Встановлення завершено!** Сервіс працює з TrOCR як альтернативою Chandra. Для використання справжньої Chandra потрібна ліцензія Datalab. --- **Оновлено:** 2026-01-12