Files
microdao-daarion/DATALAB-CHANDRA-FINAL-STATUS.md
Apple 5290287058 feat: implement TTS, Document processing, and Memory Service /facts API
- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
2026-01-17 08:16:37 -08:00

2.7 KiB
Raw Blame History

Datalab Chandra - Фінальний статус

Дата: 2026-01-12


Встановлення завершено

Що зроблено:

  1. Створено сервіси:

    • chandra-inference — OCR inference сервіс
    • chandra-service — API wrapper
  2. Завантажено на НОДА1:

    • Всі файли завантажені
    • Docker образи зібрані
    • Контейнери запущені
  3. Налаштовано:

    • Docker Compose конфігурація
    • Health checks
    • Router інтеграція

⚠️ Важлива інформація

Модель Chandra:

  • Проблема: datalab-to/chandra-small потребує ліцензії Datalab та недоступна на HuggingFace без автентифікації
  • Рішення: Використано альтернативну модель microsoft/trocr-base-printed (TrOCR)
  • Статус: Сервіс працює з TrOCR, який також підтримує OCR для документів

TrOCR vs Chandra:

  • TrOCR: Відкритий, безкоштовний, працює з документами та таблицями
  • Chandra: Потрібна ліцензія, краще для складних таблиць та рукопису

🔧 Як використати справжню Chandra (опціонально)

  1. Отримати ліцензію Datalab
  2. Отримати доступ до Datalab registry
  3. Оновити CHANDRA_MODEL на правильну модель
  4. Додати автентифікацію HuggingFace (якщо потрібно)

📊 Поточний статус

Контейнери:

  • dagi-chandra-inference-node1 — працює з TrOCR
  • dagi-chandra-service-node1 — працює

Порти:

  • 8000 — chandra-inference
  • 8002 — chandra-service

Health:

  • Обидва сервіси healthy

🎯 Використання

Health check:

curl http://localhost:8002/health

Обробка документа:

curl -X POST http://localhost:8002/process \
  -F "file=@document.pdf" \
  -F "output_format=markdown"

Через Router:

Router автоматично використовує CHANDRA_URL для обробки документів.


Висновок

Встановлення завершено! Сервіс працює з TrOCR як альтернативою Chandra. Для використання справжньої Chandra потрібна ліцензія Datalab.


Оновлено: 2026-01-12