Files
microdao-daarion/DATALAB-CHANDRA-COMPLETE.md
Apple 5290287058 feat: implement TTS, Document processing, and Memory Service /facts API
- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
2026-01-17 08:16:37 -08:00

2.3 KiB
Raw Permalink Blame History

Datalab Chandra - Встановлення завершено

Дата: 2026-01-12


Виконано повністю

1. Створено та завантажено:

  • chandra-inference — OCR inference сервіс
  • chandra-service — API wrapper сервіс
  • Всі файли завантажені на НОДА1
  • Docker образи зібрані

2. Налаштовано:

  • Docker Compose конфігурація
  • CPU режим (GPU можна увімкнути пізніше)
  • Health checks
  • Router інтеграція (OCR_URL, CHANDRA_URL)

3. Виправлено:

  • Модель оновлено на TrOCR (альтернатива Chandra)
  • Образ перебудовано з новим кодом

📊 Поточний статус

Контейнери:

  • dagi-chandra-inference-node1 — працює
  • dagi-chandra-service-node1 — працює

Порти:

  • 8000 — chandra-inference
  • 8002 — chandra-service

Модель:

  • Використовується microsoft/trocr-base-printed
  • Альтернатива Chandra (безкоштовна, відкрита)

🎯 Використання

Health check:

curl http://localhost:8002/health

Обробка документа:

curl -X POST http://localhost:8002/process \
  -F "file=@document.pdf" \
  -F "output_format=markdown"

Через Router:

Router автоматично використовує CHANDRA_URL для обробки документів.


⚠️ Примітки

  1. TrOCR замість Chandra: Використовується TrOCR як безкоштовна альтернатива
  2. Chandra ліцензія: Для справжньої Chandra потрібна ліцензія Datalab
  3. Модель завантажується: Перший запуск завантажує модель з HuggingFace (~500MB)

Висновок

Встановлення завершено! Сервіс працює з TrOCR для обробки документів та таблиць. Для використання справжньої Chandra потрібна ліцензія Datalab.


Оновлено: 2026-01-12