Files

Apple 5290287058 feat: implement TTS, Document processing, and Memory Service /facts API

- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)

2026-01-17 08:16:37 -08:00

3.2 KiB

Raw Permalink Blame History

📄 Встановлення Datalab Chandra на НОДА1

Дата: 2026-01-12

✅ Це нормально!

Так, встановлення Datalab Chandra — відмінна ідея!

Chandra доповнить поточну обробку документів (doc_service.py) і надасть:

✅ Обробку складних таблиць (зберігає структуру)
✅ Розпізнавання рукописного тексту
✅ Обробку форм та документів
✅ Збереження макету документа (bounding boxes, метадані)
✅ Вихід у форматах: Markdown, HTML, JSON

📊 Поточна ситуація

НОДА1:

✅ GPU: NVIDIA RTX 4000 SFF Ada (20GB VRAM) — достатньо для Chandra Small
✅ Обробка документів: gateway-bot/services/doc_service.py
✅ Інтеграція: Router → Parser Agent → Memory Service

Що додасть Chandra:

Покращена обробка таблиць
Розпізнавання рукопису
Обробка складних форм
Детальні метадані документа

🔧 Варіанти встановлення

Варіант 1: Docker контейнер (рекомендовано)

Використовувати офіційний inference контейнер Datalab
Інтегрувати через HTTP API
Налаштувати в docker-compose.node1.yml

Варіант 2: HuggingFace модель

Завантажити модель через HuggingFace
Запустити локально через Python
Інтегрувати через API wrapper

📝 План встановлення

Отримати ліцензію (якщо потрібна повна версія)
- Або використати open-source версію
- Або chandra-small (менше вимог до VRAM)
Завантажити Docker образ
- Використати офіційний образ Datalab
- Або створити власний з HuggingFace моделлю
Налаштувати контейнер на НОДА1
- Додати в docker-compose.node1.yml
- Налаштувати GPU доступ
- Налаштувати порт та мережу
Інтегрувати з doc_service
- Додати метод для виклику Chandra API
- Обробка результатів (Markdown/HTML/JSON)
- Передача в Router/Memory Service
Протестувати
- Обробка таблиць
- Обробка форм
- Розпізнавання рукопису

🎯 Інтеграція з поточною системою

Поточна обробка:

Gateway → doc_service.parse_document() → Router → Parser Agent → Memory Service

З Chandra:

Gateway → doc_service.parse_document() → Chandra API → Обробка результатів → Router → Memory Service

Готовий почати встановлення!

Оновлено: 2026-01-12

3.2 KiB Raw Permalink Blame History Unescape Escape