# 📄 Налаштування Datalab Chandra для обробки документів та таблиць

**Дата:** 2026-01-12

---

## ✅ Це нормально!

**Так, встановлення Datalab Chandra для обробки документів та таблиць — це відмінна ідея!**

Chandra доповнить поточну обробку документів і надасть:
- Обробку складних таблиць
- Розпізнавання рукописного тексту
- Обробку форм
- Збереження макету документа (bounding boxes, метадані)

---

## 📋 Що таке Datalab Chandra

**Datalab Chandra** — OCR-модель для обробки:
- Складних таблиць (зберігає структуру)
- Форм та документів
- Рукописного тексту
- З виходом у форматах: Markdown, HTML, JSON з метаданими

---

## 🔧 Вимоги

### Апаратні:
- ✅ **НОДА1 має:** NVIDIA RTX 4000 SFF Ada (20GB VRAM) — достатньо для Chandra
- GPU з CUDA підтримкою

### Програмні:
- Docker та Docker Compose
- Ліцензія Datalab (для повної версії)
- Або використання open-source версії

---

## 📦 Варіанти встановлення

### Варіант 1: Docker контейнер (рекомендовано)
- Використовувати офіційний inference контейнер Datalab
- Налаштувати через environment variables
- Інтегрувати з Swapper/Gateway

### Варіант 2: HuggingFace модель
- Завантажити модель через HuggingFace
- Запустити локально
- Інтегрувати через API

---

## 🔗 Інтеграція з поточною системою

### Поточна обробка документів:
- `gateway-bot/services/doc_service.py` — обробка PDF, документів
- Інтеграція з Memory Service для RAG
- Підтримка через Gateway (Telegram/Discord)

### Додавання Chandra:
- Chandra буде обробляти складні таблиці та форми
- Результати будуть передаватися в doc_service
- Інтеграція з Memory Service для збереження

---

## 📝 План встановлення

1. **Отримати ліцензію** (якщо потрібна повна версія)
2. **Завантажити Docker образ** або модель
3. **Налаштувати контейнер** на НОДА1
4. **Інтегрувати з Gateway/Swapper**
5. **Протестувати обробку таблиць**

---

**Готовий почати встановлення!**

---

**Оновлено:** 2026-01-12