- TTS: xtts-v2 integration with voice cloning support
- Document: docling integration for PDF/DOCX/PPTX processing
- Memory Service: added /facts/upsert, /facts/{key}, /facts endpoints
- Added required dependencies (TTS, docling)
2.3 KiB
2.3 KiB
✅ Vision модель Qwen3-VL 8B налаштована на НОДА1
Дата: 2026-01-12
📋 Виконано
1. Завантаження Vision моделі
Модель: qwen3-vl:8b (Vision-Language модель)
ollama pull qwen3-vl:8b
Статус: ✅ Модель завантажується в Ollama
2. Оновлення конфігурації Swapper
Файл: services/swapper-service/config/swapper_config_node1.yaml
Конфігурація:
# Vision Model - Qwen3-VL 8B (High Priority) - For image processing
qwen3-vl-8b:
path: ollama:qwen3-vl:8b
type: vision
size_gb: 5.72
priority: high
description: "Vision model for image understanding and processing"
3. Перезапуск Swapper
Статус: ✅ Swapper перезапущено та працює
📊 Поточний стан
Моделі в Ollama:
- ✅
qwen3:8b- основна LLM модель (5.2 GB) - ⏳
qwen3-vl:8b- vision модель (завантажується)
Swapper Service:
- ✅ Статус: healthy
- ✅ Активна модель:
qwen3-8b - ✅ Vision модель:
qwen3-vl-8b(зареєстрована в конфігурації)
🎯 Використання
Vision модель qwen3-vl:8b буде автоматично завантажуватися Swapper сервісом при запитах на обробку зображень через:
- Helion агент
- Gateway (Telegram/Discord)
- Router (мультимодальні запити)
🔍 Перевірка
Перевірка моделей в Ollama:
ollama list
Перевірка Swapper:
curl http://localhost:8890/health
curl http://localhost:8890/models | python3 -m json.tool
Перевірка логів:
docker logs swapper-service-node1 --tail 50
📝 Примітки
- Модель:
qwen3-vl:8b- найпотужніша vision-language модель в сімействі Qwen - Розмір: ~5.72 GB
- Тип:
vision- для обробки зображень та мультимодальних запитів - Пріоритет:
high- високий пріоритет для завантаження
Оновлено: 2026-01-12