- Add migration 013_city_map_coordinates.sql with map coordinates, zones, and agents table - Add /city/map API endpoint in city-service - Add /city/agents and /city/agents/online endpoints - Extend presence aggregator to include agents[] in snapshot - Add AgentsSource for fetching agent data from DB - Create CityMap component with interactive room tiles - Add useCityMap hook for fetching map data - Update useGlobalPresence to include agents - Add map/list view toggle on /city page - Add agent badges to room cards and map tiles
3.0 KiB
3.0 KiB
✅ Підсумок: Оптимізація CPU через GPU на НОДА1
Дата: 2025-01-27
Статус: ✅ GPU доступний! Потрібно налаштувати Ollama
🎯 ВИСНОВОК
✅ Так, можливо перенести CPU навантаження на GPU!
Поточна ситуація:
- ✅ GPU доступний: NVIDIA RTX 4000 SFF Ada Generation (20GB VRAM)
- ✅ CUDA: 12.2
- ✅ nvidia-container-toolkit: Встановлено (1.18.0)
- ✅ Docker GPU підтримка: Працює
- ❌ Ollama використовує CPU: 1583% CPU (multi-core)
- ⚠️ GPU utilization: 0% (не використовується Ollama!)
Рішення:
Увімкнути GPU acceleration для Ollama
Ollama працює як systemd service:
- Service:
/etc/systemd/system/ollama.service - Executable:
/usr/local/bin/ollama serve - User:
ollama - Порт:
11434
🚀 Швидке рішення
Автоматичний скрипт:
# На НОДА1
cd /opt/microdao-daarion
bash NODE1-OLLAMA-GPU-ENABLE.sh
Або вручну:
# 1. Створити override.conf для GPU
sudo mkdir -p /etc/systemd/system/ollama.service.d
sudo tee /etc/systemd/system/ollama.service.d/override.conf > /dev/null << 'EOF'
[Service]
Environment="OLLAMA_NUM_GPU=1"
Environment="OLLAMA_GPU_LAYERS=35"
Environment="CUDA_VISIBLE_DEVICES=0"
Environment="OLLAMA_KEEP_ALIVE=24h"
EOF
# 2. Перезавантажити systemd
sudo systemctl daemon-reload
# 3. Перезапустити Ollama
sudo systemctl restart ollama
# 4. Перевірити
nvidia-smi
curl http://localhost:11434/api/ps
📊 Очікувані результати
До оптимізації:
- CPU: 85.3% (Ollama: 1583% multi-core)
- GPU utilization: 0%
- Швидкість інференсу: Повільно (CPU)
Після оптимізації:
- CPU: 40-50% (-35-45%) ✅
- GPU utilization: 30-50% ✅
- Ollama CPU: 50-100% (на GPU) ✅
- Швидкість інференсу: +200-300% (GPU) ✅
📝 Детальна документація
NODE1-GPU-OPTIMIZATION.md- Повний план оптимізаціїNODE1-GPU-ENABLE-INSTRUCTIONS.md- Детальні інструкціїNODE1-GPU-ENABLE-QUICKSTART.md- Швидкий стартNODE1-OLLAMA-GPU-ENABLE.sh- Автоматичний скрипт
✅ Перевірка після оптимізації
# 1. GPU utilization (має збільшитися)
nvidia-smi
# 2. CPU навантаження (має знизитися)
top -bn1 | grep "Cpu(s)"
# 3. Ollama процеси
ollama ps
# 4. Тест швидкості
time ollama run qwen3:8b "Привіт, тест GPU"
Last Updated: 2025-01-27
Status: ✅ Готово до виконання