Files
Apple ef3473db21 snapshot: NODE1 production state 2026-02-09
Complete snapshot of /opt/microdao-daarion/ from NODE1 (144.76.224.179).
This represents the actual running production code that has diverged
significantly from the previous main branch.

Key changes from old main:
- Gateway (http_api.py): expanded from ~40KB to 164KB with full agent support
- Router: new /v1/agents/{id}/infer endpoint with vision + DeepSeek routing
- Behavior Policy: SOWA v2.2 (3-level: FULL/ACK/SILENT)
- Agent Registry: config/agent_registry.yml as single source of truth
- 13 agents configured (was 3)
- Memory service integration
- CrewAI teams and roles

Excluded from snapshot: venv/, .env, data/, backups, .tgz archives

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-09 08:46:46 -08:00

1118 lines
36 KiB
HTML
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
<!doctype html>
<html lang="en" class="no-js">
<head>
<meta charset="utf-8">
<meta name="viewport" content="width=device-width,initial-scale=1">
<link rel="canonical" href="https://IvanTytar.github.io/microdao-daarion/STRATEGY_MODELS/">
<link rel="icon" href="../assets/images/favicon.png">
<meta name="generator" content="mkdocs-1.5.3, mkdocs-material-9.5.18">
<title>🎯 Стратегія вибору моделей: API vs Локальні - DAARION Documentation</title>
<link rel="stylesheet" href="../assets/stylesheets/main.66ac8b77.min.css">
<link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
<link rel="stylesheet" href="https://fonts.googleapis.com/css?family=Roboto:300,300i,400,400i,700,700i%7CRoboto+Mono:400,400i,700,700i&display=fallback">
<style>:root{--md-text-font:"Roboto";--md-code-font:"Roboto Mono"}</style>
<script>__md_scope=new URL("..",location),__md_hash=e=>[...e].reduce((e,_)=>(e<<5)-e+_.charCodeAt(0),0),__md_get=(e,_=localStorage,t=__md_scope)=>JSON.parse(_.getItem(t.pathname+"."+e)),__md_set=(e,_,t=localStorage,a=__md_scope)=>{try{t.setItem(a.pathname+"."+e,JSON.stringify(_))}catch(e){}}</script>
</head>
<body dir="ltr">
<input class="md-toggle" data-md-toggle="drawer" type="checkbox" id="__drawer" autocomplete="off">
<input class="md-toggle" data-md-toggle="search" type="checkbox" id="__search" autocomplete="off">
<label class="md-overlay" for="__drawer"></label>
<div data-md-component="skip">
<a href="#api-vs" class="md-skip">
Skip to content
</a>
</div>
<div data-md-component="announce">
</div>
<header class="md-header md-header--shadow" data-md-component="header">
<nav class="md-header__inner md-grid" aria-label="Header">
<a href=".." title="DAARION Documentation" class="md-header__button md-logo" aria-label="DAARION Documentation" data-md-component="logo">
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54Z"/></svg>
</a>
<label class="md-header__button md-icon" for="__drawer">
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M3 6h18v2H3V6m0 5h18v2H3v-2m0 5h18v2H3v-2Z"/></svg>
</label>
<div class="md-header__title" data-md-component="header-title">
<div class="md-header__ellipsis">
<div class="md-header__topic">
<span class="md-ellipsis">
DAARION Documentation
</span>
</div>
<div class="md-header__topic" data-md-component="header-topic">
<span class="md-ellipsis">
🎯 Стратегія вибору моделей: API vs Локальні
</span>
</div>
</div>
</div>
<script>var media,input,key,value,palette=__md_get("__palette");if(palette&&palette.color){"(prefers-color-scheme)"===palette.color.media&&(media=matchMedia("(prefers-color-scheme: light)"),input=document.querySelector(media.matches?"[data-md-color-media='(prefers-color-scheme: light)']":"[data-md-color-media='(prefers-color-scheme: dark)']"),palette.color.media=input.getAttribute("data-md-color-media"),palette.color.scheme=input.getAttribute("data-md-color-scheme"),palette.color.primary=input.getAttribute("data-md-color-primary"),palette.color.accent=input.getAttribute("data-md-color-accent"));for([key,value]of Object.entries(palette.color))document.body.setAttribute("data-md-color-"+key,value)}</script>
<label class="md-header__button md-icon" for="__search">
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.516 6.516 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5Z"/></svg>
</label>
<div class="md-search" data-md-component="search" role="dialog">
<label class="md-search__overlay" for="__search"></label>
<div class="md-search__inner" role="search">
<form class="md-search__form" name="search">
<input type="text" class="md-search__input" name="query" aria-label="Search" placeholder="Search" autocapitalize="off" autocorrect="off" autocomplete="off" spellcheck="false" data-md-component="search-query" required>
<label class="md-search__icon md-icon" for="__search">
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.516 6.516 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5Z"/></svg>
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M20 11v2H8l5.5 5.5-1.42 1.42L4.16 12l7.92-7.92L13.5 5.5 8 11h12Z"/></svg>
</label>
<nav class="md-search__options" aria-label="Search">
<button type="reset" class="md-search__icon md-icon" title="Clear" aria-label="Clear" tabindex="-1">
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M19 6.41 17.59 5 12 10.59 6.41 5 5 6.41 10.59 12 5 17.59 6.41 19 12 13.41 17.59 19 19 17.59 13.41 12 19 6.41Z"/></svg>
</button>
</nav>
</form>
<div class="md-search__output">
<div class="md-search__scrollwrap" data-md-scrollfix>
<div class="md-search-result" data-md-component="search-result">
<div class="md-search-result__meta">
Initializing search
</div>
<ol class="md-search-result__list" role="presentation"></ol>
</div>
</div>
</div>
</div>
</div>
</nav>
</header>
<div class="md-container" data-md-component="container">
<main class="md-main" data-md-component="main">
<div class="md-main__inner md-grid">
<div class="md-sidebar md-sidebar--primary" data-md-component="sidebar" data-md-type="navigation" >
<div class="md-sidebar__scrollwrap">
<div class="md-sidebar__inner">
<nav class="md-nav md-nav--primary" aria-label="Navigation" data-md-level="0">
<label class="md-nav__title" for="__drawer">
<a href=".." title="DAARION Documentation" class="md-nav__button md-logo" aria-label="DAARION Documentation" data-md-component="logo">
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54Z"/></svg>
</a>
DAARION Documentation
</label>
<ul class="md-nav__list" data-md-scrollfix>
<li class="md-nav__item">
<a href="../public/" class="md-nav__link">
<span class="md-ellipsis">
Home
</span>
</a>
</li>
<li class="md-nav__item">
<a href="../public/getting-started/" class="md-nav__link">
<span class="md-ellipsis">
Getting Started
</span>
</a>
</li>
<li class="md-nav__item">
<a href="../public/architecture-overview/" class="md-nav__link">
<span class="md-ellipsis">
Architecture
</span>
</a>
</li>
<li class="md-nav__item">
<a href="../public/daiS_daos_overview/" class="md-nav__link">
<span class="md-ellipsis">
DAIS & DAOS
</span>
</a>
</li>
<li class="md-nav__item md-nav__item--section md-nav__item--nested">
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5" >
<label class="md-nav__link" for="__nav_5" id="__nav_5_label" tabindex="">
<span class="md-ellipsis">
Internal
</span>
<span class="md-nav__icon md-icon"></span>
</label>
<nav class="md-nav" data-md-level="1" aria-labelledby="__nav_5_label" aria-expanded="false">
<label class="md-nav__title" for="__nav_5">
<span class="md-nav__icon md-icon"></span>
Internal
</label>
<ul class="md-nav__list" data-md-scrollfix>
<li class="md-nav__item md-nav__item--nested">
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5_1" >
<label class="md-nav__link" for="__nav_5_1" id="__nav_5_1_label" tabindex="0">
<span class="md-ellipsis">
Infra
</span>
<span class="md-nav__icon md-icon"></span>
</label>
<nav class="md-nav" data-md-level="2" aria-labelledby="__nav_5_1_label" aria-expanded="false">
<label class="md-nav__title" for="__nav_5_1">
<span class="md-nav__icon md-icon"></span>
Infra
</label>
<ul class="md-nav__list" data-md-scrollfix>
<li class="md-nav__item">
<a href="../internal/infra/INFRA_AUTOMATION_PACK_V1/" class="md-nav__link">
<span class="md-ellipsis">
Infra Automation Pack v1
</span>
</a>
</li>
<li class="md-nav__item">
<a href="../internal/infra/monitoring_overview/" class="md-nav__link">
<span class="md-ellipsis">
Monitoring Overview
</span>
</a>
</li>
<li class="md-nav__item">
<a href="../internal/infra/nodes_registry_v0/" class="md-nav__link">
<span class="md-ellipsis">
Nodes Registry v0
</span>
</a>
</li>
</ul>
</nav>
</li>
<li class="md-nav__item md-nav__item--nested">
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5_2" >
<label class="md-nav__link" for="__nav_5_2" id="__nav_5_2_label" tabindex="0">
<span class="md-ellipsis">
Specs
</span>
<span class="md-nav__icon md-icon"></span>
</label>
<nav class="md-nav" data-md-level="2" aria-labelledby="__nav_5_2_label" aria-expanded="false">
<label class="md-nav__title" for="__nav_5_2">
<span class="md-nav__icon md-icon"></span>
Specs
</label>
<ul class="md-nav__list" data-md-scrollfix>
<li class="md-nav__item">
<a href="../internal/specs/matrix_presence_aggregator/" class="md-nav__link">
<span class="md-ellipsis">
Matrix Presence Aggregator
</span>
</a>
</li>
<li class="md-nav__item">
<a href="../internal/specs/city_map_spec/" class="md-nav__link">
<span class="md-ellipsis">
City Map Spec
</span>
</a>
</li>
<li class="md-nav__item">
<a href="../internal/specs/node_join_protocol_draft/" class="md-nav__link">
<span class="md-ellipsis">
Node Join Protocol (Draft)
</span>
</a>
</li>
</ul>
</nav>
</li>
</ul>
</nav>
</li>
</ul>
</nav>
</div>
</div>
</div>
<div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" >
<div class="md-sidebar__scrollwrap">
<div class="md-sidebar__inner">
<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
<label class="md-nav__title" for="__toc">
<span class="md-nav__icon md-icon"></span>
Table of contents
</label>
<ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
<li class="md-nav__item">
<a href="#_1" class="md-nav__link">
<span class="md-ellipsis">
📊 Поточна ситуація
</span>
</a>
<nav class="md-nav" aria-label="📊 Поточна ситуація">
<ul class="md-nav__list">
<li class="md-nav__item">
<a href="#_2" class="md-nav__link">
<span class="md-ellipsis">
Що вже є на сервері:
</span>
</a>
<nav class="md-nav" aria-label="Що вже є на сервері:">
<ul class="md-nav__list">
<li class="md-nav__item">
<a href="#1-ollama" class="md-nav__link">
<span class="md-ellipsis">
1. Локальні моделі (Ollama) ✅
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#2-dify-platform" class="md-nav__link">
<span class="md-ellipsis">
2. Dify Platform ✅
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#3-vision-encoder" class="md-nav__link">
<span class="md-ellipsis">
3. Vision Encoder ✅
</span>
</a>
</li>
</ul>
</nav>
</li>
</ul>
</nav>
</li>
<li class="md-nav__item">
<a href="#_3" class="md-nav__link">
<span class="md-ellipsis">
🤔 Варіанти стратегії
</span>
</a>
<nav class="md-nav" aria-label="🤔 Варіанти стратегії">
<ul class="md-nav__list">
<li class="md-nav__item">
<a href="#a-api-openaianthropic" class="md-nav__link">
<span class="md-ellipsis">
Варіант A: API моделі (OpenAI/Anthropic) 💰
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#b-vision" class="md-nav__link">
<span class="md-ellipsis">
Варіант B: Локальні Vision моделі 🖥️
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#c" class="md-nav__link">
<span class="md-ellipsis">
Варіант C: Гібридний підхід 🎯 (РЕКОМЕНДОВАНО)
</span>
</a>
</li>
</ul>
</nav>
</li>
<li class="md-nav__item">
<a href="#_4" class="md-nav__link">
<span class="md-ellipsis">
💡 Моя рекомендація
</span>
</a>
<nav class="md-nav" aria-label="💡 Моя рекомендація">
<ul class="md-nav__list">
<li class="md-nav__item">
<a href="#vision" class="md-nav__link">
<span class="md-ellipsis">
НЕ раджу завантажувати важкі Vision моделі ЯКЩО:
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#vision_1" class="md-nav__link">
<span class="md-ellipsis">
Раджу завантажити ЛОКАЛЬНІ Vision моделі ЯКЩО:
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#api" class="md-nav__link">
<span class="md-ellipsis">
Раджу використовувати API ЯКЩО:
</span>
</a>
</li>
</ul>
</nav>
</li>
<li class="md-nav__item">
<a href="#_5" class="md-nav__link">
<span class="md-ellipsis">
🎯 Конкретний план для тебе
</span>
</a>
<nav class="md-nav" aria-label="🎯 Конкретний план для тебе">
<ul class="md-nav__list">
<li class="md-nav__item">
<a href="#1-gpu" class="md-nav__link">
<span class="md-ellipsis">
Сценарій 1: Є GPU + немає бюджету 🖥️
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#2-gpu" class="md-nav__link">
<span class="md-ellipsis">
Сценарій 2: Немає GPU + є бюджет 💰
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#3-gpu" class="md-nav__link">
<span class="md-ellipsis">
Сценарій 3: Немає GPU + немає бюджету ⚠️
</span>
</a>
</li>
</ul>
</nav>
</li>
<li class="md-nav__item">
<a href="#_6" class="md-nav__link">
<span class="md-ellipsis">
📊 Порівняння
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#_7" class="md-nav__link">
<span class="md-ellipsis">
🚀 Що робити зараз?
</span>
</a>
<nav class="md-nav" aria-label="🚀 Що робити зараз?">
<ul class="md-nav__list">
<li class="md-nav__item">
<a href="#1-gpu_1" class="md-nav__link">
<span class="md-ellipsis">
Крок 1: Перевірити чи є GPU
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#2-openai-api-key" class="md-nav__link">
<span class="md-ellipsis">
Крок 2: Перевірити чи є OpenAI API key
</span>
</a>
</li>
<li class="md-nav__item">
<a href="#3" class="md-nav__link">
<span class="md-ellipsis">
Крок 3: Вирішити стратегію
</span>
</a>
</li>
</ul>
</nav>
</li>
<li class="md-nav__item">
<a href="#_8" class="md-nav__link">
<span class="md-ellipsis">
💬 Моя думка
</span>
</a>
</li>
</ul>
</nav>
</div>
</div>
</div>
<div class="md-content" data-md-component="content">
<article class="md-content__inner md-typeset">
<h1 id="api-vs">🎯 Стратегія вибору моделей: API vs Локальні<a class="headerlink" href="#api-vs" title="Permanent link">&para;</a></h1>
<p><strong>Дата</strong>: 2025-11-18<br />
<strong>Питання</strong>: Використовувати Dify/API чи завантажувати важкі моделі?</p>
<hr />
<h2 id="_1">📊 Поточна ситуація<a class="headerlink" href="#_1" title="Permanent link">&para;</a></h2>
<h3 id="_2">Що вже є на сервері:<a class="headerlink" href="#_2" title="Permanent link">&para;</a></h3>
<h4 id="1-ollama">1. <strong>Локальні моделі (Ollama)</strong><a class="headerlink" href="#1-ollama" title="Permanent link">&para;</a></h4>
<ul>
<li><strong>qwen3:8b</strong> - вже завантажена (5.2 GB)</li>
<li><strong>Використання</strong>: DAGI Router використовує для DAARWIZZ, Helion, GREENFOOD</li>
<li><strong>Переваги</strong>: </li>
<li>✅ Безкоштовно</li>
<li>✅ Приватно (дані не йдуть в OpenAI)</li>
<li>✅ Працює офлайн</li>
<li><strong>Недоліки</strong>:</li>
<li>⚠️ Обмежені можливості (немає Vision, слабший RAG)</li>
<li>⚠️ Повільніше ніж API</li>
<li>⚠️ Потребує GPU для швидкості</li>
</ul>
<h4 id="2-dify-platform">2. <strong>Dify Platform</strong><a class="headerlink" href="#2-dify-platform" title="Permanent link">&para;</a></h4>
<ul>
<li><strong>Статус</strong>: Працює, але потребує API ключі</li>
<li><strong>OPENAI_API_BASE</strong>: https://api.openai.com/v1</li>
<li><strong>API Key</strong>: Потрібен (не знайдено в env)</li>
<li><strong>Використання</strong>: Може використовувати GPT-4V, Claude Vision через API</li>
</ul>
<h4 id="3-vision-encoder">3. <strong>Vision Encoder</strong><a class="headerlink" href="#3-vision-encoder" title="Permanent link">&para;</a></h4>
<ul>
<li><strong>Статус</strong>: Працює (embeddings)</li>
<li><strong>Обмеження</strong>: Тільки векторизація, не опис зображень</li>
</ul>
<hr />
<h2 id="_3">🤔 Варіанти стратегії<a class="headerlink" href="#_3" title="Permanent link">&para;</a></h2>
<h3 id="a-api-openaianthropic"><strong>Варіант A: API моделі (OpenAI/Anthropic)</strong> 💰<a class="headerlink" href="#a-api-openaianthropic" title="Permanent link">&para;</a></h3>
<p><strong>Що потрібно</strong>:
- OpenAI API key (для GPT-4V)
- АБО Anthropic API key (для Claude Vision)</p>
<p><strong>Переваги</strong>:
- ✅ <strong>GPT-4V</strong> - найкращий Vision AI
- ✅ <strong>Claude 3 Vision</strong> - теж дуже хороший
- ✅ Швидко (API)
- ✅ Не потребує завантаження моделей
- ✅ Оновлення автоматично</p>
<p><strong>Недоліки</strong>:
- ❌ <strong>Коштує грошей</strong> ($0.01-0.03 за image)
- ❌ Дані йдуть в OpenAI/Anthropic
- ❌ Залежність від інтернету</p>
<p><strong>Вартість</strong> (приблизно):
- GPT-4V: ~$0.01-0.03 за зображення
- Claude Vision: ~$0.01-0.015 за зображення
- При 100 фото/день = $1-3/день = $30-90/місяць</p>
<hr />
<h3 id="b-vision"><strong>Варіант B: Локальні Vision моделі</strong> 🖥️<a class="headerlink" href="#b-vision" title="Permanent link">&para;</a></h3>
<p><strong>Що потрібно завантажити</strong>:
- <strong>LLaVA</strong> (Large Language and Vision Assistant) - ~7-13 GB
- АБО <strong>BLIP-2</strong> - ~1-2 GB
- АБО <strong>InstructBLIP</strong> - ~1-2 GB</p>
<p><strong>Переваги</strong>:
- ✅ Безкоштовно
- ✅ Приватно
- ✅ Працює офлайн</p>
<p><strong>Недоліки</strong>:
- ❌ <strong>Потребує GPU</strong> для швидкості (CPU дуже повільно)
- ❌ Великі файли (7-13 GB)
- ❌ Гірша якість ніж GPT-4V
- ❌ Потребує багато RAM (16GB+)</p>
<p><strong>Час обробки</strong> (на CPU):
- LLaVA: ~30-60 секунд на зображення
- BLIP-2: ~10-20 секунд</p>
<p><strong>Час обробки</strong> (на GPU):
- LLaVA: ~2-5 секунд
- BLIP-2: ~1-2 секунди</p>
<hr />
<h3 id="c"><strong>Варіант C: Гібридний підхід</strong> 🎯 (РЕКОМЕНДОВАНО)<a class="headerlink" href="#c" title="Permanent link">&para;</a></h3>
<p><strong>Що робити</strong>:
1. <strong>Для базових агентів</strong> (DAARWIZZ, Helion, GREENFOOD):
- ✅ Використовувати <strong>локальний qwen3:8b</strong> (вже є)
- ✅ Безкоштовно, приватно</p>
<ol>
<li><strong>Для Vision</strong> (опис зображень):</li>
<li><strong>Варіант C1</strong>: API (якщо є бюджет)<ul>
<li>GPT-4V через OpenAI API</li>
<li>АБО Claude Vision через Anthropic API</li>
</ul>
</li>
<li>
<p><strong>Варіант C2</strong>: Локальний (якщо немає бюджету)</p>
<ul>
<li>LLaVA через Ollama (якщо є GPU)</li>
<li>АБО BLIP-2 (легший варіант)</li>
</ul>
</li>
<li>
<p><strong>Для RAG</strong>:</p>
</li>
<li>✅ Використовувати <strong>Qdrant</strong> (вже працює)</li>
<li>✅ Використовувати <strong>Weaviate</strong> (вже працює, частина Dify)</li>
<li>
<p>НЕ використовувати Dify RAG (потребує API)</p>
</li>
<li>
<p><strong>Для Web Search</strong>:</p>
</li>
<li>✅ Використовувати <strong>CrewAI</strong> (вже працює)</li>
<li>✅ CrewAI може використовувати локальні моделі</li>
</ol>
<hr />
<h2 id="_4">💡 Моя рекомендація<a class="headerlink" href="#_4" title="Permanent link">&para;</a></h2>
<h3 id="vision"><strong>НЕ раджу завантажувати важкі Vision моделі ЯКЩО:</strong><a class="headerlink" href="#vision" title="Permanent link">&para;</a></h3>
<ul>
<li>❌ Немає GPU (CPU буде дуже повільно)</li>
<li>❌ Немає багато RAM (16GB+)</li>
<li>❌ Немає місця на диску (7-13 GB)</li>
</ul>
<h3 id="vision_1"><strong>Раджу завантажити ЛОКАЛЬНІ Vision моделі ЯКЩО:</strong><a class="headerlink" href="#vision_1" title="Permanent link">&para;</a></h3>
<ul>
<li>✅ Є GPU (NVIDIA з 8GB+ VRAM)</li>
<li>✅ Є багато RAM (32GB+)</li>
<li>✅ Немає бюджету на API</li>
<li>✅ Потрібна максимальна приватність</li>
</ul>
<h3 id="api"><strong>Раджу використовувати API ЯКЩО:</strong><a class="headerlink" href="#api" title="Permanent link">&para;</a></h3>
<ul>
<li>✅ Є бюджет ($30-90/місяць)</li>
<li>✅ Потрібна найкраща якість</li>
<li>✅ Немає GPU</li>
<li>✅ Потрібна швидкість</li>
</ul>
<hr />
<h2 id="_5">🎯 Конкретний план для тебе<a class="headerlink" href="#_5" title="Permanent link">&para;</a></h2>
<h3 id="1-gpu"><strong>Сценарій 1: Є GPU + немає бюджету</strong> 🖥️<a class="headerlink" href="#1-gpu" title="Permanent link">&para;</a></h3>
<div class="codehilite"><pre><span></span><code><span class="c1"># Завантажити LLaVA через Ollama</span>
ollama<span class="w"> </span>pull<span class="w"> </span>llava:7b<span class="w"> </span><span class="c1"># ~7 GB</span>
<span class="c1"># АБО легший варіант</span>
ollama<span class="w"> </span>pull<span class="w"> </span>llava:13b<span class="w"> </span><span class="c1"># ~13 GB, краща якість</span>
</code></pre></div>
<p><strong>Інтеграція</strong>:</p>
<div class="codehilite"><pre><span></span><code><span class="c1"># router_handler.py</span>
<span class="k">async</span> <span class="k">def</span><span class="w"> </span><span class="nf">_analyze_photo_local</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">image_url</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
<span class="w"> </span><span class="sd">&quot;&quot;&quot;Використати локальний LLaVA&quot;&quot;&quot;</span>
<span class="n">response</span> <span class="o">=</span> <span class="k">await</span> <span class="n">httpx</span><span class="o">.</span><span class="n">post</span><span class="p">(</span>
<span class="s2">&quot;http://localhost:11434/api/generate&quot;</span><span class="p">,</span>
<span class="n">json</span><span class="o">=</span><span class="p">{</span>
<span class="s2">&quot;model&quot;</span><span class="p">:</span> <span class="s2">&quot;llava:7b&quot;</span><span class="p">,</span>
<span class="s2">&quot;prompt&quot;</span><span class="p">:</span> <span class="sa">f</span><span class="s2">&quot;Опиши детально що на цьому зображенні: </span><span class="si">{</span><span class="n">image_url</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
<span class="s2">&quot;images&quot;</span><span class="p">:</span> <span class="p">[</span><span class="n">image_url</span><span class="p">]</span>
<span class="p">}</span>
<span class="p">)</span>
<span class="k">return</span> <span class="n">response</span><span class="o">.</span><span class="n">json</span><span class="p">()[</span><span class="s2">&quot;response&quot;</span><span class="p">]</span>
</code></pre></div>
<hr />
<h3 id="2-gpu"><strong>Сценарій 2: Немає GPU + є бюджет</strong> 💰<a class="headerlink" href="#2-gpu" title="Permanent link">&para;</a></h3>
<div class="codehilite"><pre><span></span><code><span class="c1"># router_handler.py</span>
<span class="k">async</span> <span class="k">def</span><span class="w"> </span><span class="nf">_analyze_photo_api</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">image_url</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
<span class="w"> </span><span class="sd">&quot;&quot;&quot;Використати GPT-4V через API&quot;&quot;&quot;</span>
<span class="kn">import</span><span class="w"> </span><span class="nn">openai</span>
<span class="n">openai</span><span class="o">.</span><span class="n">api_key</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">getenv</span><span class="p">(</span><span class="s2">&quot;OPENAI_API_KEY&quot;</span><span class="p">)</span>
<span class="n">response</span> <span class="o">=</span> <span class="n">openai</span><span class="o">.</span><span class="n">ChatCompletion</span><span class="o">.</span><span class="n">create</span><span class="p">(</span>
<span class="n">model</span><span class="o">=</span><span class="s2">&quot;gpt-4-vision-preview&quot;</span><span class="p">,</span>
<span class="n">messages</span><span class="o">=</span><span class="p">[{</span>
<span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;user&quot;</span><span class="p">,</span>
<span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="p">[</span>
<span class="p">{</span><span class="s2">&quot;type&quot;</span><span class="p">:</span> <span class="s2">&quot;text&quot;</span><span class="p">,</span> <span class="s2">&quot;text&quot;</span><span class="p">:</span> <span class="s2">&quot;Опиши детально що на цьому зображенні&quot;</span><span class="p">},</span>
<span class="p">{</span><span class="s2">&quot;type&quot;</span><span class="p">:</span> <span class="s2">&quot;image_url&quot;</span><span class="p">,</span> <span class="s2">&quot;image_url&quot;</span><span class="p">:</span> <span class="p">{</span><span class="s2">&quot;url&quot;</span><span class="p">:</span> <span class="n">image_url</span><span class="p">}}</span>
<span class="p">]</span>
<span class="p">}]</span>
<span class="p">)</span>
<span class="k">return</span> <span class="n">response</span><span class="o">.</span><span class="n">choices</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">message</span><span class="o">.</span><span class="n">content</span>
</code></pre></div>
<hr />
<h3 id="3-gpu"><strong>Сценарій 3: Немає GPU + немає бюджету</strong> ⚠️<a class="headerlink" href="#3-gpu" title="Permanent link">&para;</a></h3>
<p><strong>Рекомендація</strong>:
- ⚠️ <strong>НЕ завантажувати важкі Vision моделі</strong> (буде дуже повільно)
- ✅ Використовувати <strong>BLIP-2</strong> (легший, ~1-2 GB)
- АБО залишити заглушку поки не з'явиться GPU/бюджет</p>
<hr />
<h2 id="_6">📊 Порівняння<a class="headerlink" href="#_6" title="Permanent link">&para;</a></h2>
<table>
<thead>
<tr>
<th>Критерій</th>
<th>Локальний (LLaVA)</th>
<th>API (GPT-4V)</th>
</tr>
</thead>
<tbody>
<tr>
<td><strong>Вартість</strong></td>
<td>Безкоштовно</td>
<td>$0.01-0.03/зображення</td>
</tr>
<tr>
<td><strong>Швидкість (CPU)</strong></td>
<td>30-60 сек</td>
<td>2-5 сек</td>
</tr>
<tr>
<td><strong>Швидкість (GPU)</strong></td>
<td>2-5 сек</td>
<td>2-5 сек</td>
</tr>
<tr>
<td><strong>Якість</strong></td>
<td>7/10</td>
<td>10/10</td>
</tr>
<tr>
<td><strong>Приватність</strong></td>
<td>✅ Повна</td>
<td>❌ Дані в OpenAI</td>
</tr>
<tr>
<td><strong>Розмір</strong></td>
<td>7-13 GB</td>
<td>0 GB</td>
</tr>
<tr>
<td><strong>GPU потрібен</strong></td>
<td>✅ Так</td>
<td>Ні</td>
</tr>
</tbody>
</table>
<hr />
<h2 id="_7">🚀 Що робити зараз?<a class="headerlink" href="#_7" title="Permanent link">&para;</a></h2>
<h3 id="1-gpu_1"><strong>Крок 1: Перевірити чи є GPU</strong><a class="headerlink" href="#1-gpu_1" title="Permanent link">&para;</a></h3>
<div class="codehilite"><pre><span></span><code>ssh<span class="w"> </span>root@144.76.224.179<span class="w"> </span><span class="s2">&quot;nvidia-smi&quot;</span>
<span class="c1"># АБО</span>
ssh<span class="w"> </span>root@144.76.224.179<span class="w"> </span><span class="s2">&quot;lspci | grep -i nvidia&quot;</span>
</code></pre></div>
<h3 id="2-openai-api-key"><strong>Крок 2: Перевірити чи є OpenAI API key</strong><a class="headerlink" href="#2-openai-api-key" title="Permanent link">&para;</a></h3>
<div class="codehilite"><pre><span></span><code>ssh<span class="w"> </span>root@144.76.224.179<span class="w"> </span><span class="s2">&quot;docker exec docker-api-1 env | grep OPENAI_API_KEY&quot;</span>
</code></pre></div>
<h3 id="3"><strong>Крок 3: Вирішити стратегію</strong><a class="headerlink" href="#3" title="Permanent link">&para;</a></h3>
<ul>
<li><strong>Якщо є GPU</strong> → Локальний LLaVA</li>
<li><strong>Якщо є API key</strong> → GPT-4V через API</li>
<li><strong>Якщо нічого</strong> → Заглушка поки</li>
</ul>
<hr />
<h2 id="_8">💬 Моя думка<a class="headerlink" href="#_8" title="Permanent link">&para;</a></h2>
<p><strong>Я НЕ раджу завантажувати важкі моделі БЕЗ GPU</strong> - буде дуже повільно і користувачі будуть невдоволені.</p>
<p><strong>Якщо є GPU</strong> - тоді так, локальний LLaVA - чудовий вибір!</p>
<p><strong>Якщо немає GPU</strong> - краще використати API (якщо є бюджет) або залишити заглушку.</p>
<p><strong>Що ти думаєш?</strong> Є GPU? Є бюджет на API? 🎯</p>
<hr />
<p><em>Створено: 2025-11-18</em></p>
</article>
</div>
<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>
</div>
</main>
<footer class="md-footer">
<div class="md-footer-meta md-typeset">
<div class="md-footer-meta__inner md-grid">
<div class="md-copyright">
Made with
<a href="https://squidfunk.github.io/mkdocs-material/" target="_blank" rel="noopener">
Material for MkDocs
</a>
</div>
</div>
</div>
</footer>
</div>
<div class="md-dialog" data-md-component="dialog">
<div class="md-dialog__inner md-typeset"></div>
</div>
<script id="__config" type="application/json">{"base": "..", "features": ["navigation.sections", "navigation.instant", "content.code.copy"], "search": "../assets/javascripts/workers/search.b8dbb3d2.min.js", "translations": {"clipboard.copied": "Copied to clipboard", "clipboard.copy": "Copy to clipboard", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.placeholder": "Type to start searching", "search.result.term.missing": "Missing", "select.version": "Select version"}}</script>
<script src="../assets/javascripts/bundle.3220b9d7.min.js"></script>
</body>
</html>