Complete snapshot of /opt/microdao-daarion/ from NODE1 (144.76.224.179).
This represents the actual running production code that has diverged
significantly from the previous main branch.
Key changes from old main:
- Gateway (http_api.py): expanded from ~40KB to 164KB with full agent support
- Router: new /v1/agents/{id}/infer endpoint with vision + DeepSeek routing
- Behavior Policy: SOWA v2.2 (3-level: FULL/ACK/SILENT)
- Agent Registry: config/agent_registry.yml as single source of truth
- 13 agents configured (was 3)
- Memory service integration
- CrewAI teams and roles
Excluded from snapshot: venv/, .env, data/, backups, .tgz archives
Co-authored-by: Cursor <cursoragent@cursor.com>
1118 lines
36 KiB
HTML
1118 lines
36 KiB
HTML
|
||
<!doctype html>
|
||
<html lang="en" class="no-js">
|
||
<head>
|
||
|
||
<meta charset="utf-8">
|
||
<meta name="viewport" content="width=device-width,initial-scale=1">
|
||
|
||
|
||
|
||
<link rel="canonical" href="https://IvanTytar.github.io/microdao-daarion/STRATEGY_MODELS/">
|
||
|
||
|
||
|
||
|
||
<link rel="icon" href="../assets/images/favicon.png">
|
||
<meta name="generator" content="mkdocs-1.5.3, mkdocs-material-9.5.18">
|
||
|
||
|
||
|
||
<title>🎯 Стратегія вибору моделей: API vs Локальні - DAARION Documentation</title>
|
||
|
||
|
||
|
||
<link rel="stylesheet" href="../assets/stylesheets/main.66ac8b77.min.css">
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
|
||
<link rel="stylesheet" href="https://fonts.googleapis.com/css?family=Roboto:300,300i,400,400i,700,700i%7CRoboto+Mono:400,400i,700,700i&display=fallback">
|
||
<style>:root{--md-text-font:"Roboto";--md-code-font:"Roboto Mono"}</style>
|
||
|
||
|
||
|
||
<script>__md_scope=new URL("..",location),__md_hash=e=>[...e].reduce((e,_)=>(e<<5)-e+_.charCodeAt(0),0),__md_get=(e,_=localStorage,t=__md_scope)=>JSON.parse(_.getItem(t.pathname+"."+e)),__md_set=(e,_,t=localStorage,a=__md_scope)=>{try{t.setItem(a.pathname+"."+e,JSON.stringify(_))}catch(e){}}</script>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
</head>
|
||
|
||
|
||
<body dir="ltr">
|
||
|
||
|
||
<input class="md-toggle" data-md-toggle="drawer" type="checkbox" id="__drawer" autocomplete="off">
|
||
<input class="md-toggle" data-md-toggle="search" type="checkbox" id="__search" autocomplete="off">
|
||
<label class="md-overlay" for="__drawer"></label>
|
||
<div data-md-component="skip">
|
||
|
||
|
||
<a href="#api-vs" class="md-skip">
|
||
Skip to content
|
||
</a>
|
||
|
||
</div>
|
||
<div data-md-component="announce">
|
||
|
||
</div>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<header class="md-header md-header--shadow" data-md-component="header">
|
||
<nav class="md-header__inner md-grid" aria-label="Header">
|
||
<a href=".." title="DAARION Documentation" class="md-header__button md-logo" aria-label="DAARION Documentation" data-md-component="logo">
|
||
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54Z"/></svg>
|
||
|
||
</a>
|
||
<label class="md-header__button md-icon" for="__drawer">
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M3 6h18v2H3V6m0 5h18v2H3v-2m0 5h18v2H3v-2Z"/></svg>
|
||
</label>
|
||
<div class="md-header__title" data-md-component="header-title">
|
||
<div class="md-header__ellipsis">
|
||
<div class="md-header__topic">
|
||
<span class="md-ellipsis">
|
||
DAARION Documentation
|
||
</span>
|
||
</div>
|
||
<div class="md-header__topic" data-md-component="header-topic">
|
||
<span class="md-ellipsis">
|
||
|
||
🎯 Стратегія вибору моделей: API vs Локальні
|
||
|
||
</span>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
|
||
|
||
<script>var media,input,key,value,palette=__md_get("__palette");if(palette&&palette.color){"(prefers-color-scheme)"===palette.color.media&&(media=matchMedia("(prefers-color-scheme: light)"),input=document.querySelector(media.matches?"[data-md-color-media='(prefers-color-scheme: light)']":"[data-md-color-media='(prefers-color-scheme: dark)']"),palette.color.media=input.getAttribute("data-md-color-media"),palette.color.scheme=input.getAttribute("data-md-color-scheme"),palette.color.primary=input.getAttribute("data-md-color-primary"),palette.color.accent=input.getAttribute("data-md-color-accent"));for([key,value]of Object.entries(palette.color))document.body.setAttribute("data-md-color-"+key,value)}</script>
|
||
|
||
|
||
|
||
<label class="md-header__button md-icon" for="__search">
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.516 6.516 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5Z"/></svg>
|
||
</label>
|
||
<div class="md-search" data-md-component="search" role="dialog">
|
||
<label class="md-search__overlay" for="__search"></label>
|
||
<div class="md-search__inner" role="search">
|
||
<form class="md-search__form" name="search">
|
||
<input type="text" class="md-search__input" name="query" aria-label="Search" placeholder="Search" autocapitalize="off" autocorrect="off" autocomplete="off" spellcheck="false" data-md-component="search-query" required>
|
||
<label class="md-search__icon md-icon" for="__search">
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.516 6.516 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5Z"/></svg>
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M20 11v2H8l5.5 5.5-1.42 1.42L4.16 12l7.92-7.92L13.5 5.5 8 11h12Z"/></svg>
|
||
</label>
|
||
<nav class="md-search__options" aria-label="Search">
|
||
|
||
<button type="reset" class="md-search__icon md-icon" title="Clear" aria-label="Clear" tabindex="-1">
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M19 6.41 17.59 5 12 10.59 6.41 5 5 6.41 10.59 12 5 17.59 6.41 19 12 13.41 17.59 19 19 17.59 13.41 12 19 6.41Z"/></svg>
|
||
</button>
|
||
</nav>
|
||
|
||
</form>
|
||
<div class="md-search__output">
|
||
<div class="md-search__scrollwrap" data-md-scrollfix>
|
||
<div class="md-search-result" data-md-component="search-result">
|
||
<div class="md-search-result__meta">
|
||
Initializing search
|
||
</div>
|
||
<ol class="md-search-result__list" role="presentation"></ol>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
|
||
|
||
</nav>
|
||
|
||
</header>
|
||
|
||
<div class="md-container" data-md-component="container">
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<main class="md-main" data-md-component="main">
|
||
<div class="md-main__inner md-grid">
|
||
|
||
|
||
|
||
<div class="md-sidebar md-sidebar--primary" data-md-component="sidebar" data-md-type="navigation" >
|
||
<div class="md-sidebar__scrollwrap">
|
||
<div class="md-sidebar__inner">
|
||
|
||
|
||
|
||
|
||
<nav class="md-nav md-nav--primary" aria-label="Navigation" data-md-level="0">
|
||
<label class="md-nav__title" for="__drawer">
|
||
<a href=".." title="DAARION Documentation" class="md-nav__button md-logo" aria-label="DAARION Documentation" data-md-component="logo">
|
||
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54Z"/></svg>
|
||
|
||
</a>
|
||
DAARION Documentation
|
||
</label>
|
||
|
||
<ul class="md-nav__list" data-md-scrollfix>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../public/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Home
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../public/getting-started/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Getting Started
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../public/architecture-overview/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Architecture
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../public/daiS_daos_overview/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
DAIS & DAOS
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item md-nav__item--section md-nav__item--nested">
|
||
|
||
|
||
|
||
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5" >
|
||
|
||
|
||
<label class="md-nav__link" for="__nav_5" id="__nav_5_label" tabindex="">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Internal
|
||
</span>
|
||
|
||
|
||
<span class="md-nav__icon md-icon"></span>
|
||
</label>
|
||
|
||
<nav class="md-nav" data-md-level="1" aria-labelledby="__nav_5_label" aria-expanded="false">
|
||
<label class="md-nav__title" for="__nav_5">
|
||
<span class="md-nav__icon md-icon"></span>
|
||
Internal
|
||
</label>
|
||
<ul class="md-nav__list" data-md-scrollfix>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item md-nav__item--nested">
|
||
|
||
|
||
|
||
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5_1" >
|
||
|
||
|
||
<label class="md-nav__link" for="__nav_5_1" id="__nav_5_1_label" tabindex="0">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Infra
|
||
</span>
|
||
|
||
|
||
<span class="md-nav__icon md-icon"></span>
|
||
</label>
|
||
|
||
<nav class="md-nav" data-md-level="2" aria-labelledby="__nav_5_1_label" aria-expanded="false">
|
||
<label class="md-nav__title" for="__nav_5_1">
|
||
<span class="md-nav__icon md-icon"></span>
|
||
Infra
|
||
</label>
|
||
<ul class="md-nav__list" data-md-scrollfix>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/infra/INFRA_AUTOMATION_PACK_V1/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Infra Automation Pack v1
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/infra/monitoring_overview/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Monitoring Overview
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/infra/nodes_registry_v0/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Nodes Registry v0
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item md-nav__item--nested">
|
||
|
||
|
||
|
||
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5_2" >
|
||
|
||
|
||
<label class="md-nav__link" for="__nav_5_2" id="__nav_5_2_label" tabindex="0">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Specs
|
||
</span>
|
||
|
||
|
||
<span class="md-nav__icon md-icon"></span>
|
||
</label>
|
||
|
||
<nav class="md-nav" data-md-level="2" aria-labelledby="__nav_5_2_label" aria-expanded="false">
|
||
<label class="md-nav__title" for="__nav_5_2">
|
||
<span class="md-nav__icon md-icon"></span>
|
||
Specs
|
||
</label>
|
||
<ul class="md-nav__list" data-md-scrollfix>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/specs/matrix_presence_aggregator/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Matrix Presence Aggregator
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/specs/city_map_spec/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
City Map Spec
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/specs/node_join_protocol_draft/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Node Join Protocol (Draft)
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
|
||
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
|
||
|
||
</ul>
|
||
</nav>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
|
||
|
||
|
||
<div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" >
|
||
<div class="md-sidebar__scrollwrap">
|
||
<div class="md-sidebar__inner">
|
||
|
||
|
||
<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<label class="md-nav__title" for="__toc">
|
||
<span class="md-nav__icon md-icon"></span>
|
||
Table of contents
|
||
</label>
|
||
<ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_1" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
📊 Поточна ситуація
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="📊 Поточна ситуація">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_2" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Що вже є на сервері:
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="Що вже є на сервері:">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#1-ollama" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
1. Локальні моделі (Ollama) ✅
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#2-dify-platform" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
2. Dify Platform ✅
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#3-vision-encoder" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
3. Vision Encoder ✅
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_3" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
🤔 Варіанти стратегії
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="🤔 Варіанти стратегії">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#a-api-openaianthropic" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Варіант A: API моделі (OpenAI/Anthropic) 💰
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#b-vision" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Варіант B: Локальні Vision моделі 🖥️
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#c" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Варіант C: Гібридний підхід 🎯 (РЕКОМЕНДОВАНО)
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_4" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
💡 Моя рекомендація
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="💡 Моя рекомендація">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#vision" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
НЕ раджу завантажувати важкі Vision моделі ЯКЩО:
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#vision_1" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Раджу завантажити ЛОКАЛЬНІ Vision моделі ЯКЩО:
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#api" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Раджу використовувати API ЯКЩО:
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_5" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
🎯 Конкретний план для тебе
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="🎯 Конкретний план для тебе">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#1-gpu" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Сценарій 1: Є GPU + немає бюджету 🖥️
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#2-gpu" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Сценарій 2: Немає GPU + є бюджет 💰
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#3-gpu" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Сценарій 3: Немає GPU + немає бюджету ⚠️
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_6" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
📊 Порівняння
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_7" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
🚀 Що робити зараз?
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="🚀 Що робити зараз?">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#1-gpu_1" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Крок 1: Перевірити чи є GPU
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#2-openai-api-key" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Крок 2: Перевірити чи є OpenAI API key
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#3" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Крок 3: Вирішити стратегію
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_8" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
💬 Моя думка
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
|
||
</nav>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
|
||
|
||
|
||
<div class="md-content" data-md-component="content">
|
||
<article class="md-content__inner md-typeset">
|
||
|
||
|
||
|
||
|
||
<h1 id="api-vs">🎯 Стратегія вибору моделей: API vs Локальні<a class="headerlink" href="#api-vs" title="Permanent link">¶</a></h1>
|
||
<p><strong>Дата</strong>: 2025-11-18<br />
|
||
<strong>Питання</strong>: Використовувати Dify/API чи завантажувати важкі моделі?</p>
|
||
<hr />
|
||
<h2 id="_1">📊 Поточна ситуація<a class="headerlink" href="#_1" title="Permanent link">¶</a></h2>
|
||
<h3 id="_2">Що вже є на сервері:<a class="headerlink" href="#_2" title="Permanent link">¶</a></h3>
|
||
<h4 id="1-ollama">1. <strong>Локальні моделі (Ollama)</strong> ✅<a class="headerlink" href="#1-ollama" title="Permanent link">¶</a></h4>
|
||
<ul>
|
||
<li><strong>qwen3:8b</strong> - вже завантажена (5.2 GB)</li>
|
||
<li><strong>Використання</strong>: DAGI Router використовує для DAARWIZZ, Helion, GREENFOOD</li>
|
||
<li><strong>Переваги</strong>: </li>
|
||
<li>✅ Безкоштовно</li>
|
||
<li>✅ Приватно (дані не йдуть в OpenAI)</li>
|
||
<li>✅ Працює офлайн</li>
|
||
<li><strong>Недоліки</strong>:</li>
|
||
<li>⚠️ Обмежені можливості (немає Vision, слабший RAG)</li>
|
||
<li>⚠️ Повільніше ніж API</li>
|
||
<li>⚠️ Потребує GPU для швидкості</li>
|
||
</ul>
|
||
<h4 id="2-dify-platform">2. <strong>Dify Platform</strong> ✅<a class="headerlink" href="#2-dify-platform" title="Permanent link">¶</a></h4>
|
||
<ul>
|
||
<li><strong>Статус</strong>: Працює, але потребує API ключі</li>
|
||
<li><strong>OPENAI_API_BASE</strong>: https://api.openai.com/v1</li>
|
||
<li><strong>API Key</strong>: Потрібен (не знайдено в env)</li>
|
||
<li><strong>Використання</strong>: Може використовувати GPT-4V, Claude Vision через API</li>
|
||
</ul>
|
||
<h4 id="3-vision-encoder">3. <strong>Vision Encoder</strong> ✅<a class="headerlink" href="#3-vision-encoder" title="Permanent link">¶</a></h4>
|
||
<ul>
|
||
<li><strong>Статус</strong>: Працює (embeddings)</li>
|
||
<li><strong>Обмеження</strong>: Тільки векторизація, не опис зображень</li>
|
||
</ul>
|
||
<hr />
|
||
<h2 id="_3">🤔 Варіанти стратегії<a class="headerlink" href="#_3" title="Permanent link">¶</a></h2>
|
||
<h3 id="a-api-openaianthropic"><strong>Варіант A: API моделі (OpenAI/Anthropic)</strong> 💰<a class="headerlink" href="#a-api-openaianthropic" title="Permanent link">¶</a></h3>
|
||
<p><strong>Що потрібно</strong>:
|
||
- OpenAI API key (для GPT-4V)
|
||
- АБО Anthropic API key (для Claude Vision)</p>
|
||
<p><strong>Переваги</strong>:
|
||
- ✅ <strong>GPT-4V</strong> - найкращий Vision AI
|
||
- ✅ <strong>Claude 3 Vision</strong> - теж дуже хороший
|
||
- ✅ Швидко (API)
|
||
- ✅ Не потребує завантаження моделей
|
||
- ✅ Оновлення автоматично</p>
|
||
<p><strong>Недоліки</strong>:
|
||
- ❌ <strong>Коштує грошей</strong> ($0.01-0.03 за image)
|
||
- ❌ Дані йдуть в OpenAI/Anthropic
|
||
- ❌ Залежність від інтернету</p>
|
||
<p><strong>Вартість</strong> (приблизно):
|
||
- GPT-4V: ~$0.01-0.03 за зображення
|
||
- Claude Vision: ~$0.01-0.015 за зображення
|
||
- При 100 фото/день = $1-3/день = $30-90/місяць</p>
|
||
<hr />
|
||
<h3 id="b-vision"><strong>Варіант B: Локальні Vision моделі</strong> 🖥️<a class="headerlink" href="#b-vision" title="Permanent link">¶</a></h3>
|
||
<p><strong>Що потрібно завантажити</strong>:
|
||
- <strong>LLaVA</strong> (Large Language and Vision Assistant) - ~7-13 GB
|
||
- АБО <strong>BLIP-2</strong> - ~1-2 GB
|
||
- АБО <strong>InstructBLIP</strong> - ~1-2 GB</p>
|
||
<p><strong>Переваги</strong>:
|
||
- ✅ Безкоштовно
|
||
- ✅ Приватно
|
||
- ✅ Працює офлайн</p>
|
||
<p><strong>Недоліки</strong>:
|
||
- ❌ <strong>Потребує GPU</strong> для швидкості (CPU дуже повільно)
|
||
- ❌ Великі файли (7-13 GB)
|
||
- ❌ Гірша якість ніж GPT-4V
|
||
- ❌ Потребує багато RAM (16GB+)</p>
|
||
<p><strong>Час обробки</strong> (на CPU):
|
||
- LLaVA: ~30-60 секунд на зображення
|
||
- BLIP-2: ~10-20 секунд</p>
|
||
<p><strong>Час обробки</strong> (на GPU):
|
||
- LLaVA: ~2-5 секунд
|
||
- BLIP-2: ~1-2 секунди</p>
|
||
<hr />
|
||
<h3 id="c"><strong>Варіант C: Гібридний підхід</strong> 🎯 (РЕКОМЕНДОВАНО)<a class="headerlink" href="#c" title="Permanent link">¶</a></h3>
|
||
<p><strong>Що робити</strong>:
|
||
1. <strong>Для базових агентів</strong> (DAARWIZZ, Helion, GREENFOOD):
|
||
- ✅ Використовувати <strong>локальний qwen3:8b</strong> (вже є)
|
||
- ✅ Безкоштовно, приватно</p>
|
||
<ol>
|
||
<li><strong>Для Vision</strong> (опис зображень):</li>
|
||
<li><strong>Варіант C1</strong>: API (якщо є бюджет)<ul>
|
||
<li>GPT-4V через OpenAI API</li>
|
||
<li>АБО Claude Vision через Anthropic API</li>
|
||
</ul>
|
||
</li>
|
||
<li>
|
||
<p><strong>Варіант C2</strong>: Локальний (якщо немає бюджету)</p>
|
||
<ul>
|
||
<li>LLaVA через Ollama (якщо є GPU)</li>
|
||
<li>АБО BLIP-2 (легший варіант)</li>
|
||
</ul>
|
||
</li>
|
||
<li>
|
||
<p><strong>Для RAG</strong>:</p>
|
||
</li>
|
||
<li>✅ Використовувати <strong>Qdrant</strong> (вже працює)</li>
|
||
<li>✅ Використовувати <strong>Weaviate</strong> (вже працює, частина Dify)</li>
|
||
<li>
|
||
<p>❌ НЕ використовувати Dify RAG (потребує API)</p>
|
||
</li>
|
||
<li>
|
||
<p><strong>Для Web Search</strong>:</p>
|
||
</li>
|
||
<li>✅ Використовувати <strong>CrewAI</strong> (вже працює)</li>
|
||
<li>✅ CrewAI може використовувати локальні моделі</li>
|
||
</ol>
|
||
<hr />
|
||
<h2 id="_4">💡 Моя рекомендація<a class="headerlink" href="#_4" title="Permanent link">¶</a></h2>
|
||
<h3 id="vision"><strong>НЕ раджу завантажувати важкі Vision моделі ЯКЩО:</strong><a class="headerlink" href="#vision" title="Permanent link">¶</a></h3>
|
||
<ul>
|
||
<li>❌ Немає GPU (CPU буде дуже повільно)</li>
|
||
<li>❌ Немає багато RAM (16GB+)</li>
|
||
<li>❌ Немає місця на диску (7-13 GB)</li>
|
||
</ul>
|
||
<h3 id="vision_1"><strong>Раджу завантажити ЛОКАЛЬНІ Vision моделі ЯКЩО:</strong><a class="headerlink" href="#vision_1" title="Permanent link">¶</a></h3>
|
||
<ul>
|
||
<li>✅ Є GPU (NVIDIA з 8GB+ VRAM)</li>
|
||
<li>✅ Є багато RAM (32GB+)</li>
|
||
<li>✅ Немає бюджету на API</li>
|
||
<li>✅ Потрібна максимальна приватність</li>
|
||
</ul>
|
||
<h3 id="api"><strong>Раджу використовувати API ЯКЩО:</strong><a class="headerlink" href="#api" title="Permanent link">¶</a></h3>
|
||
<ul>
|
||
<li>✅ Є бюджет ($30-90/місяць)</li>
|
||
<li>✅ Потрібна найкраща якість</li>
|
||
<li>✅ Немає GPU</li>
|
||
<li>✅ Потрібна швидкість</li>
|
||
</ul>
|
||
<hr />
|
||
<h2 id="_5">🎯 Конкретний план для тебе<a class="headerlink" href="#_5" title="Permanent link">¶</a></h2>
|
||
<h3 id="1-gpu"><strong>Сценарій 1: Є GPU + немає бюджету</strong> 🖥️<a class="headerlink" href="#1-gpu" title="Permanent link">¶</a></h3>
|
||
<div class="codehilite"><pre><span></span><code><span class="c1"># Завантажити LLaVA через Ollama</span>
|
||
ollama<span class="w"> </span>pull<span class="w"> </span>llava:7b<span class="w"> </span><span class="c1"># ~7 GB</span>
|
||
<span class="c1"># АБО легший варіант</span>
|
||
ollama<span class="w"> </span>pull<span class="w"> </span>llava:13b<span class="w"> </span><span class="c1"># ~13 GB, краща якість</span>
|
||
</code></pre></div>
|
||
|
||
<p><strong>Інтеграція</strong>:</p>
|
||
<div class="codehilite"><pre><span></span><code><span class="c1"># router_handler.py</span>
|
||
<span class="k">async</span> <span class="k">def</span><span class="w"> </span><span class="nf">_analyze_photo_local</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">image_url</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
|
||
<span class="w"> </span><span class="sd">"""Використати локальний LLaVA"""</span>
|
||
<span class="n">response</span> <span class="o">=</span> <span class="k">await</span> <span class="n">httpx</span><span class="o">.</span><span class="n">post</span><span class="p">(</span>
|
||
<span class="s2">"http://localhost:11434/api/generate"</span><span class="p">,</span>
|
||
<span class="n">json</span><span class="o">=</span><span class="p">{</span>
|
||
<span class="s2">"model"</span><span class="p">:</span> <span class="s2">"llava:7b"</span><span class="p">,</span>
|
||
<span class="s2">"prompt"</span><span class="p">:</span> <span class="sa">f</span><span class="s2">"Опиши детально що на цьому зображенні: </span><span class="si">{</span><span class="n">image_url</span><span class="si">}</span><span class="s2">"</span><span class="p">,</span>
|
||
<span class="s2">"images"</span><span class="p">:</span> <span class="p">[</span><span class="n">image_url</span><span class="p">]</span>
|
||
<span class="p">}</span>
|
||
<span class="p">)</span>
|
||
<span class="k">return</span> <span class="n">response</span><span class="o">.</span><span class="n">json</span><span class="p">()[</span><span class="s2">"response"</span><span class="p">]</span>
|
||
</code></pre></div>
|
||
|
||
<hr />
|
||
<h3 id="2-gpu"><strong>Сценарій 2: Немає GPU + є бюджет</strong> 💰<a class="headerlink" href="#2-gpu" title="Permanent link">¶</a></h3>
|
||
<div class="codehilite"><pre><span></span><code><span class="c1"># router_handler.py</span>
|
||
<span class="k">async</span> <span class="k">def</span><span class="w"> </span><span class="nf">_analyze_photo_api</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">image_url</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
|
||
<span class="w"> </span><span class="sd">"""Використати GPT-4V через API"""</span>
|
||
<span class="kn">import</span><span class="w"> </span><span class="nn">openai</span>
|
||
<span class="n">openai</span><span class="o">.</span><span class="n">api_key</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">getenv</span><span class="p">(</span><span class="s2">"OPENAI_API_KEY"</span><span class="p">)</span>
|
||
|
||
<span class="n">response</span> <span class="o">=</span> <span class="n">openai</span><span class="o">.</span><span class="n">ChatCompletion</span><span class="o">.</span><span class="n">create</span><span class="p">(</span>
|
||
<span class="n">model</span><span class="o">=</span><span class="s2">"gpt-4-vision-preview"</span><span class="p">,</span>
|
||
<span class="n">messages</span><span class="o">=</span><span class="p">[{</span>
|
||
<span class="s2">"role"</span><span class="p">:</span> <span class="s2">"user"</span><span class="p">,</span>
|
||
<span class="s2">"content"</span><span class="p">:</span> <span class="p">[</span>
|
||
<span class="p">{</span><span class="s2">"type"</span><span class="p">:</span> <span class="s2">"text"</span><span class="p">,</span> <span class="s2">"text"</span><span class="p">:</span> <span class="s2">"Опиши детально що на цьому зображенні"</span><span class="p">},</span>
|
||
<span class="p">{</span><span class="s2">"type"</span><span class="p">:</span> <span class="s2">"image_url"</span><span class="p">,</span> <span class="s2">"image_url"</span><span class="p">:</span> <span class="p">{</span><span class="s2">"url"</span><span class="p">:</span> <span class="n">image_url</span><span class="p">}}</span>
|
||
<span class="p">]</span>
|
||
<span class="p">}]</span>
|
||
<span class="p">)</span>
|
||
<span class="k">return</span> <span class="n">response</span><span class="o">.</span><span class="n">choices</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">message</span><span class="o">.</span><span class="n">content</span>
|
||
</code></pre></div>
|
||
|
||
<hr />
|
||
<h3 id="3-gpu"><strong>Сценарій 3: Немає GPU + немає бюджету</strong> ⚠️<a class="headerlink" href="#3-gpu" title="Permanent link">¶</a></h3>
|
||
<p><strong>Рекомендація</strong>:
|
||
- ⚠️ <strong>НЕ завантажувати важкі Vision моделі</strong> (буде дуже повільно)
|
||
- ✅ Використовувати <strong>BLIP-2</strong> (легший, ~1-2 GB)
|
||
- АБО залишити заглушку поки не з'явиться GPU/бюджет</p>
|
||
<hr />
|
||
<h2 id="_6">📊 Порівняння<a class="headerlink" href="#_6" title="Permanent link">¶</a></h2>
|
||
<table>
|
||
<thead>
|
||
<tr>
|
||
<th>Критерій</th>
|
||
<th>Локальний (LLaVA)</th>
|
||
<th>API (GPT-4V)</th>
|
||
</tr>
|
||
</thead>
|
||
<tbody>
|
||
<tr>
|
||
<td><strong>Вартість</strong></td>
|
||
<td>Безкоштовно</td>
|
||
<td>$0.01-0.03/зображення</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Швидкість (CPU)</strong></td>
|
||
<td>30-60 сек</td>
|
||
<td>2-5 сек</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Швидкість (GPU)</strong></td>
|
||
<td>2-5 сек</td>
|
||
<td>2-5 сек</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Якість</strong></td>
|
||
<td>7/10</td>
|
||
<td>10/10</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Приватність</strong></td>
|
||
<td>✅ Повна</td>
|
||
<td>❌ Дані в OpenAI</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Розмір</strong></td>
|
||
<td>7-13 GB</td>
|
||
<td>0 GB</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>GPU потрібен</strong></td>
|
||
<td>✅ Так</td>
|
||
<td>❌ Ні</td>
|
||
</tr>
|
||
</tbody>
|
||
</table>
|
||
<hr />
|
||
<h2 id="_7">🚀 Що робити зараз?<a class="headerlink" href="#_7" title="Permanent link">¶</a></h2>
|
||
<h3 id="1-gpu_1"><strong>Крок 1: Перевірити чи є GPU</strong><a class="headerlink" href="#1-gpu_1" title="Permanent link">¶</a></h3>
|
||
<div class="codehilite"><pre><span></span><code>ssh<span class="w"> </span>root@144.76.224.179<span class="w"> </span><span class="s2">"nvidia-smi"</span>
|
||
<span class="c1"># АБО</span>
|
||
ssh<span class="w"> </span>root@144.76.224.179<span class="w"> </span><span class="s2">"lspci | grep -i nvidia"</span>
|
||
</code></pre></div>
|
||
|
||
<h3 id="2-openai-api-key"><strong>Крок 2: Перевірити чи є OpenAI API key</strong><a class="headerlink" href="#2-openai-api-key" title="Permanent link">¶</a></h3>
|
||
<div class="codehilite"><pre><span></span><code>ssh<span class="w"> </span>root@144.76.224.179<span class="w"> </span><span class="s2">"docker exec docker-api-1 env | grep OPENAI_API_KEY"</span>
|
||
</code></pre></div>
|
||
|
||
<h3 id="3"><strong>Крок 3: Вирішити стратегію</strong><a class="headerlink" href="#3" title="Permanent link">¶</a></h3>
|
||
<ul>
|
||
<li><strong>Якщо є GPU</strong> → Локальний LLaVA</li>
|
||
<li><strong>Якщо є API key</strong> → GPT-4V через API</li>
|
||
<li><strong>Якщо нічого</strong> → Заглушка поки</li>
|
||
</ul>
|
||
<hr />
|
||
<h2 id="_8">💬 Моя думка<a class="headerlink" href="#_8" title="Permanent link">¶</a></h2>
|
||
<p><strong>Я НЕ раджу завантажувати важкі моделі БЕЗ GPU</strong> - буде дуже повільно і користувачі будуть невдоволені.</p>
|
||
<p><strong>Якщо є GPU</strong> - тоді так, локальний LLaVA - чудовий вибір!</p>
|
||
<p><strong>Якщо немає GPU</strong> - краще використати API (якщо є бюджет) або залишити заглушку.</p>
|
||
<p><strong>Що ти думаєш?</strong> Є GPU? Є бюджет на API? 🎯</p>
|
||
<hr />
|
||
<p><em>Створено: 2025-11-18</em></p>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
</article>
|
||
</div>
|
||
|
||
|
||
<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>
|
||
</div>
|
||
|
||
</main>
|
||
|
||
<footer class="md-footer">
|
||
|
||
<div class="md-footer-meta md-typeset">
|
||
<div class="md-footer-meta__inner md-grid">
|
||
<div class="md-copyright">
|
||
|
||
|
||
Made with
|
||
<a href="https://squidfunk.github.io/mkdocs-material/" target="_blank" rel="noopener">
|
||
Material for MkDocs
|
||
</a>
|
||
|
||
</div>
|
||
|
||
</div>
|
||
</div>
|
||
</footer>
|
||
|
||
</div>
|
||
<div class="md-dialog" data-md-component="dialog">
|
||
<div class="md-dialog__inner md-typeset"></div>
|
||
</div>
|
||
|
||
|
||
<script id="__config" type="application/json">{"base": "..", "features": ["navigation.sections", "navigation.instant", "content.code.copy"], "search": "../assets/javascripts/workers/search.b8dbb3d2.min.js", "translations": {"clipboard.copied": "Copied to clipboard", "clipboard.copy": "Copy to clipboard", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.placeholder": "Type to start searching", "search.result.term.missing": "Missing", "select.version": "Select version"}}</script>
|
||
|
||
|
||
<script src="../assets/javascripts/bundle.3220b9d7.min.js"></script>
|
||
|
||
|
||
</body>
|
||
</html> |