Complete snapshot of /opt/microdao-daarion/ from NODE1 (144.76.224.179).
This represents the actual running production code that has diverged
significantly from the previous main branch.
Key changes from old main:
- Gateway (http_api.py): expanded from ~40KB to 164KB with full agent support
- Router: new /v1/agents/{id}/infer endpoint with vision + DeepSeek routing
- Behavior Policy: SOWA v2.2 (3-level: FULL/ACK/SILENT)
- Agent Registry: config/agent_registry.yml as single source of truth
- 13 agents configured (was 3)
- Memory service integration
- CrewAI teams and roles
Excluded from snapshot: venv/, .env, data/, backups, .tgz archives
Co-authored-by: Cursor <cursoragent@cursor.com>
937 lines
27 KiB
HTML
937 lines
27 KiB
HTML
|
||
<!doctype html>
|
||
<html lang="en" class="no-js">
|
||
<head>
|
||
|
||
<meta charset="utf-8">
|
||
<meta name="viewport" content="width=device-width,initial-scale=1">
|
||
|
||
|
||
|
||
<link rel="canonical" href="https://IvanTytar.github.io/microdao-daarion/VLLM-VS-SWAPPER-ANALYSIS/">
|
||
|
||
|
||
|
||
|
||
<link rel="icon" href="../assets/images/favicon.png">
|
||
<meta name="generator" content="mkdocs-1.5.3, mkdocs-material-9.5.18">
|
||
|
||
|
||
|
||
<title>vLLM vs Swapper Service — Аналіз для DAARION Stack - DAARION Documentation</title>
|
||
|
||
|
||
|
||
<link rel="stylesheet" href="../assets/stylesheets/main.66ac8b77.min.css">
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
|
||
<link rel="stylesheet" href="https://fonts.googleapis.com/css?family=Roboto:300,300i,400,400i,700,700i%7CRoboto+Mono:400,400i,700,700i&display=fallback">
|
||
<style>:root{--md-text-font:"Roboto";--md-code-font:"Roboto Mono"}</style>
|
||
|
||
|
||
|
||
<script>__md_scope=new URL("..",location),__md_hash=e=>[...e].reduce((e,_)=>(e<<5)-e+_.charCodeAt(0),0),__md_get=(e,_=localStorage,t=__md_scope)=>JSON.parse(_.getItem(t.pathname+"."+e)),__md_set=(e,_,t=localStorage,a=__md_scope)=>{try{t.setItem(a.pathname+"."+e,JSON.stringify(_))}catch(e){}}</script>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
</head>
|
||
|
||
|
||
<body dir="ltr">
|
||
|
||
|
||
<input class="md-toggle" data-md-toggle="drawer" type="checkbox" id="__drawer" autocomplete="off">
|
||
<input class="md-toggle" data-md-toggle="search" type="checkbox" id="__search" autocomplete="off">
|
||
<label class="md-overlay" for="__drawer"></label>
|
||
<div data-md-component="skip">
|
||
|
||
|
||
<a href="#vllm-vs-swapper-service-daarion-stack" class="md-skip">
|
||
Skip to content
|
||
</a>
|
||
|
||
</div>
|
||
<div data-md-component="announce">
|
||
|
||
</div>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<header class="md-header md-header--shadow" data-md-component="header">
|
||
<nav class="md-header__inner md-grid" aria-label="Header">
|
||
<a href=".." title="DAARION Documentation" class="md-header__button md-logo" aria-label="DAARION Documentation" data-md-component="logo">
|
||
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54Z"/></svg>
|
||
|
||
</a>
|
||
<label class="md-header__button md-icon" for="__drawer">
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M3 6h18v2H3V6m0 5h18v2H3v-2m0 5h18v2H3v-2Z"/></svg>
|
||
</label>
|
||
<div class="md-header__title" data-md-component="header-title">
|
||
<div class="md-header__ellipsis">
|
||
<div class="md-header__topic">
|
||
<span class="md-ellipsis">
|
||
DAARION Documentation
|
||
</span>
|
||
</div>
|
||
<div class="md-header__topic" data-md-component="header-topic">
|
||
<span class="md-ellipsis">
|
||
|
||
vLLM vs Swapper Service — Аналіз для DAARION Stack
|
||
|
||
</span>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
|
||
|
||
<script>var media,input,key,value,palette=__md_get("__palette");if(palette&&palette.color){"(prefers-color-scheme)"===palette.color.media&&(media=matchMedia("(prefers-color-scheme: light)"),input=document.querySelector(media.matches?"[data-md-color-media='(prefers-color-scheme: light)']":"[data-md-color-media='(prefers-color-scheme: dark)']"),palette.color.media=input.getAttribute("data-md-color-media"),palette.color.scheme=input.getAttribute("data-md-color-scheme"),palette.color.primary=input.getAttribute("data-md-color-primary"),palette.color.accent=input.getAttribute("data-md-color-accent"));for([key,value]of Object.entries(palette.color))document.body.setAttribute("data-md-color-"+key,value)}</script>
|
||
|
||
|
||
|
||
<label class="md-header__button md-icon" for="__search">
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.516 6.516 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5Z"/></svg>
|
||
</label>
|
||
<div class="md-search" data-md-component="search" role="dialog">
|
||
<label class="md-search__overlay" for="__search"></label>
|
||
<div class="md-search__inner" role="search">
|
||
<form class="md-search__form" name="search">
|
||
<input type="text" class="md-search__input" name="query" aria-label="Search" placeholder="Search" autocapitalize="off" autocorrect="off" autocomplete="off" spellcheck="false" data-md-component="search-query" required>
|
||
<label class="md-search__icon md-icon" for="__search">
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.516 6.516 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5Z"/></svg>
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M20 11v2H8l5.5 5.5-1.42 1.42L4.16 12l7.92-7.92L13.5 5.5 8 11h12Z"/></svg>
|
||
</label>
|
||
<nav class="md-search__options" aria-label="Search">
|
||
|
||
<button type="reset" class="md-search__icon md-icon" title="Clear" aria-label="Clear" tabindex="-1">
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M19 6.41 17.59 5 12 10.59 6.41 5 5 6.41 10.59 12 5 17.59 6.41 19 12 13.41 17.59 19 19 17.59 13.41 12 19 6.41Z"/></svg>
|
||
</button>
|
||
</nav>
|
||
|
||
</form>
|
||
<div class="md-search__output">
|
||
<div class="md-search__scrollwrap" data-md-scrollfix>
|
||
<div class="md-search-result" data-md-component="search-result">
|
||
<div class="md-search-result__meta">
|
||
Initializing search
|
||
</div>
|
||
<ol class="md-search-result__list" role="presentation"></ol>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
|
||
|
||
</nav>
|
||
|
||
</header>
|
||
|
||
<div class="md-container" data-md-component="container">
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<main class="md-main" data-md-component="main">
|
||
<div class="md-main__inner md-grid">
|
||
|
||
|
||
|
||
<div class="md-sidebar md-sidebar--primary" data-md-component="sidebar" data-md-type="navigation" >
|
||
<div class="md-sidebar__scrollwrap">
|
||
<div class="md-sidebar__inner">
|
||
|
||
|
||
|
||
|
||
<nav class="md-nav md-nav--primary" aria-label="Navigation" data-md-level="0">
|
||
<label class="md-nav__title" for="__drawer">
|
||
<a href=".." title="DAARION Documentation" class="md-nav__button md-logo" aria-label="DAARION Documentation" data-md-component="logo">
|
||
|
||
|
||
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54Z"/></svg>
|
||
|
||
</a>
|
||
DAARION Documentation
|
||
</label>
|
||
|
||
<ul class="md-nav__list" data-md-scrollfix>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../public/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Home
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../public/getting-started/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Getting Started
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../public/architecture-overview/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Architecture
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../public/daiS_daos_overview/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
DAIS & DAOS
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item md-nav__item--section md-nav__item--nested">
|
||
|
||
|
||
|
||
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5" >
|
||
|
||
|
||
<label class="md-nav__link" for="__nav_5" id="__nav_5_label" tabindex="">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Internal
|
||
</span>
|
||
|
||
|
||
<span class="md-nav__icon md-icon"></span>
|
||
</label>
|
||
|
||
<nav class="md-nav" data-md-level="1" aria-labelledby="__nav_5_label" aria-expanded="false">
|
||
<label class="md-nav__title" for="__nav_5">
|
||
<span class="md-nav__icon md-icon"></span>
|
||
Internal
|
||
</label>
|
||
<ul class="md-nav__list" data-md-scrollfix>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item md-nav__item--nested">
|
||
|
||
|
||
|
||
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5_1" >
|
||
|
||
|
||
<label class="md-nav__link" for="__nav_5_1" id="__nav_5_1_label" tabindex="0">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Infra
|
||
</span>
|
||
|
||
|
||
<span class="md-nav__icon md-icon"></span>
|
||
</label>
|
||
|
||
<nav class="md-nav" data-md-level="2" aria-labelledby="__nav_5_1_label" aria-expanded="false">
|
||
<label class="md-nav__title" for="__nav_5_1">
|
||
<span class="md-nav__icon md-icon"></span>
|
||
Infra
|
||
</label>
|
||
<ul class="md-nav__list" data-md-scrollfix>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/infra/INFRA_AUTOMATION_PACK_V1/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Infra Automation Pack v1
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/infra/monitoring_overview/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Monitoring Overview
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/infra/nodes_registry_v0/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Nodes Registry v0
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item md-nav__item--nested">
|
||
|
||
|
||
|
||
<input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_5_2" >
|
||
|
||
|
||
<label class="md-nav__link" for="__nav_5_2" id="__nav_5_2_label" tabindex="0">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Specs
|
||
</span>
|
||
|
||
|
||
<span class="md-nav__icon md-icon"></span>
|
||
</label>
|
||
|
||
<nav class="md-nav" data-md-level="2" aria-labelledby="__nav_5_2_label" aria-expanded="false">
|
||
<label class="md-nav__title" for="__nav_5_2">
|
||
<span class="md-nav__icon md-icon"></span>
|
||
Specs
|
||
</label>
|
||
<ul class="md-nav__list" data-md-scrollfix>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/specs/matrix_presence_aggregator/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Matrix Presence Aggregator
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/specs/city_map_spec/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
City Map Spec
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<li class="md-nav__item">
|
||
<a href="../internal/specs/node_join_protocol_draft/" class="md-nav__link">
|
||
|
||
|
||
<span class="md-ellipsis">
|
||
Node Join Protocol (Draft)
|
||
</span>
|
||
|
||
|
||
</a>
|
||
</li>
|
||
|
||
|
||
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
|
||
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
|
||
|
||
</ul>
|
||
</nav>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
|
||
|
||
|
||
<div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" >
|
||
<div class="md-sidebar__scrollwrap">
|
||
<div class="md-sidebar__inner">
|
||
|
||
|
||
<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
|
||
|
||
|
||
|
||
|
||
|
||
|
||
<label class="md-nav__title" for="__toc">
|
||
<span class="md-nav__icon md-icon"></span>
|
||
Table of contents
|
||
</label>
|
||
<ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_1" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
📊 Порівняльна таблиця
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#daarion-stack" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
🎯 Рекомендація для DAARION Stack
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="🎯 Рекомендація для DAARION Stack">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#swapper-service" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
✅ Swapper Service — найкращий вибір
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_2" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
🔍 Детальний аналіз
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="🔍 Детальний аналіз">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#swapper-service_1" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Swapper Service — Переваги
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#swapper-service_2" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Swapper Service — Недоліки
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#vllm" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
vLLM — Переваги
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#vllm_1" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
vLLM — Недоліки
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_3" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
💡 Гібридний підхід (майбутнє)
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_4" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
📋 Висновок
|
||
</span>
|
||
</a>
|
||
|
||
<nav class="md-nav" aria-label="📋 Висновок">
|
||
<ul class="md-nav__list">
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#daarion" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
Для поточного стеку DAARION:
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
</nav>
|
||
|
||
</li>
|
||
|
||
<li class="md-nav__item">
|
||
<a href="#_5" class="md-nav__link">
|
||
<span class="md-ellipsis">
|
||
🚀 Рекомендації
|
||
</span>
|
||
</a>
|
||
|
||
</li>
|
||
|
||
</ul>
|
||
|
||
</nav>
|
||
</div>
|
||
</div>
|
||
</div>
|
||
|
||
|
||
|
||
<div class="md-content" data-md-component="content">
|
||
<article class="md-content__inner md-typeset">
|
||
|
||
|
||
|
||
|
||
<h1 id="vllm-vs-swapper-service-daarion-stack">vLLM vs Swapper Service — Аналіз для DAARION Stack<a class="headerlink" href="#vllm-vs-swapper-service-daarion-stack" title="Permanent link">¶</a></h1>
|
||
<p><strong>Дата:</strong> 2025-11-22<br />
|
||
<strong>Статус:</strong> ✅ Рекомендація: Swapper Service</p>
|
||
<hr />
|
||
<h2 id="_1">📊 Порівняльна таблиця<a class="headerlink" href="#_1" title="Permanent link">¶</a></h2>
|
||
<table>
|
||
<thead>
|
||
<tr>
|
||
<th>Критерій</th>
|
||
<th>Swapper Service</th>
|
||
<th>vLLM</th>
|
||
</tr>
|
||
</thead>
|
||
<tbody>
|
||
<tr>
|
||
<td><strong>Призначення</strong></td>
|
||
<td>Керування завантаженням/вивантаженням моделей</td>
|
||
<td>Високопродуктивний інференс-движок</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Режим роботи</strong></td>
|
||
<td>Single-active (одна модель) або Multi-active</td>
|
||
<td>Continuous serving (моделі завжди завантажені)</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Оптимізація</strong></td>
|
||
<td>Пам'ять (memory optimization)</td>
|
||
<td>Throughput (продуктивність)</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Пам'ять</strong></td>
|
||
<td>Економна (вивантажує неактивні моделі)</td>
|
||
<td>Висока (всі моделі завантажені)</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Latency</strong></td>
|
||
<td>Вища (потрібен час на завантаження)</td>
|
||
<td>Нижча (моделі вже завантажені)</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Throughput</strong></td>
|
||
<td>Середній</td>
|
||
<td>Високий</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>GPU підтримка</strong></td>
|
||
<td>Через Ollama (Metal/CUDA)</td>
|
||
<td>Пряма GPU оптимізація</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Складність</strong></td>
|
||
<td>Простий, легкий</td>
|
||
<td>Складний, production-grade</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Розмір</strong></td>
|
||
<td>Легкий (~50MB)</td>
|
||
<td>Важкий (~500MB+)</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Підтримка моделей</strong></td>
|
||
<td>Будь-які Ollama моделі</td>
|
||
<td>Обмежений набір форматів</td>
|
||
</tr>
|
||
<tr>
|
||
<td><strong>Apple Silicon</strong></td>
|
||
<td>✅ Повна підтримка (Metal)</td>
|
||
<td>⚠️ Обмежена підтримка</td>
|
||
</tr>
|
||
</tbody>
|
||
</table>
|
||
<hr />
|
||
<h2 id="daarion-stack">🎯 Рекомендація для DAARION Stack<a class="headerlink" href="#daarion-stack" title="Permanent link">¶</a></h2>
|
||
<h3 id="swapper-service">✅ <strong>Swapper Service — найкращий вибір</strong><a class="headerlink" href="#swapper-service" title="Permanent link">¶</a></h3>
|
||
<p><strong>Чому:</strong></p>
|
||
<ol>
|
||
<li><strong>Node #2 (MacBook M4 Max):</strong></li>
|
||
<li>64GB RAM — достатньо, але з 8 моделями (~118GB) потрібна оптимізація</li>
|
||
<li>Battery-powered — економія енергії важлива</li>
|
||
<li>Development node — не потрібен максимальний throughput</li>
|
||
<li>
|
||
<p>Apple Silicon — Swapper працює через Ollama з Metal acceleration</p>
|
||
</li>
|
||
<li>
|
||
<p><strong>Node #1 (Production Server):</strong></p>
|
||
</li>
|
||
<li>NVIDIA RTX 4000 (20GB VRAM) — обмежена VRAM</li>
|
||
<li>128GB RAM — достатньо, але з багатьма моделями потрібна оптимізація</li>
|
||
<li>Production — потрібна гнучкість перемикання між моделями</li>
|
||
<li>
|
||
<p>Вже використовується Ollama — Swapper інтегрується легко</p>
|
||
</li>
|
||
<li>
|
||
<p><strong>Архітектура DAGI Stack:</strong></p>
|
||
</li>
|
||
<li>Router-based architecture — Swapper легко інтегрується</li>
|
||
<li>Multi-agent system — різні агенти потребують різних моделей</li>
|
||
<li>On-demand loading — відповідає use case</li>
|
||
</ol>
|
||
<hr />
|
||
<h2 id="_2">🔍 Детальний аналіз<a class="headerlink" href="#_2" title="Permanent link">¶</a></h2>
|
||
<h3 id="swapper-service_1">Swapper Service — Переваги<a class="headerlink" href="#swapper-service_1" title="Permanent link">¶</a></h3>
|
||
<p>✅ <strong>Пам'ять:</strong>
|
||
- Завантажує тільки потрібну модель
|
||
- Вивільняє пам'ять після використання
|
||
- Оптимально для обмежених ресурсів</p>
|
||
<p>✅ <strong>Гнучкість:</strong>
|
||
- Легко додавати нові моделі
|
||
- Підтримка будь-яких Ollama моделей
|
||
- Простий API для керування</p>
|
||
<p>✅ <strong>Інтеграція:</strong>
|
||
- Працює з існуючим Ollama
|
||
- Легко інтегрується з Router
|
||
- Простий моніторинг</p>
|
||
<p>✅ <strong>Apple Silicon:</strong>
|
||
- Повна підтримка через Ollama + Metal
|
||
- Оптимізовано для M4 Max</p>
|
||
<h3 id="swapper-service_2">Swapper Service — Недоліки<a class="headerlink" href="#swapper-service_2" title="Permanent link">¶</a></h3>
|
||
<p>❌ <strong>Latency:</strong>
|
||
- Потрібен час на завантаження моделі (2-5 секунд)
|
||
- Не підходить для real-time додатків з низькою latency</p>
|
||
<p>❌ <strong>Throughput:</strong>
|
||
- Нижчий throughput ніж vLLM
|
||
- Не оптимально для високонавантажених систем</p>
|
||
<hr />
|
||
<h3 id="vllm">vLLM — Переваги<a class="headerlink" href="#vllm" title="Permanent link">¶</a></h3>
|
||
<p>✅ <strong>Throughput:</strong>
|
||
- Високий throughput (до 10x більше ніж Ollama)
|
||
- Оптимізовано для batch processing</p>
|
||
<p>✅ <strong>Latency:</strong>
|
||
- Низька latency (моделі завжди завантажені)
|
||
- Підходить для real-time додатків</p>
|
||
<p>✅ <strong>Production-grade:</strong>
|
||
- Високоякісний код
|
||
- Активна підтримка
|
||
- Використовується в production</p>
|
||
<h3 id="vllm_1">vLLM — Недоліки<a class="headerlink" href="#vllm_1" title="Permanent link">¶</a></h3>
|
||
<p>❌ <strong>Пам'ять:</strong>
|
||
- Всі моделі завантажені одночасно
|
||
- Потребує багато VRAM/RAM
|
||
- Не підходить для обмежених ресурсів</p>
|
||
<p>❌ <strong>Складність:</strong>
|
||
- Складніша інтеграція
|
||
- Потребує налаштування GPU
|
||
- Більше залежностей</p>
|
||
<p>❌ <strong>Apple Silicon:</strong>
|
||
- Обмежена підтримка
|
||
- Не оптимізовано для Metal
|
||
- Може не працювати на MacBook</p>
|
||
<p>❌ <strong>Моделі:</strong>
|
||
- Обмежений набір підтримуваних форматів
|
||
- Потрібна конвертація моделей</p>
|
||
<hr />
|
||
<h2 id="_3">💡 Гібридний підхід (майбутнє)<a class="headerlink" href="#_3" title="Permanent link">¶</a></h2>
|
||
<p>Для максимальної ефективності можна використовувати обидва:</p>
|
||
<ol>
|
||
<li><strong>Swapper Service</strong> — для Node #2 та development</li>
|
||
<li><strong>vLLM</strong> — для Node #1 production (якщо потрібен високий throughput)</li>
|
||
</ol>
|
||
<p><strong>Сценарій:</strong>
|
||
- Node #1: vLLM для популярних моделей (qwen3:8b) + Swapper для спеціалізованих
|
||
- Node #2: Swapper для всіх моделей (development, testing)</p>
|
||
<hr />
|
||
<h2 id="_4">📋 Висновок<a class="headerlink" href="#_4" title="Permanent link">¶</a></h2>
|
||
<h3 id="daarion">Для поточного стеку DAARION:<a class="headerlink" href="#daarion" title="Permanent link">¶</a></h3>
|
||
<p><strong>✅ Swapper Service — оптимальний вибір</strong></p>
|
||
<p><strong>Причини:</strong>
|
||
1. ✅ Підходить для обмежених ресурсів (Node #2 MacBook)
|
||
2. ✅ Економія пам'яті (важливо з 8 моделями)
|
||
3. ✅ Легка інтеграція з існуючим Ollama
|
||
4. ✅ Підтримка Apple Silicon (Metal)
|
||
5. ✅ Гнучкість перемикання між моделями
|
||
6. ✅ Простий моніторинг та керування</p>
|
||
<p><strong>vLLM можна розглянути в майбутньому, якщо:</strong>
|
||
- Потрібен максимальний throughput
|
||
- Є виділені GPU ресурси
|
||
- Моделі завантажені довго
|
||
- Production serving на високому рівні</p>
|
||
<hr />
|
||
<h2 id="_5">🚀 Рекомендації<a class="headerlink" href="#_5" title="Permanent link">¶</a></h2>
|
||
<ol>
|
||
<li><strong>Зараз:</strong> Використовувати Swapper Service</li>
|
||
<li><strong>Майбутнє:</strong> Розглянути vLLM для Node #1, якщо потрібен високий throughput</li>
|
||
<li><strong>Гібрид:</strong> Swapper для development, vLLM для production (опціонально)</li>
|
||
</ol>
|
||
<hr />
|
||
<p><strong>Last Updated:</strong> 2025-11-22<br />
|
||
<strong>Decision:</strong> ✅ Swapper Service для поточного стеку<br />
|
||
<strong>Future Consideration:</strong> vLLM для production high-throughput use cases</p>
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
|
||
</article>
|
||
</div>
|
||
|
||
|
||
<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>
|
||
</div>
|
||
|
||
</main>
|
||
|
||
<footer class="md-footer">
|
||
|
||
<div class="md-footer-meta md-typeset">
|
||
<div class="md-footer-meta__inner md-grid">
|
||
<div class="md-copyright">
|
||
|
||
|
||
Made with
|
||
<a href="https://squidfunk.github.io/mkdocs-material/" target="_blank" rel="noopener">
|
||
Material for MkDocs
|
||
</a>
|
||
|
||
</div>
|
||
|
||
</div>
|
||
</div>
|
||
</footer>
|
||
|
||
</div>
|
||
<div class="md-dialog" data-md-component="dialog">
|
||
<div class="md-dialog__inner md-typeset"></div>
|
||
</div>
|
||
|
||
|
||
<script id="__config" type="application/json">{"base": "..", "features": ["navigation.sections", "navigation.instant", "content.code.copy"], "search": "../assets/javascripts/workers/search.b8dbb3d2.min.js", "translations": {"clipboard.copied": "Copied to clipboard", "clipboard.copy": "Copy to clipboard", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.placeholder": "Type to start searching", "search.result.term.missing": "Missing", "select.version": "Select version"}}</script>
|
||
|
||
|
||
<script src="../assets/javascripts/bundle.3220b9d7.min.js"></script>
|
||
|
||
|
||
</body>
|
||
</html> |