Для тех, у кого данные не уходят в облако
Self-hosted appliance с встроенной LLM, Docker Compose или Helm. Без обращений к нашему облаку. Без обмена телеметрией. Без сюрпризов при аудите.
Кому подойдёт on-premise
On-premise актуальна, если ты попадаешь хотя бы в один из сценариев:
Тендер с residency
Закупочная документация указывает обработку данных на территории РФ, запрет передачи третьим лицам, требование к включению вендора в Реестр, FSTEC-сертифицированное окружение.
Банковский сектор
ЦБ-нормативы по обработке банковской тайны, ПДн клиентов, информационная безопасность по стандартам ОПДн.
Госконтракт и КИИ
ФЗ-187, требования к категорированию объектов КИИ, изолированный контур обработки.
Security-комитет
Внутренние политики безопасности крупного бизнеса, запрет на использование внешних SaaS для категорий данных, аудит вендоров по ISO 27001.
Стратегическое решение
Команда считает, что весь production-стек должен быть в своём контуре, без зависимостей от внешних SaaS-вендоров.
Если ни одно — облачный тариф
Если ни один из сценариев не относится — облачный тариф проще, дешевле и обновляется чаще.
Состав appliance
Тетива on-premise поставляется как Docker Compose-стек либо Helm-чарт для Kubernetes.
| Backend API | Полный функционал бэкенда: парсеры форматов, контекстный пайплайн, маршрутизатор, валидаторы. Идентично облачной версии. |
| Веб-интерфейс | Дашборд проектов, редактор глоссария и TM, ревью-флоу. Тот же UI, что в облачной версии. |
| Embedded LLM | Quantized-версия Qwen (на момент релиза — Qwen3-32B Q4_K_M) для дефолтной маршрутизации. Запускается на GPU с минимум 24GB VRAM или на CPU с замедлением. Альтернатива — DeepSeek V3.2. |
| Bring-your-own-key | Конфигурация для подключения внешних провайдеров: OpenAI, Anthropic, YandexGPT, GigaChat, локальная развёрнутая LLM. |
| PostgreSQL | Для метаданных и translation memory. Совместим с твоим существующим Postgres-кластером — встроенный экземпляр можно отключить. |
| MinIO / S3 | Для файлов и бэкапов. Опционально — подключается к внешнему S3-совместимому хранилищу. |
| OpenTelemetry | Метрики и трейсы в твой existing observability-стек (Prometheus, Grafana, Jaeger). |
Инфраструктура
Минимальная конфигурация для пилота на одну команду до 20 разработчиков:
| Компонент | Минимум | Рекомендовано |
|---|---|---|
| CPU | 8 cores | 16 cores |
| RAM | 32 GB | 64 GB |
| GPU | RTX 4090 (24GB) | A6000 или H100 |
| Хранилище | 500 GB SSD | 2 TB NVMe |
| Сеть | 1 Gbps | 10 Gbps |
| ОС | Ubuntu 22.04 LTS+ / RHEL 9+ | то же |
| Kubernetes (если Helm) | 1.26+ | 1.29+ |
Без GPU — embedded-LLM работает на CPU с замедлением в 10–30 раз. Это допустимо для редко-используемой установки, не для активной разработки. Альтернатива без локального GPU — bring-your-own-key с внешним провайдером.
Деплой и поддержка
Установка. Docker Compose — один docker compose up. Helm — helm install tetiva tetiva/appliance с values-файлом. Полная установка с инициализацией БД и загрузкой LLM-весов — 30–90 минут (LLM-веса — 18 GB).
Лицензия. Годовая лицензия по контракту, привязана к организации, не к серверу. Можно развернуть несколько инстанций (dev/staging/prod) в рамках одной лицензии.
Обновления. Минорные релизы — раз в 2–4 недели, мажорные — раз в квартал. Обновления накатываются rolling-стратегией. LLM-веса можно обновлять отдельно от backend'а.
Сопровождение. Выделенный канал поддержки в Telegram или Slack. SLA 99.9% по контракту. Гарантированный ответ в течение 2 рабочих часов для критических инцидентов, 4 часов для остального. Возможна выделенная инженерная сессия раз в квартал.
Аудит и compliance. Документация по безопасности, threat model, описание криптографии, схема обработки данных — предоставляются под NDA по запросу.
Цена
Базовая лицензия — от 600 000 ₽/год. Финальная цена зависит от:
- объёма проектов (число ключей, число активных проектов)
- числа инстанций (dev, staging, prod, отдельные подразделения)
- уровня поддержки (стандартный SLA или расширенный)
- требований по сопровождению (выделенный инженер, частота review-сессий)
- дополнительных требований по compliance (специфика тендерной документации, FSTEC-аттестация окружения)
Стандартный пакет для среднего корпоративного покупателя (3 инстанции, до 50 разработчиков, стандартный SLA) — порядка 1 200 000 ₽/год.
Связаться с командой Enterprise
Что мы спросим
- Размер команды разработки, количество поддерживаемых локалей
- Тендерные требования: residency, FSTEC, Реестр
- Какие LLM-провайдеры приемлемы (BYOK или embedded)
- Имеющаяся инфраструктура: Kubernetes, observability-стек, GPU
- Сроки: пилот / production / привязка к тендеру
Заранее: чего не будет
Бесплатной триал-версии on-premise нет. Установка и сопровождение требуют времени инженеров с нашей стороны; полноценная оценка возможна только в рамках платного пилота (3 месяца, по специальной стартовой цене).
Не работаем с серым импортом GPU. Если у тебя H100 без официального CIS-канала — это твоя ответственность; мы не консультируем по поставкам железа.
Не поддерживаем Windows-сервера. Только Linux. Если корпоративный стандарт — Windows, можно через WSL2, но это не наша зона комфорта.