On-premise установка

Сценарии

Кому подойдёт on-premise

On-premise актуальна, если ты попадаешь хотя бы в один из сценариев:

01

Тендер с residency

Закупочная документация указывает обработку данных на территории РФ, запрет передачи третьим лицам, требование к включению вендора в Реестр, FSTEC-сертифицированное окружение.

02

Банковский сектор

ЦБ-нормативы по обработке банковской тайны, ПДн клиентов, информационная безопасность по стандартам ОПДн.

03

Госконтракт и КИИ

ФЗ-187, требования к категорированию объектов КИИ, изолированный контур обработки.

04

Security-комитет

Внутренние политики безопасности крупного бизнеса, запрет на использование внешних SaaS для категорий данных, аудит вендоров по ISO 27001.

05

Стратегическое решение

Команда считает, что весь production-стек должен быть в своём контуре, без зависимостей от внешних SaaS-вендоров.

Иначе

Если ни одно — облачный тариф

Если ни один из сценариев не относится — облачный тариф проще, дешевле и обновляется чаще.

Состав

Состав appliance

Тетива on-premise поставляется как Docker Compose-стек либо Helm-чарт для Kubernetes.

Backend API	Полный функционал бэкенда: парсеры форматов, контекстный пайплайн, маршрутизатор, валидаторы. Идентично облачной версии.
Веб-интерфейс	Дашборд проектов, редактор глоссария и TM, ревью-флоу. Тот же UI, что в облачной версии.
Embedded LLM	Quantized-версия Qwen (на момент релиза — Qwen3-32B Q4_K_M) для дефолтной маршрутизации. Запускается на GPU с минимум 24GB VRAM или на CPU с замедлением. Альтернатива — DeepSeek V3.2.
Bring-your-own-key	Конфигурация для подключения внешних провайдеров: OpenAI, Anthropic, YandexGPT, GigaChat, локальная развёрнутая LLM.
PostgreSQL	Для метаданных и translation memory. Совместим с твоим существующим Postgres-кластером — встроенный экземпляр можно отключить.
MinIO / S3	Для файлов и бэкапов. Опционально — подключается к внешнему S3-совместимому хранилищу.
OpenTelemetry	Метрики и трейсы в твой existing observability-стек (Prometheus, Grafana, Jaeger).

Hardware

Инфраструктура

Минимальная конфигурация для пилота на одну команду до 20 разработчиков:

Компонент	Минимум	Рекомендовано
CPU	8 cores	16 cores
RAM	32 GB	64 GB
GPU	RTX 4090 (24GB)	A6000 или H100
Хранилище	500 GB SSD	2 TB NVMe
Сеть	1 Gbps	10 Gbps
ОС	Ubuntu 22.04 LTS+ / RHEL 9+	то же
Kubernetes (если Helm)	1.26+	1.29+

Без GPU — embedded-LLM работает на CPU с замедлением в 10–30 раз. Это допустимо для редко-используемой установки, не для активной разработки. Альтернатива без локального GPU — bring-your-own-key с внешним провайдером.

Деплой

Деплой и поддержка

Установка. Docker Compose — один docker compose up. Helm — helm install tetiva tetiva/appliance с values-файлом. Полная установка с инициализацией БД и загрузкой LLM-весов — 30–90 минут (LLM-веса — 18 GB).

Лицензия. Годовая лицензия по контракту, привязана к организации, не к серверу. Можно развернуть несколько инстанций (dev/staging/prod) в рамках одной лицензии.

Обновления. Минорные релизы — раз в 2–4 недели, мажорные — раз в квартал. Обновления накатываются rolling-стратегией. LLM-веса можно обновлять отдельно от backend'а.

Сопровождение. Выделенный канал поддержки в Telegram или Slack. SLA 99.9% по контракту. Гарантированный ответ в течение 2 рабочих часов для критических инцидентов, 4 часов для остального. Возможна выделенная инженерная сессия раз в квартал.

Аудит и compliance. Документация по безопасности, threat model, описание криптографии, схема обработки данных — предоставляются под NDA по запросу.

Цена

Базовая лицензия — от 600 000 ₽/год. Финальная цена зависит от:

объёма проектов (число ключей, число активных проектов)
числа инстанций (dev, staging, prod, отдельные подразделения)
уровня поддержки (стандартный SLA или расширенный)
требований по сопровождению (выделенный инженер, частота review-сессий)
дополнительных требований по compliance (специфика тендерной документации, FSTEC-аттестация окружения)

Стандартный пакет для среднего корпоративного покупателя (3 инстанции, до 50 разработчиков, стандартный SLA) — порядка 1 200 000 ₽/год.

Контакт

Связаться с командой Enterprise

Что мы спросим

Размер команды разработки, количество поддерживаемых локалей
Тендерные требования: residency, FSTEC, Реестр
Какие LLM-провайдеры приемлемы (BYOK или embedded)
Имеющаяся инфраструктура: Kubernetes, observability-стек, GPU
Сроки: пилот / production / привязка к тендеру

Заранее: чего не будет

Бесплатной триал-версии on-premise нет. Установка и сопровождение требуют времени инженеров с нашей стороны; полноценная оценка возможна только в рамках платного пилота (3 месяца, по специальной стартовой цене).

Не работаем с серым импортом GPU. Если у тебя H100 без официального CIS-канала — это твоя ответственность; мы не консультируем по поставкам железа.

Не поддерживаем Windows-сервера. Только Linux. Если корпоративный стандарт — Windows, можно через WSL2, но это не наша зона комфорта.

Для тех, у кого данные не уходят в облако