On-premise

Для тех, у кого данные не уходят в облако

Self-hosted appliance с встроенной LLM, Docker Compose или Helm. Без обращений к нашему облаку. Без обмена телеметрией. Без сюрпризов при аудите.

Сценарии

Кому подойдёт on-premise

On-premise актуальна, если ты попадаешь хотя бы в один из сценариев:

01

Тендер с residency

Закупочная документация указывает обработку данных на территории РФ, запрет передачи третьим лицам, требование к включению вендора в Реестр, FSTEC-сертифицированное окружение.

02

Банковский сектор

ЦБ-нормативы по обработке банковской тайны, ПДн клиентов, информационная безопасность по стандартам ОПДн.

03

Госконтракт и КИИ

ФЗ-187, требования к категорированию объектов КИИ, изолированный контур обработки.

04

Security-комитет

Внутренние политики безопасности крупного бизнеса, запрет на использование внешних SaaS для категорий данных, аудит вендоров по ISO 27001.

05

Стратегическое решение

Команда считает, что весь production-стек должен быть в своём контуре, без зависимостей от внешних SaaS-вендоров.

Иначе

Если ни одно — облачный тариф

Если ни один из сценариев не относится — облачный тариф проще, дешевле и обновляется чаще.

Состав

Состав appliance

Тетива on-premise поставляется как Docker Compose-стек либо Helm-чарт для Kubernetes.

Backend APIПолный функционал бэкенда: парсеры форматов, контекстный пайплайн, маршрутизатор, валидаторы. Идентично облачной версии.
Веб-интерфейсДашборд проектов, редактор глоссария и TM, ревью-флоу. Тот же UI, что в облачной версии.
Embedded LLMQuantized-версия Qwen (на момент релиза — Qwen3-32B Q4_K_M) для дефолтной маршрутизации. Запускается на GPU с минимум 24GB VRAM или на CPU с замедлением. Альтернатива — DeepSeek V3.2.
Bring-your-own-keyКонфигурация для подключения внешних провайдеров: OpenAI, Anthropic, YandexGPT, GigaChat, локальная развёрнутая LLM.
PostgreSQLДля метаданных и translation memory. Совместим с твоим существующим Postgres-кластером — встроенный экземпляр можно отключить.
MinIO / S3Для файлов и бэкапов. Опционально — подключается к внешнему S3-совместимому хранилищу.
OpenTelemetryМетрики и трейсы в твой existing observability-стек (Prometheus, Grafana, Jaeger).
Hardware

Инфраструктура

Минимальная конфигурация для пилота на одну команду до 20 разработчиков:

КомпонентМинимумРекомендовано
CPU8 cores16 cores
RAM32 GB64 GB
GPURTX 4090 (24GB)A6000 или H100
Хранилище500 GB SSD2 TB NVMe
Сеть1 Gbps10 Gbps
ОСUbuntu 22.04 LTS+ / RHEL 9+то же
Kubernetes (если Helm)1.26+1.29+

Без GPU — embedded-LLM работает на CPU с замедлением в 10–30 раз. Это допустимо для редко-используемой установки, не для активной разработки. Альтернатива без локального GPU — bring-your-own-key с внешним провайдером.

Деплой

Деплой и поддержка

Установка. Docker Compose — один docker compose up. Helm — helm install tetiva tetiva/appliance с values-файлом. Полная установка с инициализацией БД и загрузкой LLM-весов — 30–90 минут (LLM-веса — 18 GB).

Лицензия. Годовая лицензия по контракту, привязана к организации, не к серверу. Можно развернуть несколько инстанций (dev/staging/prod) в рамках одной лицензии.

Обновления. Минорные релизы — раз в 2–4 недели, мажорные — раз в квартал. Обновления накатываются rolling-стратегией. LLM-веса можно обновлять отдельно от backend'а.

Сопровождение. Выделенный канал поддержки в Telegram или Slack. SLA 99.9% по контракту. Гарантированный ответ в течение 2 рабочих часов для критических инцидентов, 4 часов для остального. Возможна выделенная инженерная сессия раз в квартал.

Аудит и compliance. Документация по безопасности, threat model, описание криптографии, схема обработки данных — предоставляются под NDA по запросу.

Цена

Цена

Базовая лицензия — от 600 000 ₽/год. Финальная цена зависит от:

  • объёма проектов (число ключей, число активных проектов)
  • числа инстанций (dev, staging, prod, отдельные подразделения)
  • уровня поддержки (стандартный SLA или расширенный)
  • требований по сопровождению (выделенный инженер, частота review-сессий)
  • дополнительных требований по compliance (специфика тендерной документации, FSTEC-аттестация окружения)

Стандартный пакет для среднего корпоративного покупателя (3 инстанции, до 50 разработчиков, стандартный SLA) — порядка 1 200 000 ₽/год.

Контакт

Связаться с командой Enterprise

Отвечаем в течение одного рабочего дня. Если срочно — пишите в Telegram @tetiva_enterprise.

Что мы спросим

  • Размер команды разработки, количество поддерживаемых локалей
  • Тендерные требования: residency, FSTEC, Реестр
  • Какие LLM-провайдеры приемлемы (BYOK или embedded)
  • Имеющаяся инфраструктура: Kubernetes, observability-стек, GPU
  • Сроки: пилот / production / привязка к тендеру

Заранее: чего не будет

Бесплатной триал-версии on-premise нет. Установка и сопровождение требуют времени инженеров с нашей стороны; полноценная оценка возможна только в рамках платного пилота (3 месяца, по специальной стартовой цене).

Не работаем с серым импортом GPU. Если у тебя H100 без официального CIS-канала — это твоя ответственность; мы не консультируем по поставкам железа.

Не поддерживаем Windows-сервера. Только Linux. Если корпоративный стандарт — Windows, можно через WSL2, но это не наша зона комфорта.