LLM stack

Прозрачный стек: какая модель работает на твоей паре

Никакого «powered by AI» — конкретные провайдеры, конкретные модели, конкретные правила маршрутизации. Хочешь свой ключ — подключай свой ключ.

Почему не одна

Одна модель — это компромисс

В localization нет универсально лучшей LLM. Claude и GPT сильны на EN↔RU и нюансной UX-копии. Qwen лучше других open-weights моделей справляется с тюркскими и азиатскими языками — потому что Alibaba тренировала её на корпусах, в которых тюркские и китайский представлены лучше, чем в западных моделях. YandexGPT и GigaChat хороши на русском, дают data residency в РФ, но проседают на CIS-парах. DeepSeek — самая дешёвая среди frontier-моделей, подходит для bulk-задач, где важна стоимость.

Тетива маршрутизирует каждый перевод индивидуально, выбирая модель по четырём параметрам:

языковая пара — что модель умеет делать хорошо
тип контента — короткая UX-копия / длинный текст / технический термин
тариф покупателя — какие провайдеры доступны на этом тарифе
residency-политика — где разрешено обрабатывать данные

Маршрутизация

Кто и когда переводит

Стандартная маршрутизация — тарифы Solo, Team, Business

Языковая пара	Primary	Fallback
EN ↔ RU	Claude Sonnet	GPT-4o
EN ↔ европейские (DE, FR, ES, IT, PL)	GPT-4o	Claude Sonnet
RU ↔ европейские	Claude Sonnet	GPT-4o
RU ↔ KZ (казахский)	Qwen	Claude Sonnet
RU ↔ UZ (узбекский)	Qwen	Claude Sonnet
RU ↔ KY (киргизский)	Qwen	Claude Sonnet
RU ↔ TJ (таджикский)	Qwen	Claude Sonnet
RU ↔ AZ (азербайджанский)	Qwen	Claude Sonnet
RU ↔ HY (армянский)	Qwen	Claude Sonnet
RU ↔ BY (белорусский)	Claude Sonnet	YandexGPT
RU ↔ UK (украинский)	Claude Sonnet	GPT-4o
RU ↔ TR (турецкий)	Qwen	Claude Sonnet
RU ↔ AR (арабский)	Qwen	Claude Sonnet
RU ↔ FA (фарси)	Qwen	Claude Sonnet
RU ↔ ZH (китайский)	Qwen	Claude Sonnet
RU ↔ JA (японский)	Claude Sonnet	Qwen
RU ↔ KO (корейский)	Claude Sonnet	Qwen

Residency-маршрутизация — Business и Enterprise, опция data-residency-strict

Когда residency-режим включён, маршрутизация ограничена провайдерами с инфраструктурой в РФ.

Языковая пара	Primary	Fallback
Все пары	YandexGPT 5.1 Pro	GigaChat Max

На residency-режиме качество на CIS / Turkic / Persian парах ниже стандартного режима — это объективное ограничение, не наш выбор. Если residency не критична — рекомендуем стандартный режим.

Bring-your-own-key — Business, Enterprise

На тарифах Business и Enterprise можно подключить свой ключ. Поддерживаемые провайдеры:

OpenAI (GPT-4o, GPT-4 Turbo, o1)
Anthropic (Claude Sonnet 4, Claude Opus 4)
YandexGPT 5.1 Pro и Lite
GigaChat Max и Ultra
DeepSeek V3.2
Qwen (через Alibaba Cloud или self-hosted endpoint)
Mistral Large
Llama 4 (через self-hosted endpoint)

При подключении своего ключа Тетива не метрирует токены — оплата идёт напрямую провайдеру. Маршрутизация настраивается через конфиг проекта.

Data plane

Где обрабатываются данные

Стандартный

Облачный режим

Данные клиентов (исходные строки, переводы, глоссарии, TM) хранятся в Yandex Cloud в регионе РФ. LLM-вызовы могут идти к провайдерам за пределами РФ через защищённый прокси. Соответствует требованиям 152-ФЗ для собственно хранения.

Residency

Residency-режим

Всё, включая LLM-вызовы, остаётся в РФ. Маршрутизация — только на YandexGPT и GigaChat. TM и глоссарии — в Yandex Cloud РФ. Режим для тендеров с критической инфраструктурой, гос. контрактов и компаний со строгой data-policy.

On-premise

Твой периметр

Данные не покидают периметр покупателя. Self-hosted appliance содержит embedded Qwen-модель для дефолтной маршрутизации; для специализированных пар можно подключить bring-your-own-key (внешний провайдер) или дополнительные локальные модели.

Privacy

Что мы делаем с твоими данными

Исходные строки и переводы	Хранятся в твоём проекте на серверах Тетивы (Yandex Cloud РФ) либо на твоём self-hosted appliance. Удаляются по запросу или при удалении проекта.
Translation memory	Строится на основе твоих переводов и принадлежит твоему проекту. Не используется для обучения LLM, не передаётся другим проектам, не агрегируется в общий датасет.
LLM-провайдеры	Получают только то, что нужно для конкретного перевода: исходная строка, релевантные строки из твоей TM, твой глоссарий, brand-voice prompt. У провайдеров с no-training-on-data политикой (OpenAI Enterprise API, Anthropic API, Yandex Cloud Foundation Models) данные не используются для дообучения.
Логи	Операционные метаданные (когда, сколько токенов, какой провайдер), без содержимого строк. Хранятся 30 дней, потом агрегируются.
Бэкапы	Ежедневные, хранятся 14 дней, шифруются ключом проекта.

Полная политика — на /legal/privacy.

Хочешь выбирать сам — выбирай

Стандартный тариф — мы выбираем оптимальный провайдер за тебя. Business и Enterprise — выбирай сам через bring-your-own-key. Без скрытых правил, без «AI-magic».

Установить CLI Тарифы