LLM stack

Прозрачный стек: какая модель работает на твоей паре

Никакого «powered by AI» — конкретные провайдеры, конкретные модели, конкретные правила маршрутизации. Хочешь свой ключ — подключай свой ключ.

Почему не одна

Одна модель — это компромисс

В localization нет универсально лучшей LLM. Claude и GPT сильны на EN↔RU и нюансной UX-копии. Qwen лучше других open-weights моделей справляется с тюркскими и азиатскими языками — потому что Alibaba тренировала её на корпусах, в которых тюркские и китайский представлены лучше, чем в западных моделях. YandexGPT и GigaChat хороши на русском, дают data residency в РФ, но проседают на CIS-парах. DeepSeek — самая дешёвая среди frontier-моделей, подходит для bulk-задач, где важна стоимость.

Тетива маршрутизирует каждый перевод индивидуально, выбирая модель по четырём параметрам:

  • языковая пара — что модель умеет делать хорошо
  • тип контента — короткая UX-копия / длинный текст / технический термин
  • тариф покупателя — какие провайдеры доступны на этом тарифе
  • residency-политика — где разрешено обрабатывать данные
Маршрутизация

Кто и когда переводит

Стандартная маршрутизация — тарифы Solo, Team, Business

Языковая параPrimaryFallback
EN ↔ RUClaude SonnetGPT-4o
EN ↔ европейские (DE, FR, ES, IT, PL)GPT-4oClaude Sonnet
RU ↔ европейскиеClaude SonnetGPT-4o
RU ↔ KZ (казахский)QwenClaude Sonnet
RU ↔ UZ (узбекский)QwenClaude Sonnet
RU ↔ KY (киргизский)QwenClaude Sonnet
RU ↔ TJ (таджикский)QwenClaude Sonnet
RU ↔ AZ (азербайджанский)QwenClaude Sonnet
RU ↔ HY (армянский)QwenClaude Sonnet
RU ↔ BY (белорусский)Claude SonnetYandexGPT
RU ↔ UK (украинский)Claude SonnetGPT-4o
RU ↔ TR (турецкий)QwenClaude Sonnet
RU ↔ AR (арабский)QwenClaude Sonnet
RU ↔ FA (фарси)QwenClaude Sonnet
RU ↔ ZH (китайский)QwenClaude Sonnet
RU ↔ JA (японский)Claude SonnetQwen
RU ↔ KO (корейский)Claude SonnetQwen

Residency-маршрутизация — Business и Enterprise, опция data-residency-strict

Когда residency-режим включён, маршрутизация ограничена провайдерами с инфраструктурой в РФ.

Языковая параPrimaryFallback
Все парыYandexGPT 5.1 ProGigaChat Max

На residency-режиме качество на CIS / Turkic / Persian парах ниже стандартного режима — это объективное ограничение, не наш выбор. Если residency не критична — рекомендуем стандартный режим.

Bring-your-own-key — Business, Enterprise

На тарифах Business и Enterprise можно подключить свой ключ. Поддерживаемые провайдеры:

  • OpenAI (GPT-4o, GPT-4 Turbo, o1)
  • Anthropic (Claude Sonnet 4, Claude Opus 4)
  • YandexGPT 5.1 Pro и Lite
  • GigaChat Max и Ultra
  • DeepSeek V3.2
  • Qwen (через Alibaba Cloud или self-hosted endpoint)
  • Mistral Large
  • Llama 4 (через self-hosted endpoint)

При подключении своего ключа Тетива не метрирует токены — оплата идёт напрямую провайдеру. Маршрутизация настраивается через конфиг проекта.

Data plane

Где обрабатываются данные

Стандартный

Облачный режим

Данные клиентов (исходные строки, переводы, глоссарии, TM) хранятся в Yandex Cloud в регионе РФ. LLM-вызовы могут идти к провайдерам за пределами РФ через защищённый прокси. Соответствует требованиям 152-ФЗ для собственно хранения.

Residency

Residency-режим

Всё, включая LLM-вызовы, остаётся в РФ. Маршрутизация — только на YandexGPT и GigaChat. TM и глоссарии — в Yandex Cloud РФ. Режим для тендеров с критической инфраструктурой, гос. контрактов и компаний со строгой data-policy.

On-premise

Твой периметр

Данные не покидают периметр покупателя. Self-hosted appliance содержит embedded Qwen-модель для дефолтной маршрутизации; для специализированных пар можно подключить bring-your-own-key (внешний провайдер) или дополнительные локальные модели.

Privacy

Что мы делаем с твоими данными

Исходные строки и переводыХранятся в твоём проекте на серверах Тетивы (Yandex Cloud РФ) либо на твоём self-hosted appliance. Удаляются по запросу или при удалении проекта.
Translation memoryСтроится на основе твоих переводов и принадлежит твоему проекту. Не используется для обучения LLM, не передаётся другим проектам, не агрегируется в общий датасет.
LLM-провайдерыПолучают только то, что нужно для конкретного перевода: исходная строка, релевантные строки из твоей TM, твой глоссарий, brand-voice prompt. У провайдеров с no-training-on-data политикой (OpenAI Enterprise API, Anthropic API, Yandex Cloud Foundation Models) данные не используются для дообучения.
ЛогиОперационные метаданные (когда, сколько токенов, какой провайдер), без содержимого строк. Хранятся 30 дней, потом агрегируются.
БэкапыЕжедневные, хранятся 14 дней, шифруются ключом проекта.

Полная политика — на /legal/privacy.

Хочешь выбирать сам — выбирай

Стандартный тариф — мы выбираем оптимальный провайдер за тебя. Business и Enterprise — выбирай сам через bring-your-own-key. Без скрытых правил, без «AI-magic».