Прозрачный стек: какая модель работает на твоей паре
Никакого «powered by AI» — конкретные провайдеры, конкретные модели, конкретные правила маршрутизации. Хочешь свой ключ — подключай свой ключ.
Одна модель — это компромисс
В localization нет универсально лучшей LLM. Claude и GPT сильны на EN↔RU и нюансной UX-копии. Qwen лучше других open-weights моделей справляется с тюркскими и азиатскими языками — потому что Alibaba тренировала её на корпусах, в которых тюркские и китайский представлены лучше, чем в западных моделях. YandexGPT и GigaChat хороши на русском, дают data residency в РФ, но проседают на CIS-парах. DeepSeek — самая дешёвая среди frontier-моделей, подходит для bulk-задач, где важна стоимость.
Тетива маршрутизирует каждый перевод индивидуально, выбирая модель по четырём параметрам:
- языковая пара — что модель умеет делать хорошо
- тип контента — короткая UX-копия / длинный текст / технический термин
- тариф покупателя — какие провайдеры доступны на этом тарифе
- residency-политика — где разрешено обрабатывать данные
Кто и когда переводит
Стандартная маршрутизация — тарифы Solo, Team, Business
| Языковая пара | Primary | Fallback |
|---|---|---|
| EN ↔ RU | Claude Sonnet | GPT-4o |
| EN ↔ европейские (DE, FR, ES, IT, PL) | GPT-4o | Claude Sonnet |
| RU ↔ европейские | Claude Sonnet | GPT-4o |
| RU ↔ KZ (казахский) | Qwen | Claude Sonnet |
| RU ↔ UZ (узбекский) | Qwen | Claude Sonnet |
| RU ↔ KY (киргизский) | Qwen | Claude Sonnet |
| RU ↔ TJ (таджикский) | Qwen | Claude Sonnet |
| RU ↔ AZ (азербайджанский) | Qwen | Claude Sonnet |
| RU ↔ HY (армянский) | Qwen | Claude Sonnet |
| RU ↔ BY (белорусский) | Claude Sonnet | YandexGPT |
| RU ↔ UK (украинский) | Claude Sonnet | GPT-4o |
| RU ↔ TR (турецкий) | Qwen | Claude Sonnet |
| RU ↔ AR (арабский) | Qwen | Claude Sonnet |
| RU ↔ FA (фарси) | Qwen | Claude Sonnet |
| RU ↔ ZH (китайский) | Qwen | Claude Sonnet |
| RU ↔ JA (японский) | Claude Sonnet | Qwen |
| RU ↔ KO (корейский) | Claude Sonnet | Qwen |
Residency-маршрутизация — Business и Enterprise, опция data-residency-strict
Когда residency-режим включён, маршрутизация ограничена провайдерами с инфраструктурой в РФ.
| Языковая пара | Primary | Fallback |
|---|---|---|
| Все пары | YandexGPT 5.1 Pro | GigaChat Max |
На residency-режиме качество на CIS / Turkic / Persian парах ниже стандартного режима — это объективное ограничение, не наш выбор. Если residency не критична — рекомендуем стандартный режим.
Bring-your-own-key — Business, Enterprise
На тарифах Business и Enterprise можно подключить свой ключ. Поддерживаемые провайдеры:
- OpenAI (GPT-4o, GPT-4 Turbo, o1)
- Anthropic (Claude Sonnet 4, Claude Opus 4)
- YandexGPT 5.1 Pro и Lite
- GigaChat Max и Ultra
- DeepSeek V3.2
- Qwen (через Alibaba Cloud или self-hosted endpoint)
- Mistral Large
- Llama 4 (через self-hosted endpoint)
При подключении своего ключа Тетива не метрирует токены — оплата идёт напрямую провайдеру. Маршрутизация настраивается через конфиг проекта.
Где обрабатываются данные
Облачный режим
Данные клиентов (исходные строки, переводы, глоссарии, TM) хранятся в Yandex Cloud в регионе РФ. LLM-вызовы могут идти к провайдерам за пределами РФ через защищённый прокси. Соответствует требованиям 152-ФЗ для собственно хранения.
Residency-режим
Всё, включая LLM-вызовы, остаётся в РФ. Маршрутизация — только на YandexGPT и GigaChat. TM и глоссарии — в Yandex Cloud РФ. Режим для тендеров с критической инфраструктурой, гос. контрактов и компаний со строгой data-policy.
Твой периметр
Данные не покидают периметр покупателя. Self-hosted appliance содержит embedded Qwen-модель для дефолтной маршрутизации; для специализированных пар можно подключить bring-your-own-key (внешний провайдер) или дополнительные локальные модели.
Что мы делаем с твоими данными
| Исходные строки и переводы | Хранятся в твоём проекте на серверах Тетивы (Yandex Cloud РФ) либо на твоём self-hosted appliance. Удаляются по запросу или при удалении проекта. |
| Translation memory | Строится на основе твоих переводов и принадлежит твоему проекту. Не используется для обучения LLM, не передаётся другим проектам, не агрегируется в общий датасет. |
| LLM-провайдеры | Получают только то, что нужно для конкретного перевода: исходная строка, релевантные строки из твоей TM, твой глоссарий, brand-voice prompt. У провайдеров с no-training-on-data политикой (OpenAI Enterprise API, Anthropic API, Yandex Cloud Foundation Models) данные не используются для дообучения. |
| Логи | Операционные метаданные (когда, сколько токенов, какой провайдер), без содержимого строк. Хранятся 30 дней, потом агрегируются. |
| Бэкапы | Ежедневные, хранятся 14 дней, шифруются ключом проекта. |
Полная политика — на /legal/privacy.
Хочешь выбирать сам — выбирай
Стандартный тариф — мы выбираем оптимальный провайдер за тебя. Business и Enterprise — выбирай сам через bring-your-own-key. Без скрытых правил, без «AI-magic».