Skip links

Что такое AI Routing и как его использовать

AI Routing — архитектурный паттерн, при котором система автоматически решает, какой именно инструмент или модель использовать для ответа на промт пользователя.

Примеры использования

ChatGPT

Использует роутинг, чтобы классифицировать запросы: простые → GPT‑Nano, сложные → GPT‑Mini, очень сложные или связанные с кодом → GPT. При этом учитывается подписка пользователя, чтобы не задействовать дорогие модели для бесплатных пользователей.

Gemini

Применяет роутинг для вызова Nano Banana. Например, пользователь пишет промт «Нарисуй картинку кота» → вызывается инструмент Nano Banana. Такой подход работает, в принципе, во всех нейросетях из примеров.

Гигачат и Алиса

Используют AI‑роутинг, чтобы выбрать модель — экономичную, мощную — или переключиться на инструмент‑генератор картинок.

Vega

На Vega AI Routing применяется в гораздо более масштабных сценариях из‑за огромного количества инструментов, моделей и сервисов. Есть режим Авто, в котором AI классифицирует запрос пользователя и вызывает один из 10 выбранных инструментов Vega или одну из 4 выбранных моделей (Mini и Pro). При этом используется экономный подход: не тратятся лишние средства пользователя, поэтому, например, не вызываются Nano Banana Pro, GPT 5.2 Codex или генерация видео с Veo 3.1. Иначе это привело бы к плохому пользовательскому опыту.
Но и это еще не все, роутинг используется в режиме генерации картинок и видео, чтобы понимать намерения пользователя — создать новую картинку в чате или исправить прошлую генерацию или например, сделать новое видео или новое видео с последнего кадра предыдущего видео (first last frame video)?

Зачем это нужно?

Чтобы улучшить UX — пользовательский опыт. Мы, люди:

  • а) ленивы, потому что это экономия энергии; мы стремимся сохранять её даже в простых действиях, таких как выбор функции в меню;
  • б) пользователи часто не знают, какой инструмент или модель выбрать, чтобы получить нужный результат.

Мы же помним, что человеку нужен не молоток, а гвоздь в стене.

Какие методы AI Routing используются?

Существует несколько подходов, основные — три, а также их гибриды.

Rule‑based routing — в коде заранее задаются ключевые слова и правила, по которым происходит вызов инструмента или модели. Самый простой, быстрый, но наименее точный метод.

Intent‑based routing — классификация намерения пользователя с помощью NLP‑моделей, AI-модель определяет чего хочет user и выбирает tool или model. Это самый точный но и самый медленный метод, потому-что AI выявляет намерение пользователя.

Semantic routing — примеры и промт пользователя преобразуются в вектор (embedding) и AI сравнивает их. Это золотая середина, быстрый но немного менее точный метод, чем intent‑based routing.

Иногда применяются гибриды, например Rule‑based routing + Intent‑based routing: сначала используется правило‑based подход, а если его точность низка, переключаются на intent‑based routing. Это позволяет компенсировать недостатки обоих методов и сохранить их плюсы. Такой подход, например, применяется на VEGA.

Кроме AI Routing в AI-чатах применяются еще и другие прокси подходы — т.е. инструмент не вызывается напрямую, но об этом в следующих статьях 🙂

Протестировать Авто режим вы можете на vega.chat переключив с дефолтного режима Чат, на режтим Авто (бета).

Leave a comment

🍪 This website uses cookies to improve your web experience.