Умная маршрутизация моделей в Datarim 1.6: правильная модель для каждого агента
В Datarim 1.6 появилось назначение моделей: каждый из 16 агентов и 14 скилов теперь работает на подходящей модели. Opus — для критических решений, Sonnet — для стандартной работы, Haiku — для структурированных задач.
Возможности Claude Code стоят денег. Когда каждый агент работает на Claude Opus, каждая команда фреймворка расходует дорогостоящую квоту — даже агенты, выполняющие простую структурированную работу, которая этого не требует. Datarim 1.6 решает эту проблему через умную маршрутизацию моделей: каждый агент и скил теперь работает на модели, которая соответствует его реальным когнитивным требованиям.
Проблема подхода «одна модель для всех»
В Datarim 1.5 все 16 агентов использовали Claude Opus по умолчанию. Это был разумный старт, но экономически расточительный. Посмотрим, что каждый агент реально делает:
- Tester-агент проверяет код по фиксированному набору тестов — структурированная детерминированная работа, глубокое мышление не нужно
- Developer-агент пишет стандартный код фич по устоявшимся паттернам — добротная работа, но не критичные архитектурные решения
- Strategist или Architect принимает необратимые архитектурные решения, которые влияют на всё последующее — вот здесь Opus действительно нужен
Запускать тестер на Opus — всё равно что нанять чемпиона по шахматам сортировать входящую почту. Способности есть, но задача их не требует.
Конвенция назначения моделей
Datarim 1.6 вводит чёткую матрицу выбора модели:
| Модель | Когда использовать | Примеры |
|---|---|---|
| opus | Критическое мышление, необратимые решения, высокорисковый анализ | architect, strategist, security, skill-creator |
| sonnet | Стандартная реализация, написание текстов, анализ, большинство pipeline-задач | developer, compliance, writer, devops, sre |
| haiku | Простые структурированные задачи: форматирование, линтинг, запуск тестов | tester |
Reference-скилы — те, что предоставляют чеклисты, паттерны и стандарты, не выполняя самостоятельных рассуждений — не задают модель вообще. Они наследуют её от вызывающего агента, у которого уже есть нужная модель для его контекста.
Как это работает на практике
Claude Code поддерживает поле model: в frontmatter агентов и скилов. Datarim теперь использует его для каждого агента и task-скила. Назначение делается один раз на уровне фреймворка — никакой настройки для каждой задачи.
# Пример: frontmatter architect.md
---
name: architect
model: opus
description: Chief Architect for system integrity and scalability
---
# Пример: frontmatter developer.md
---
name: developer
model: sonnet
description: Senior Developer implementing features with TDD
---
# Пример: frontmatter tester.md
---
name: tester
model: haiku
description: Platform QA Tester for functional and integration testing
---
Итоговое распределение по всем 16 агентам:
| Модель | Кол-во | Агенты |
|---|---|---|
| opus | 6 | architect, planner, strategist, security, reviewer, skill-creator |
| sonnet | 9 | developer, compliance, code-simplifier, devops, editor, librarian, optimizer, sre, writer |
| haiku | 1 | tester |
Для скилов: 14 task-скилов (выполняющих активную работу) имеют явные назначения моделей по той же матрице. 6 reference-скилов (datarim-system, ai-quality, security, testing, performance, tech-stack) наследуют модель от вызывающего агента.
Встроено в фреймворк
Назначение моделей — не только для существующих агентов, это часть того, как расширяется Datarim. Агент skill-creator (генерирует новые скилы, агенты и команды) теперь требует поле model: в каждом создаваемом артефакте. Workflow /dr-addskill включает явный шаг определения модели.
Это означает, что каждое будущее дополнение фреймворка приходит с правильным назначением модели с первого дня — это конвенция, а не послесловие.
Что остаётся на Opus
Решение оставить 6 агентов на Opus не произвольно. Каждый из них принимает решения, которые сложно или невозможно отменить:
- architect — системное проектирование и архитектурные паттерны; ошибки распространяются на всё
- planner — декомпозиция задач и оценка сложности; плохие планы расходуют ресурсы на реализацию
- strategist — решения «строить/не строить»; скоуп и подход для всей задачи
- security — выявление уязвимостей; пропуск здесь имеет последствия в продакшене
- reviewer — финальный quality gate перед архивацией; должен поймать всё, что пропустили остальные
- skill-creator — генерирует новые артефакты фреймворка; качество здесь влияет на каждую будущую задачу
Стоимость плохого решения в любой из этих ролей превышает экономию от более дешёвой модели. Sonnet и Haiku используются там, где задача хорошо определена и цена ошибки низкая — структурированная работа, а не суждения.
Datarim 1.6
Назначение моделей — часть релиза 1.6.0, который также включает унифицированную нумерацию задач (ID с префиксом проекта/области, неизменный на протяжении всего жизненного цикла задачи) и расширенный набор скилов до 20.
Если вы используете Datarim, обновитесь с GitHub и запустите ./install.sh, чтобы получить новые назначения моделей для всех агентов и скилов.
git pull origin main
./install.sh
Datarim — open source (лицензия MIT) — github.com/Arcanada-one/datarim.