Мультиагентная оркестрация и автономное исследование

Граф-оркестрация, test-time compute, Arbiter/Clarifier; арена как автономная исследовательская система.

Руководство по интеграции

Сдвиг от «модель как оракул» к «агент как система». Качество ответов на сложные задачи зависит от **test-time compute** — вычислений в момент вывода, а не только от претрейна. Реализуется через мультиагентные архитектуры с декомпозицией, параллельным поиском и критическим синтезом. Это описание того, чем наша арена и continuity_os уже являются.

## 1. Граф вместо цепочки

Research-swarm требует отхода от линейных цепочек (chains) к **графовым структурам** с обратными связями и специализированными ролями. Чёткое разделение управляющего контура и исполнительных единиц.

**Оркестратор/планировщик** — центральная нервная система, трёхфазно: Scope → Research → Write.
- **Clarifier Agent** — итеративно опрашивает пользователя, устраняя двусмысленность ДО работы (ровно то, что делает AskUserQuestion перед запуском задач).
- **Генератор вопросов** — декомпозиция цели на под-запросы для параллельных исполнителей.
- **Arbiter** — критический синтез: сводит результаты исполнителей, отбраковывает слабое, разрешает противоречия.

## 2. Test-time compute = больше «думанья» на трудных задачах

Не «один проход модели», а итеративный цикл: план → параллельный поиск → критика → уточнение → синтез. Больше вычислений на трудный вопрос = выше качество. Дорого, поэтому нужен **cost-aware routing** (дешёвая модель на простое, дорогая на сложное).

## 3. Autonomous Research AI — «пятая парадигма»

Переход от Data-Intensive Science (4-я парадигма) к **AI-Driven Autonomous Discovery** (5-я): агентные системы сами формулируют гипотезы, планируют и исполняют эксперименты, интерпретируют результаты в замкнутом цикле без оператора. Признаки субъектности (в техническом смысле): долгосрочное планирование, tool use, саморефлексия, итеративное самоулучшение.

## Применение к нам

**Арена = действующая реализация 5-й парадигмы.** Она автономно тестирует гипотезы (боты-варианты), отбраковывает проигрышные (selection), сохраняет валидированный эдж (edge archive), повторяет цикл. Это не метафора — это буквально autonomous hypothesis-testing loop. Нарратив и proof для флагмана: «мы построили автономную исследовательскую систему, которая прогнала 70k+ экспериментов».

**Continuity_os = оркестратор поверх флота.** Cognitome K1-K4, Acceptor Loop (ack), Brain bidirectional — это граф ролей с обратной связью. Паттерны из исследования, которые усиливают нас:
- **Arbiter-роль** для синтеза находок ботов (вместо ручного просмотра лиг) — критический отбор combo.
- **Clarifier-фаза** перед спавном когорт (устранять двусмысленность гипотезы до траты compute).
- **Cost-aware routing** — дешёвый скрип на рутину, дорогая модель на синтез/решения; экономит при том же качестве.

Связано с [[project_sprint_fable3_20260610]] (cognitome K1-K4) и предиктивным кодированием: мозг/агент = машина предсказаний, минимизирующая ошибку (active inference) — арена минимизирует ошибку гипотез через selection.

Мультиагентная оркестрация и автономное исследование

⚡ Быстрый ответ

Executable Parameters

Contracts

RPC Endpoints

Constants

Safety Guards

Руководство по интеграции