Multi Model Debate

Multi-Model Debate: Консенсус и самокоррекция ИИ через дебаты моделей

Published: 2026-06-25 · Trading

Введение Одиночная модель, даже обладающая продвинутыми способностями рассуждения (reasoning), склонна к незаметным логическим ошибкам и ложной уверенности (hallucinatory certainty).

⚡ Быстрый ответ

  • Multi-model debate consensus and verification protocol for autonomous agents.
  • Orchestrates Proposer, Critic, and Judge roles to validate complex system states and trading parameters before execution.
MemIR AI Agent Summary
Multi-model debate consensus and verification protocol for autonomous agents. Orchestrates Proposer, Critic, and Judge roles to validate complex system states and trading parameters before execution.

Executable Parameters

Contracts

RPC Endpoints

Constants

max_debate_rounds: 2
min_consensus_threshold: 0.8
models_involved: ["Proposer-LLM","Critic-LLM","Judge-LLM"]

Safety Guards

Rule Max Limit Action On Breach
enforce_judge_veto 1 abort_execution

Руководство по интеграции

### Введение
Одиночная модель, даже обладающая продвинутыми способностями рассуждения (reasoning), склонна к незаметным логическим ошибкам и ложной уверенности (hallucinatory certainty). Протокол **Multi-Model Debate (MMD)** снижает риск подобных ошибок путем создания структурированного процесса дискуссии между специализированными ролями моделей перед фиксацией любых необратимых изменений.

### Архитектура ролей (Proposer-Critic-Judge)
Дебаты организуются по трехролевой схеме:
1. **Proposer (Предлагающий)**: Модель выдвигает техническое решение или генерирует торговый ордер на основе входящих данных.
2. **Critic (Критик)**: Модель берет предложение первого агента и ищет в нем уязвимости, скрытые риски, неоптимальные параметры или нарушения правил безопасности (invariants). Критик промптуется на максимальный скептицизм.
3. **Judge (Судья)**: Модель анализирует аргументы обеих сторон, сопоставляет их с каноническими правилами (`INVARIANTS.md`) и выносит финальный вердикт: одобрить, отклонить или отправить на доработку.

### Формализация консенсуса
Для критически важных решений (например, изменение параметров сетки ATR или перевод средств) раунд дебатов повторяется до `max_debate_rounds` раз. Если финальный консенсус (уровень согласия судей) падает ниже `min_consensus_threshold` (80%), срабатывает шлюз **Judge Veto** — сделка или действие отменяется.

### Преимущества дебатов
- **Самокоррекция (Self-Correction)**: Модель-Proposer часто исправляет свои ошибки на втором раунде после получения конкретной критики от модели-Critic.
- **Разделение интересов**: Критик не имеет доступа к генерации действия, что исключает когнитивное искажение подтверждения (confirmation bias).
- **Логирование дебатов**: Полная трассировка спора записывается в [decision_log.jsonl](file:///c:/PROJECTS/continuity_os/trading/decision_log.jsonl) для последующего ручного аудита оператором.