Adaptive Delegation Gate

Adaptive Delegation Gate: Шлюз адаптивного делегирования полномочий ИИ-агентов

Published: 2026-06-25 · Trading

Введение При работе с автономными ИИ-агентами ключевой угрозой является дрейф автономии (autonomy drift) — ситуация, когда агент расширяет свои полномочия в процессе сессии, ссылаясь на контекстную не

⚡ Быстрый ответ

  • Adaptive delegation security gate classifying task permissions from D0 (Read-Only) to D3 (External Side Effects).
  • Prevents autonomy drift and unauthorized prompt-based permission expansion.
MemIR AI Agent Summary
Adaptive delegation security gate classifying task permissions from D0 (Read-Only) to D3 (External Side Effects). Prevents autonomy drift and unauthorized prompt-based permission expansion.

Executable Parameters

Contracts

RPC Endpoints

Constants

default_security_class: D0
enforce_dry_run_on_d3: true

Safety Guards

Rule Max Limit Action On Breach
block_unapproved_d2_writes 1 reject_write_and_log
block_autonomous_d3_actions 0 halt_and_request_human_signature

Руководство по интеграции

### Введение
При работе с автономными ИИ-агентами ключевой угрозой является **дрейф автономии** (autonomy drift) — ситуация, когда агент расширяет свои полномочия в процессе сессии, ссылаясь на контекстную необходимость, и перезаписывает системные файлы или отправляет некорректные транзакции. Протокол **Adaptive Delegation Gate (ADG)** делит все задачи на 4 класса детерминированного доступа.

### Классификация задач по уровню доступа
* **D0 — Observe (Только чтение)**: Анализ архивов, инспекция дерева проекта, парсинг логов. Действия полностью автономны, не требуют подтверждения и не меняют файлы.
* **D1 — Propose (Черновики/Предложения)**: Создание патчей, генерация спецификаций, подготовка файлов предложений. Запись разрешена только на специальные временные поверхности (`/proposals`). Прямая запись в канонические файлы закрыта.
* **D2 — Controlled Internal Write (Контролируемая запись)**: Модификация файлов состояния (`state.json`), перезапись реестров проектов, фиксация чекпоинтов. Выполняется автономно только при наличии предварительно согласованного правила (rule-based) или требует цифровой подписи оператора. Всегда пишется детальный аудит-лог.
* **D3 — External Side Effects (Внешние эффекты)**: Отправка сообщений пользователям, вызовы API бирж для торговли, транзакции блокчейна, изменение настроек инфраструктуры (Docker/Composed). Агентам **запрещено** выполнять D3 действия автономно. Требуется обязательное подтверждение человека (Human-in-the-Loop) и проверка работоспособности аварийной кнопки отмены (Kill-Switch).

### Негоциируемые правила (Non-Negotiables)
1. Память или знакомство с контекстом не дают права на расширение полномочий.
2. Любое действие класса D2/D3 должно создавать точку отката (rollback pointer) и фиксироваться в неизменяемом журнале транзакций.
3. Запрещено выполнять D3 действия в рамках той же сессии, в которой была впервые верифицирована целевая сущность.