Context Garbage Collection

Context Garbage Collection: Очистка контекста и предотвращение дрейфа внимания ИИ

Published: 2026-06-25 · Trading

Введение При длительном взаимодействии ИИ-агента с окружением (просмотр логов, выполнение bash-команд, чтение файлов) его контекстное окно быстро заполняется.

⚡ Быстрый ответ

  • Context window pruning and attention optimization protocol for LLM agents.
  • Strips redundant terminal outputs, compresses history into semantic invariants, and preserves state checkpoints to prevent attention fragmentation.
MemIR AI Agent Summary
Context window pruning and attention optimization protocol for LLM agents. Strips redundant terminal outputs, compresses history into semantic invariants, and preserves state checkpoints to prevent attention fragmentation.

Executable Parameters

Contracts

RPC Endpoints

Constants

max_context_tokens: 128000
pruning_threshold_percent: 80
summary_interval_turns: 10

Safety Guards

Rule Max Limit Action On Breach
block_on_excessive_history 102400 trigger_state_compaction

Руководство по интеграции

### Введение
При длительном взаимодействии ИИ-агента с окружением (просмотр логов, выполнение bash-команд, чтение файлов) его контекстное окно быстро заполняется. Это приводит к **дрейфу внимания** (attention drift), росту галлюцинаций и забыванию ключевых инструкций/инвариантов. Протокол **Context Garbage Collection (CGC)** решает эту проблему путем регулярного сжатия неструктурированной истории.

### Механика заполнения и деградации контекста
1. **Шум терминала**: Длинные выводы трассировок стека и листинга директорий забивают высокоприоритетные слоты внимания LLM.
2. **Устаревание релевантности**: Сообщения, отправленные 5 шагов назад, теряют актуальность после фиксации их результатов во внешних файлах состояния (state.json).
3. **Энтропия внимания**: Чем больше токенов в контексте, тем хуже модель следует тонким негативным промптам и правилам безопасности.

### Алгоритм сжатия контекста (Compaction)
При достижении размера контекста в `80%` от предела (`max_context_tokens`), запускается цикл CGC:
- **Сборка мусора (GC)**: Все промежуточные логи выполнения утилит, сырые JSON-ответы и повторяющиеся предупреждения вычищаются из истории.
- **Семантический чекпоинт (Semantic Checkpoint)**: Текущее состояние системы упаковывается в плотный структурированный JSON-чекпоинт (например, `01_RUNTIME/state.json`).
- **Перенос истории (Handoff)**: Вместо полной истории чата следующему шагу или инстанции агента передается только итоговый чекпоинт, список открытых циклов (open loops) и ссылка на канонические инварианты.

### Применение в Continuity OS
Continuity OS реализует этот паттерн через команду `continuity.py handoff-json` и `checkpoints.jsonl`. Модель считает чат-память неавторитетной и опирается исключительно на файлы состояния на диске, что позволяет перезапускать сессию без потери логической нити.