Руководство по интеграции
### Введение
При длительном взаимодействии ИИ-агента с окружением (просмотр логов, выполнение bash-команд, чтение файлов) его контекстное окно быстро заполняется. Это приводит к **дрейфу внимания** (attention drift), росту галлюцинаций и забыванию ключевых инструкций/инвариантов. Протокол **Context Garbage Collection (CGC)** решает эту проблему путем регулярного сжатия неструктурированной истории.
### Механика заполнения и деградации контекста
1. **Шум терминала**: Длинные выводы трассировок стека и листинга директорий забивают высокоприоритетные слоты внимания LLM.
2. **Устаревание релевантности**: Сообщения, отправленные 5 шагов назад, теряют актуальность после фиксации их результатов во внешних файлах состояния (state.json).
3. **Энтропия внимания**: Чем больше токенов в контексте, тем хуже модель следует тонким негативным промптам и правилам безопасности.
### Алгоритм сжатия контекста (Compaction)
При достижении размера контекста в `80%` от предела (`max_context_tokens`), запускается цикл CGC:
- **Сборка мусора (GC)**: Все промежуточные логи выполнения утилит, сырые JSON-ответы и повторяющиеся предупреждения вычищаются из истории.
- **Семантический чекпоинт (Semantic Checkpoint)**: Текущее состояние системы упаковывается в плотный структурированный JSON-чекпоинт (например, `01_RUNTIME/state.json`).
- **Перенос истории (Handoff)**: Вместо полной истории чата следующему шагу или инстанции агента передается только итоговый чекпоинт, список открытых циклов (open loops) и ссылка на канонические инварианты.
### Применение в Continuity OS
Continuity OS реализует этот паттерн через команду `continuity.py handoff-json` и `checkpoints.jsonl`. Модель считает чат-память неавторитетной и опирается исключительно на файлы состояния на диске, что позволяет перезапускать сессию без потери логической нити.
При длительном взаимодействии ИИ-агента с окружением (просмотр логов, выполнение bash-команд, чтение файлов) его контекстное окно быстро заполняется. Это приводит к **дрейфу внимания** (attention drift), росту галлюцинаций и забыванию ключевых инструкций/инвариантов. Протокол **Context Garbage Collection (CGC)** решает эту проблему путем регулярного сжатия неструктурированной истории.
### Механика заполнения и деградации контекста
1. **Шум терминала**: Длинные выводы трассировок стека и листинга директорий забивают высокоприоритетные слоты внимания LLM.
2. **Устаревание релевантности**: Сообщения, отправленные 5 шагов назад, теряют актуальность после фиксации их результатов во внешних файлах состояния (state.json).
3. **Энтропия внимания**: Чем больше токенов в контексте, тем хуже модель следует тонким негативным промптам и правилам безопасности.
### Алгоритм сжатия контекста (Compaction)
При достижении размера контекста в `80%` от предела (`max_context_tokens`), запускается цикл CGC:
- **Сборка мусора (GC)**: Все промежуточные логи выполнения утилит, сырые JSON-ответы и повторяющиеся предупреждения вычищаются из истории.
- **Семантический чекпоинт (Semantic Checkpoint)**: Текущее состояние системы упаковывается в плотный структурированный JSON-чекпоинт (например, `01_RUNTIME/state.json`).
- **Перенос истории (Handoff)**: Вместо полной истории чата следующему шагу или инстанции агента передается только итоговый чекпоинт, список открытых циклов (open loops) и ссылка на канонические инварианты.
### Применение в Continuity OS
Continuity OS реализует этот паттерн через команду `continuity.py handoff-json` и `checkpoints.jsonl`. Модель считает чат-память неавторитетной и опирается исключительно на файлы состояния на диске, что позволяет перезапускать сессию без потери логической нити.