Контекстное окно
Понимание ограничений контекста моделей
Схема для простого понимания
Что такое контекстное окно?
Контекстное окно — это "память" ИИ. Представьте, что у человека есть ограниченная память для разговора. Точно так же у каждой модели ИИ есть лимит на количество информации, которую она может "держать в голове" одновременно.
Что входит в контекст:
- Вся история вашего диалога
- Ваш новый вопрос
- Ответ, который генерирует ИИ
Как это работает на практике
Короткий диалог
ИИ помнит всё с самого начала разговора. Может ссылаться на любое ваше сообщение.
Длинный диалог
Когда контекст заполняется, старые сообщения автоматически 'забываются'. ИИ помнит только недавние.
Примеры для понимания масштаба
Gemini 2.5 Flash — 1 миллион токенов
Это примерно как прочитать целую книгу среднего размера (около 400 страниц текста)
GPT-5 — 128 тысяч токенов
Это как короткая повесть или большая статья (около 50 страниц)
GPT-5 nano — 32 тысячи токенов
Это как длинное эссе или отчет (около 12 страниц)
Простое правило: 1000 токенов ≈ 3 страницы обычного текста на русском языке.
На что это влияет
Для коротких задач — контекст не важен. Спросили, получили ответ.
Для длинных диалогов — ИИ может "забыть" что вы говорили в начале разговора, если диалог стал слишком длинным.
Практический совет: Если диалог стал очень длинным, а вам нужно сослаться на что-то из начала — лучше создать новый чат и кратко пересказать важную информацию.