Контекстное окно

Контекстное окно Схема для простого понимания

Что такое контекстное окно?

Контекстное окно — это "память" ИИ. Представьте, что у человека есть ограниченная память для разговора. Точно так же у каждой модели ИИ есть лимит на количество информации, которую она может "держать в голове" одновременно.

Что входит в контекст:

Вся история вашего диалога
Ваш новый вопрос
Ответ, который генерирует ИИ

Как это работает на практике

Короткий диалог

ИИ помнит всё с самого начала разговора. Может ссылаться на любое ваше сообщение.

Длинный диалог

Когда контекст заполняется, старые сообщения автоматически 'забываются'. ИИ помнит только недавние.

Примеры для понимания масштаба

Gemini 2.5 Flash — 1 миллион токенов
Это примерно как прочитать целую книгу среднего размера (около 400 страниц текста)

GPT-5 — 128 тысяч токенов
Это как короткая повесть или большая статья (около 50 страниц)

GPT-5 nano — 32 тысячи токенов
Это как длинное эссе или отчет (около 12 страниц)

Простое правило: 1000 токенов ≈ 3 страницы обычного текста на русском языке.

На что это влияет

Для коротких задач — контекст не важен. Спросили, получили ответ.

Для длинных диалогов — ИИ может "забыть" что вы говорили в начале разговора, если диалог стал слишком длинным.

Практический совет: Если диалог стал очень длинным, а вам нужно сослаться на что-то из начала — лучше создать новый чат и кратко пересказать важную информацию.