Сэм Альтман о использовании токенов OpenAI и расходах на ИИ

Лиза Эрнст · 04.06.2026 · Искусственный интеллект · 8 мин чтения

Сэм Альтман сделал использование токенов одной из самых важных бизнес-тем в области ИИ в 2026 году. Согласно недавним сообщениям, крупнейший внутренний пользователь токенов OpenAI обрабатывает около 100 миллиардов токенов в месяц, в то время как у одного внешнего пользователя, по сообщениям, этот показатель еще выше.

Это важно, потому что токены — это не просто техническая деталь. Они являются основой для рабочей нагрузки ИИ, задержек, нагрузки на инфраструктуру и многих счетов за API. Для компаний, разрабатывающих продукты на основе ИИ, понимание использования токенов теперь так же важно, как понимание облачного хостинга, запросов к базе данных или серверного трафика.

Что Сэм Альтман на самом деле сказал об использовании токенов OpenAI

Заглавное число простое: крупнейший внутренний пользователь токенов OpenAI, по сообщениям, потребляет около 100 миллиардов токенов в месяц. Альтман также сравнил это число с ранней эрой OpenAI, когда около 100 000 токенов в месяц считалось очень высоким уровнем использования.

Это показывает, как использование ИИ сместилось от случайных подсказок чата к непрерывным рабочим процессам разработчиков, агентам кодирования, автоматизированному анализу, окнам с длинным контекстом и корпоративным системам, которые работают в фоновом режиме.

Сэм Альтман встречается с премьер-министром Японии Сигэру Исибой и генеральным директором SoftBank Масаёси Соном в 2025 году

Источник: Правительство Японии / Офис премьер-министра, CC BY 4.0

Это реальное изображение Сэма Альтмана 2025 года связывает историю использования токенов с текущими обсуждениями корпоративных решений OpenAI, инфраструктуры и международных инвестиций в ИИ.

Что такое токен в использовании OpenAI?

Токен — это небольшая единица текста или данных, обрабатываемая моделью ИИ. На английском языке токен часто составляет около четырех символов или примерно три четверти слова, но точное количество зависит от модели, языка и формата ввода.

OpenAI разделяет использование на категории, такие как входные токены, выходные токены и кэшированные токены. Входные токены поступают из запроса, выходные токены генерируются моделью, а кэшированные токены могут быть повторно использованы из повторяющихся префиксов подсказок или контекста разговора.

Источник: Wikimedia Commons / Логотип OpenAI 2025, общественное достояние Textlogo; могут применяться ограничения товарных знаков

Логотип OpenAI дает статье прямую визуальную связь с компанией, стоящей за обсуждением использования токенов, вместо того, чтобы полагаться только на абстрактные изображения технологий.

Тип токена	Значение	Почему это важно
Входные токены	Подсказка, системные инструкции, файлы, инструменты и контекст разговора, отправленные модели.	Большие подсказки, длинная история чата и повторяющиеся документы могут быстро увеличить затраты.
Выходные токены	Ответ, сгенерированный моделью.	Длинные ответы, этапы рассуждения и выходные данные агента могут стать дорогостоящими в больших масштабах.
Кэшированные токены	Повторяющиеся части подсказки, которые могут быть повторно использованы инфраструктурой модели.	Хорошая структура подсказки может сократить задержку и снизить затраты на ввод для повторяющихся рабочих нагрузок.

Почему использование токенов может расти так быстро

Скачок от тысяч токенов до миллиардов обычно не вызван одной подсказкой. Это происходит, когда ИИ встраивается в рабочие процессы. Ассистент кодирования может читать файлы, проверять ошибки, генерировать исправления, просматривать изменения, вызывать инструменты и повторять этот цикл много раз.

Скриншот интерфейса ChatGPT, показывающий контекст продукта ИИ, видимый пользователю

Источник: Wikimedia Commons / Скриншот ChatGPT, OpenAI

Использование токенов начинается с повседневных взаимодействий пользователя, но в больших масштабах эти разговоры, файлы, инструменты и фоновые действия могут стать очень большими месячными объемами токенов.

Корпоративные сценарии использования особенно требовательны к токенам, поскольку они часто включают длинные документы, записи клиентов, вызовы инструментов, результаты поиска, структурированный JSON, журналы и многоэтапные рабочие процессы агентов. Одно действие пользователя может незаметно вызвать множество вызовов модели.

Распространенные причины взрывного роста использования токенов

Длинная история разговора, отправляемая повторно с каждым запросом.
Большие системные подсказки и повторяющиеся инструкции.
Агенты кодирования ИИ, которые автоматически проверяют множество файлов.
Системы поиска, которые прикрепляют слишком много документов к каждому ответу.
Многословные ответы, которые длиннее, чем фактически нужно пользователю.
Фоновые агенты, которые продолжают работать без строгих бюджетов.

Модели рассуждения могут изменить профиль затрат

Современные системы ИИ все чаще решают, когда отвечать быстро, а когда тратить больше вычислительных ресурсов на более сложную задачу. Это может улучшить качество, но также делает отслеживание использования более важным, поскольку сложные задачи могут потреблять больше невидимой обработки и больше бюджета на выходные данные.

Скриншот GPT-5 с более длительным мышлением, показывающий режим рассуждения в ChatGPT

Источник: Wikimedia Commons / Скриншот GPT-5 с более длительным мышлением, 2025

Интерфейсы, ориентированные на рассуждения, делают вопрос о затратах более наглядным: лучшие ответы могут требовать большей вычислительной мощности, и командам нужно решать, где этот дополнительный бюджет токенов оправдан.

Почему это важно для компаний, занимающихся ИИ, и для клиентов

Для поставщиков моделей высокое использование токенов может означать увеличение доходов, но также и усиление нагрузки на инфраструктуру. Для клиентов высокое использование токенов может означать лучшую автоматизацию, но также и непредсказуемые счета. Токены становятся практичной бизнес-метрикой, поскольку они отражают, сколько работы фактически выполняют системы ИИ.

Важен не максимизация использования токенов ради самого себя. Больше токенов автоматически не означает больше бизнес-ценности. Лучший вопрос заключается в том, способствуют ли каждый токен точности, скорости, автоматизации, доходам, качеству поддержки или производительности разработчиков.

Диаграмма корпоративной структуры OpenAI, обновленная в 2026 году

Источник: Wikimedia Commons / Корпоративная структура OpenAI, обновленная

Обсуждение затрат и токенов также происходит в более широком корпоративном и инвестиционном контексте. Структура OpenAI, партнеры и стратегия инфраструктуры влияют на то, как оценивается, масштабируется и управляется корпоративный ИИ.

Как команды должны измерять использование токенов OpenAI

Пользователи OpenAI должны смотреть не только на ежемесячные итоги. Им следует разбивать использование по областям продуктов, пользователям, моделям, рабочим процессам и типам задач. Это облегчает понимание того, какая автоматизация ценна, а какой рабочий процесс просто сжигает токены.

Метрика	Вопрос, на который нужно ответить
Токены на запрос	Какие подсказки неоправданно велики?
Токены на пользователя	Какие клиенты или внутренние пользователи несут основную часть затрат?
Токены на успешную задачу	Сколько на самом деле стоит один полезный результат?
Коэффициент кэшированных токенов	Достаточно ли хорошо структурированы повторяющиеся подсказки для использования кэширования?
Длина выходных данных	Являются ли ответы длиннее, чем нужно пользователям?

Кэширование подсказок — теперь серьезный рычаг снижения затрат

Кэширование подсказок может сократить задержку и снизить затраты на входные токены, когда подсказки содержат повторяющийся статический контент. Практическое правило простое: поместите стабильные инструкции, примеры и определения инструментов в начало подсказки, а переменный контент, специфичный для пользователя, — позже.

Практические способы сокращения отходов токенов

Держите системные подсказки короткими, стабильными и повторно используемыми.
Резюмируйте старую историю разговора вместо того, чтобы отправлять все бесконечно.
Используйте фильтры поиска, чтобы прикреплять только релевантные документы.
Установите максимальную длину выходных данных для рутинных задач.
Выбирайте меньшие модели для простой классификации, извлечения или форматирования.
Измеряйте затраты на задачу, а не только общие ежемесячные расходы.
Останавливайте фоновые агенты, когда задача выполнена.

Физические серверные стойки, представляющие вычислительную мощность, стоящую за масштабной обработкой токенов ИИ

Источник: Wikimedia Commons / Изображение серверной инфраструктуры

Используется только одно изображение инфраструктуры, потому что оно напрямую объясняет связь между токенами и затратами: каждый токен должен обрабатываться где-то, а это требует реальной вычислительной мощности.

Что это значит для разработчиков, создающих инструменты ИИ

Разработчики должны проектировать системы ИИ, как счетчики инфраструктуры. Каждая подсказка должна иметь причину. Каждый результат поиска должен быть необходим. Каждый цикл агента должен иметь предел. Это особенно важно для SaaS-продуктов, внутренних помощников и инструментов автоматизированного кодирования.

Для команд, создающих веб-основанные рабочие процессы ИИ, экономика токенов должна быть частью дизайна продукта с самого начала. Zerlo также предоставляет практические инструменты для ИИ и веб-разработки по адресу Zerlo tools, где эффективность использования является важной частью создания полезного программного обеспечения.

FAQ: Сэм Альтман, OpenAI и использование токенов

Что сказал Сэм Альтман об использовании токенов OpenAI?

По сообщениям, он сказал, что крупнейший внутренний пользователь токенов OpenAI использует около 100 миллиардов токенов в месяц, в то время как другой пользователь за пределами OpenAI использует еще больше.

Являются ли токены тем же, что и токены криптовалюты?

Нет. В данном контексте токены — это фрагменты текста или данных, обрабатываемые моделью ИИ. Они используются для измерения размера контекста, рабочей нагрузки модели и выставления счетов по API.

Почему токены ИИ стоят денег?

Каждый токен должен обрабатываться инфраструктурой модели. Больше токенов обычно означает больше вычислений, больше использования памяти, больше задержек и более высокую эксплуатационную стоимость.

Всегда ли большее использование токенов означает лучшие результаты ИИ?

Нет. Больший контекст может помочь, когда он релевантен, но ненужный контекст может сделать системы медленнее, дороже и иногда менее сфокусированными.

Как я могу сократить использование токенов OpenAI?

Сокращайте подсказки, обобщайте историю, ограничивайте длину выходных данных, фильтруйте результаты поиска, используйте меньшие модели, где это возможно, и структурируйте повторяющиеся подсказки для кэширования.

Итог

Комментарии Сэма Альтмана об использовании токенов показывают, что внедрение ИИ вступило в новую фазу. Вопрос уже не только в том, у кого больше пользователей или самая умная модель. Вопрос в том, кто может превратить массовое использование токенов в надежную ценность, не теряя контроля над затратами, инфраструктурой и сложностью рабочего процесса.