Расчет стоимости API LLM

ДанныеРазработчикМатематика
Реклама · УДАЛИТЬ?

Запрос

Токены, отправляемые в модель на каждый вызов (промпт + контекст).
Токены, возвращаемые моделью на каждый вызов (завершение).
Сколько запросов вы делаете каждый день. Используется для ежедневных и ежемесячных прогнозов.

Модель и режим цен

Стоимость выбранной модели

Сравнение моделей в режиме «сторона к стороне»

Примечания

Цены основаны на публикуемых ценах за 1 млн токенов и могут отличаться от вашей корпоративной ставки. Цены на пакеты применяют стандартную скидку 50% поставщика (OpenAI, Anthropic, Google). Цены на API Meta / Llama устанавливаются на общих хостинговых платформах и обычно не включают пакетный уровень.
Реклама · УДАЛИТЬ?

Гид

Калькулятор стоимости API LLM

Расчет стоимости API LLM

Оцените, сколько будет стоить вызов API LLM до развертывания. Введите количество входных токенов, выходных токенов и ежедневный объем запросов, выберите модель и этот инструмент покажет расходы на каждый вызов, в день, в месяц и в год для моделей OpenAI, Anthropic, Google и Meta — используя текущие публикуемые цены за 1 млн токенов. Отлично подходит для проверки предложения, сравнения поставщиков или планирования бюджета запуска.

Как использовать

  1. Введите среднее значение Входные токены на каждый запрос (ваш промпт плюс любой контекст, который вы передаете).
  2. Введите среднее значение Выходные токены которое вы ожидаете получить от модели.
  3. Введите количество Вызовы в день которое вы ожидаете делать в производстве.
  4. Выберите Модель из выпадающего списка (OpenAI, Anthropic, Google или Meta / Llama).
  5. Переключение между Реальные цены и Цены на пакеты чтобы увидеть скидку 50% при поддержке поставщика.
  6. Просмотрите сводку по стоимости на каждый вызов, в день, в месяц и в год, затем прокрутите к сравнительной таблице, чтобы увидеть, сколько будет стоить одинаковая нагрузка на каждой из других моделей.

Возможности

  • Мульти-поставщикская цена — OpenAI, Anthropic, Google и модели Meta / Llama в одной таблице.
  • Переключение между реальными и пакетными ценами — увидите скидку 50% для OpenAI, Anthropic и Google, и ясную «не поддерживается» там, где поставщик не имеет пакетного уровня.
  • Прогнозы на каждый вызов, в день, в месяц и в год — прогнозы используют средний месячный показатель в 30,44 дня для реалистичного темпа выполнения.
  • Таблица сравнения моделей в режиме «сторона к стороне» — увидите, сколько будет стоить одинаковая нагрузка на каждую поддерживаемую модель, с выделенной вашей выбранной моделью.
  • Отдельная цена на входные и выходные токены — поскольку выходные токены обычно в 2–5 раз дороже входных токенов.
  • Без серверов, без отслеживания — все расчеты цен выполняются на стороне клиента. Ваши счетчики токенов и объемы никогда не покидают ваш браузер.

Часто задаваемые вопросы

  1. Что такое токен и почему LLMs взимают за токен?

    Токен — это фрагмент текста, который читает и пишет модель — примерно слово, подслово или один знак пунктуации. Английский текст в среднем содержит около четырех символов на токен. LLMs взимают за токен, потому что стоимость вычислений растет пропорционально количеству обработанных токенов: каждый входной токен должен быть внимательно обработан, а каждый выходной токен генерируется пошагово. Ценовая модель на токен дает линейную и предсказуемую стоимость, которая напрямую отражает реальную работу GPU.

  2. Почему выходные токены обычно дороже входных?

    Входные токены обрабатываются в одном параллельном прямом проходе: модель читает весь промпт за один раз. Выходные токены, с другой стороны, генерируются автобаковыми способами — каждый новый токен требует еще один прямой проход по растущему контексту. Такой пошаговый процесс более дорогой на токен, поэтому поставщики обычно устанавливают цену на выходные токены в 2–5 раз выше, чем на входные.

  3. Что такое пакетная цена и в каких случаях она имеет смысл?

    Пакетная цена позволяет вам отправлять несколько запросов одновременно и получать результаты в течение установленного времени поставщика — обычно 24 часа у OpenAI, Anthropic и Google. Поскольку такие задачи могут быть запланированы на периоды низкой загруженности, поставщики предлагают скидку 50% как на входные, так и на выходные токены. Пакетная цена идеальна для оффлайн-загрузок, таких как обогащение документов, выполнение тестов, заполнение векторных баз и ежедневные отчеты. Она не подходит для задач, на которые пользователь ждет, например, чат или интерактивный поиск.

  4. Почему одинаковое количество токенов стоит дороже на больших моделях?

    Большие модели имеют больше параметров, что означает, что каждый прямой проход требует больше вычислительных ресурсов и больше пропускной способности памяти. Модель с 405-миллиардными параметрами просто выполняет больше арифметических операций на каждый токен, чем модель с 8-миллиардными параметрами. Поставщики передают эту стоимость в виде более высокой цены за токен. Именно поэтому для простых задач классификации или извлечения часто подходит более мелкая, быстрая модель — вы платите меньше и получаете ответ быстрее.

  5. Отражают ли публикуемые цены то, сколько я фактически заплатлю?

    Не всегда. Публикуемые цены — это исходная точка, но большинство поставщиков предлагают скидки за коммитированное использование, корпоративные контракты, предоплаченные кредиты и уровни объема, которые снижают эффективную цену за токен. Кроме того, кэшированные промпты, функции сжатия промптов и специфические для поставщика кэширования контекста могут значительно снизить стоимость входных токенов для повторяющихся нагрузок. Рассматривайте калькуляторы цен по спискам как верхнюю границу для планирования, а затем добавляйте договорные скидки сверху.

Хотите убрать рекламу? Откажитесь от рекламы сегодня

Установите наши расширения

Добавьте инструменты ввода-вывода в свой любимый браузер для мгновенного доступа и более быстрого поиска

в Расширение Chrome в Расширение края в Расширение Firefox в Расширение Opera

Табло результатов прибыло!

Табло результатов — это интересный способ следить за вашими играми, все данные хранятся в вашем браузере. Скоро появятся новые функции!

Реклама · УДАЛИТЬ?
Реклама · УДАЛИТЬ?
Реклама · УДАЛИТЬ?

новости с техническими моментами

Примите участие

Помогите нам продолжать предоставлять ценные бесплатные инструменты

Купи мне кофе
Реклама · УДАЛИТЬ?