Как зарабатывать на своих моделях, датасетах, инференсах и Gradio-демо на платформе Qubu.

Монетизация на Qubu

Платформа Qubu позволяет авторам моделей и датасетов зарабатывать на своих разработках. Вы сами решаете, что будет бесплатным, а что платным — и устанавливаете цену в токенах.

На Qubu доступны два основных способа монетизации:

Платное скачивание

Продажа доступа к скачиванию модели или датасета за токены. Автор получает 70% дохода.

Инференс / Gradio / API

Платные запросы к развёрнутому endpoint'у модели. Автор получает 90% дохода.

1. Платное скачивание модели

Автор может разместить модель для платного скачивания и установить стоимость в токенах.

Загрузка модели

Автор загружает модель на платформу, заполняет описание, теги и метаданные.

Настройка стоимости

На странице редактирования автор указывает стоимость скачивания в токенах. Если оставить бесплатно — доступ будет открыт всем.

Оплата пользователем

Пользователь оплачивает скачивание токенами со своего баланса. После оплаты модель становится доступна для скачивания.

Распределение дохода

При продаже модели доход распределяется следующим образом:

Получатель	Доля
Автор	70%
Платформа Qubu	30%

Распределение дохода при платном скачивании: 70% автору, 30% платформе

Вывод средств

Средства от продажи модели становятся доступны к выводу через 7 дней после транзакции.

2. Ограничение доступа к скачиванию

Все загруженные данные и модели размещаются в защищённой среде QUBU.

Если автор не хочет предоставлять модель для скачивания как open-source решение, при добавлении модели можно включить опцию «Запретить скачивание».

В этом случае:

скачивание модели будет недоступно
пользователи смогут работать с моделью только через инференс

Защита интеллектуальной собственности

Опция «Запретить скачивание» полезна для коммерческих моделей, которые вы хотите предоставлять только как сервис, не раскрывая веса и архитектуру.

3. Монетизация через инференс, Gradio и API

Автор может разместить модель на мощностях Qubu и получать доход за обращения к ней через интерфейс или API. Даже если модель сама по себе бесплатна, вы можете сделать платными запросы к инференсу или Gradio-демо.

Поддерживаемые форматы

Inference

Прямые запросы к endpoint'у модели

Gradio

Запросы через Gradio-интерфейс

API

Программный доступ через REST API

Как это работает

Развёртывание модели

Автор разворачивает модель на мощностях Qubu.

Выбор конфигурации

Автор выбирает конфигурацию размещения (GPU/CPU, тип инстанса).

Настройка стоимости запроса

Во вкладке «Инференс» на странице редактирования модели автор устанавливает стоимость одного запроса в токенах.

Получение дохода

Пользователи отправляют запросы к модели, оплата списывается в токенах, доход распределяется между автором и платформой.

Хостер инференса оплачивает GPU-ресурсы из своего баланса. Чтобы компенсировать эти расходы, можно установить цену за каждый запрос к API.

Настройка:

Откройте страницу редактирования модели
В секции инференса включите платные запросы
Укажите стоимость одного запроса в токенах

Когда пользователь отправляет запрос к вашему endpoint'у — с его баланса списываются токены, которые зачисляются хостеру.

Аналогично инференсу: если у модели настроен Gradio-интерфейс, вы можете сделать запросы к нему платными.

Настройка:

Откройте страницу редактирования модели
В секции Gradio включите платные запросы
Укажите стоимость одного запроса в токенах

Распределение дохода

При монетизации через инференс, Gradio и API доход распределяется следующим образом:

Получатель	Доля
Автор	90%
Платформа Qubu	10%

Распределение дохода при инференсе: 90% автору, 10% платформе

Кто платит за GPU?

GPU-ресурсы для инференса и Gradio оплачивает хостер (автор модели). Платные запросы — это способ компенсировать эти затраты и выйти в плюс. Аренда вычислительных ресурсов оплачивается отдельно от распределения дохода.

4. Расходы на размещение инференса

При размещении инференса автор оплачивает аренду вычислительных ресурсов, на которых работает модель.

Доступные ресурсы

На платформе доступны следующие варианты размещения:

Тип	Описание
GPU	Для ресурсоёмких моделей (LLM, генерация изображений и т.д.)
CPU	Для лёгких моделей и задач, не требующих GPU

Также доступны:

Бесплатный тир — для экспериментов и тестирования
Платные варианты — для продакшен-нагрузки

Стоимость зависит от выбранного варианта размещения. Доступные конфигурации могут отличаться по вычислительным параметрам и стоимости, поэтому выбор зависит от требований конкретной модели.

5. Автоскейл

Для снижения расходов на размещение инференса доступна настройка автоскейла.

Принцип работы

Если модель не используется, она автоматически переводится в режим сна. Время до перехода в сон определяется значением, указанным автором в настройках автоскейла.

Назначение

Автоскейл используется для:

Снижения затрат на простой вычислительных ресурсов
Отключения неиспользуемого инференса в автоматическом режиме
Более эффективного использования инфраструктуры

Экономия на простое

Рекомендуем настроить автоскейл для всех платных инференсов. Это позволит не платить за GPU/CPU, когда модель не получает запросов.

6. Режимы доступа

При публикации инференса можно выбрать один из следующих режимов доступа:

Public

Доступен всем без авторизации.

Private

Доступен только владельцу деплоя.

Qubu users

Доступен только авторизованным пользователям Qubu.

Сценарии монетизации

Сценарий	Модель	Инференс/Gradio	Доход автора
Полностью бесплатная	Бесплатная	Бесплатный	—
Платная модель	Платная (70%)	Бесплатный	Токены за каждую покупку доступа
Бесплатная модель + платный API	Бесплатная	Платный (90%)	Токены за каждый запрос
Полная монетизация	Платная (70%)	Платный (90%)	Токены за доступ + за запросы
Закрытая модель + бесплатный API	Запрет скачивания	Бесплатный	Токены за каждый запрос
Закрытая модель + платный API	Запрет скачивания	Платный (90%)	Токены только за запросы