Монетизация моделей и датасетов
Как зарабатывать на своих моделях, датасетах, инференсах и Gradio-демо на платформе Qubu.
Монетизация на Qubu
Платформа Qubu позволяет авторам моделей и датасетов зарабатывать на своих разработках. Вы сами решаете, что будет бесплатным, а что платным — и устанавливаете цену в токенах.
На Qubu доступны два основных способа монетизации:
Платное скачивание
Продажа доступа к скачиванию модели или датасета за токены. Автор получает 70% дохода.
Инференс / Gradio / API
Платные запросы к развёрнутому endpoint'у модели. Автор получает 90% дохода.
1. Платное скачивание модели
Автор может разместить модель для платного скачивания и установить стоимость в токенах.
Как это работает
Загрузка модели
Автор загружает модель на платформу, заполняет описание, теги и метаданные.
Настройка стоимости
На странице редактирования автор указывает стоимость скачивания в токенах. Если оставить бесплатно — доступ будет открыт всем.
Оплата пользователем
Пользователь оплачивает скачивание токенами со своего баланса. После оплаты модель становится доступна для скачивания.
Получение дохода
Средства зачисляются на баланс автора.
Распределение дохода
При продаже модели доход распределяется следующим образом:
| Получатель | Доля |
|---|---|
| Автор | 70% |
| Платформа Qubu | 30% |
Вывод средств
Средства от продажи модели становятся доступны к выводу через 7 дней после транзакции.
2. Ограничение доступа к скачиванию
Все загруженные данные и модели размещаются в защищённой среде QUBU.
Если автор не хочет предоставлять модель для скачивания как open-source решение, при добавлении модели можно включить опцию «Запретить скачивание».
В этом случае:
- скачивание модели будет недоступно
- пользователи смогут работать с моделью только через инференс
Защита интеллектуальной собственности
Опция «Запретить скачивание» полезна для коммерческих моделей, которые вы хотите предоставлять только как сервис, не раскрывая веса и архитектуру.
3. Монетизация через инференс, Gradio и API
Автор может разместить модель на мощностях Qubu и получать доход за обращения к ней через интерфейс или API. Даже если модель сама по себе бесплатна, вы можете сделать платными запросы к инференсу или Gradio-демо.
Поддерживаемые форматы
Inference
Прямые запросы к endpoint'у модели
Gradio
Запросы через Gradio-интерфейс
API
Программный доступ через REST API
Как это работает
Развёртывание модели
Автор разворачивает модель на мощностях Qubu.
Выбор конфигурации
Автор выбирает конфигурацию размещения (GPU/CPU, тип инстанса).
Настройка стоимости запроса
Во вкладке «Инференс» на странице редактирования модели автор устанавливает стоимость одного запроса в токенах.
Получение дохода
Пользователи отправляют запросы к модели, оплата списывается в токенах, доход распределяется между автором и платформой.
Хостер инференса оплачивает GPU-ресурсы из своего баланса. Чтобы компенсировать эти расходы, можно установить цену за каждый запрос к API.
Настройка:
- Откройте страницу редактирования модели
- В секции инференса включите платные запросы
- Укажите стоимость одного запроса в токенах
Когда пользователь отправляет запрос к вашему endpoint'у — с его баланса списываются токены, которые зачисляются хостеру.
Аналогично инференсу: если у модели настроен Gradio-интерфейс, вы можете сделать запросы к нему платными.
Настройка:
- Откройте страницу редактирования модели
- В секции Gradio включите платные запросы
- Укажите стоимость одного запроса в токенах
Распределение дохода
При монетизации через инференс, Gradio и API доход распределяется следующим образом:
| Получатель | Доля |
|---|---|
| Автор | 90% |
| Платформа Qubu | 10% |
Кто платит за GPU?
GPU-ресурсы для инференса и Gradio оплачивает хостер (автор модели). Платные запросы — это способ компенсировать эти затраты и выйти в плюс. Аренда вычислительных ресурсов оплачивается отдельно от распределения дохода.
4. Расходы на размещение инференса
При размещении инференса автор оплачивает аренду вычислительных ресурсов, на которых работает модель.
Доступные ресурсы
На платформе доступны следующие варианты размещения:
| Тип | Описание |
|---|---|
| GPU | Для ресурсоёмких моделей (LLM, генерация изображений и т.д.) |
| CPU | Для лёгких моделей и задач, не требующих GPU |
Также доступны:
- Бесплатный тир — для экспериментов и тестирования
- Платные варианты — для продакшен-нагрузки
Стоимость зависит от выбранного варианта размещения. Доступные конфигурации могут отличаться по вычислительным параметрам и стоимости, поэтому выбор зависит от требований конкретной модели.
5. Автоскейл
Для снижения расходов на размещение инференса доступна настройка автоскейла.
Принцип работы
Если модель не используется, она автоматически переводится в режим сна. Время до перехода в сон определяется значением, указанным автором в настройках автоскейла.
Назначение
Автоскейл используется для:
- Снижения затрат на простой вычислительных ресурсов
- Отключения неиспользуемого инференса в автоматическом режиме
- Более эффективного использования инфраструктуры
Экономия на простое
Рекомендуем настроить автоскейл для всех платных инференсов. Это позволит не платить за GPU/CPU, когда модель не получает запросов.
6. Режимы доступа
При публикации инференса можно выбрать один из следующих режимов доступа:
Public
Доступен всем без авторизации.
Private
Доступен только владельцу деплоя.
Qubu users
Доступен только авторизованным пользователям Qubu.
Сценарии монетизации
| Сценарий | Модель | Инференс/Gradio | Доход автора |
|---|---|---|---|
| Полностью бесплатная | Бесплатная | Бесплатный | — |
| Платная модель | Платная (70%) | Бесплатный | Токены за каждую покупку доступа |
| Бесплатная модель + платный API | Бесплатная | Платный (90%) | Токены за каждый запрос |
| Полная монетизация | Платная (70%) | Платный (90%) | Токены за доступ + за запросы |
| Закрытая модель + бесплатный API | Запрет скачивания | Бесплатный | Токены за каждый запрос |
| Закрытая модель + платный API | Запрет скачивания | Платный (90%) | Токены только за запросы |
Кратко
Платное скачивание модели
- Модель размещается для скачивания за токены
- 70% дохода получает автор, 30% — платформа
- Вывод средств доступен через 7 дней
Запрет скачивания
- Все загруженные данные и модели размещаются в защищённой среде QUBU
- Автор может включить опцию «Запретить скачивание»
- В этом случае модель будет доступна только через инференс
Инференс / Gradio / API
- Модель размещается на мощностях Qubu
- Автор сам выбирает конфигурацию размещения (GPU/CPU)
- Автор сам устанавливает стоимость запроса
- 90% дохода получает автор, 10% — платформа
- Аренда вычислительных ресурсов оплачивается отдельно
- Для снижения расходов можно использовать автоскейл
Режимы доступа
- Public — доступен всем без авторизации
- Private — только владельцу деплоя
- Qubu users — только авторизованным пользователям