Перейти к основному содержимому

Протокол Proof of Sampling: Стимулирование честности и наказание за нечестность в децентрализованной инференции ИИ

· 5 мин. чтения
Lark Birdy

В децентрализованной инференции ИИ обеспечение целостности и надежности поставщиков GPU является критически важным. Протокол Proof of Sampling (PoSP), описанный в недавних исследованиях Holistic AI, предоставляет сложный механизм для стимулирования добросовестных участников и наказания недобросовестных. Давайте посмотрим, как работает этот протокол, его экономические стимулы, штрафы и применение в децентрализованной инференции ИИ.

Стимулы для честного поведения

Экономические награды

В основе протокола PoSP лежат экономические стимулы, направленные на поощрение честного участия. Узлы, выступающие в роли утверждающих и валидаторов, получают вознаграждение в зависимости от их вклада:

  • Утверждающие: Получают награду (RA), если их рассчитанный результат верен и не оспаривается.
  • Валидаторы: Делят награду (RV/n), если их результаты совпадают с результатами утверждающего и признаны корректными.

Уникальное равновесие Нэша

Протокол PoSP спроектирован таким образом, чтобы достичь уникального равновесия Нэша в чистых стратегиях, когда все узлы мотивированы действовать честно. Соответствие индивидуальной прибыли с безопасностью системы гарантирует, что честность является наиболее прибыльной стратегией для участников.

Наказания за нечестное поведение

Механизм штрафов

Чтобы предотвратить нечестное поведение, протокол PoSP использует механизм штрафов. Если утверждающий или валидатор уличены в нечестности, они сталкиваются с серьезными экономическими штрафами (S). Это гарантирует, что стоимость нечестности значительно превышает возможные краткосрочные выгоды.

Механизм вызовов

Случайные вызовы дополнительно защищают систему. С заранее определенной вероятностью (p) протокол инициирует вызов, при котором несколько валидаторов повторно вычисляют результат утверждающего. Если обнаружены расхождения, недобросовестные участники наказываются. Этот случайный процесс делает сложно для недобросовестных участников вступить в сговор и обмануть систему, оставаясь незамеченными.

Шаги протокола PoSP

  1. Выбор утверждающего: Узел выбирается случайным образом для выполнения роли утверждающего, вычисления и вывода значения.

  2. Вероятность вызова:

    Система может инициировать вызов на основе заранее определенной вероятности.

  • Без вызова: Утверждающий получает награду, если вызов не инициируется.
  • Вызов инициирован: Определенное количество (n) валидаторов случайным образом выбирается для проверки результата утверждающего.
  1. Валидация:

    Каждый валидатор независимо вычисляет результат и сравнивает его с результатом утверждающего.

  • Совпадение: Если все результаты совпадают, и утверждающий, и валидаторы получают награду.
  • Несоответствие: Процесс арбитража определяет честность утверждающего и валидаторов.
  1. Наказания: Нечестные узлы наказываются, а честные валидаторы получают свою долю награды.

spML

Протокол spML (sampling-based Machine Learning) является реализацией протокола Proof of Sampling (PoSP) в рамках децентрализованной сети инференции ИИ.

Основные шаги

  1. Ввод пользователя: Пользователь отправляет свои данные на случайно выбранный сервер (утверждающий) вместе с цифровой подписью.
  2. Вывод сервера: Сервер вычисляет результат и отправляет его пользователю вместе с хешем результата.
  3. Механизм вызова:
  • С заранее определенной вероятностью (p) система инициирует вызов, при котором случайным образом выбирается другой сервер (валидатор) для проверки результата.
  • Если вызов не инициирован, утверждающий получает награду (R), и процесс завершается.
  1. Проверка:
  • Если вызов инициирован, пользователь отправляет те же данные валидатору.
  • Валидатор вычисляет результат и отправляет его пользователю вместе с хешем.
  1. Сравнение:
  • Пользователь сравнивает хеши результатов утверждающего и валидатора.
  • Если хеши совпадают, утверждающий и валидатор получают награду, а пользователь получает скидку на основную плату.
  • Если хеши не совпадают, пользователь транслирует оба хеша в сеть.
  1. Арбитраж:
  • Сеть голосует, чтобы определить честность утверждающего и валидатора на основе выявленных несоответствий.
  • Честные узлы получают вознаграждение, а нечестные подвергаются наказанию (сокращению доли).

Основные компоненты и механизмы

  • Детерминированное выполнение ML: Использует фиксированную арифметику и программные библиотеки для работы с плавающей точкой, чтобы обеспечить согласованные и воспроизводимые результаты.
  • Бездействующий дизайн: Обрабатывает каждый запрос независимо, сохраняя статическую природу процесса ML.
  • Участие без разрешений: Позволяет любому присоединиться к сети и внести свой вклад, запустив сервер ИИ.
  • Операции вне цепи: Инференции ИИ вычисляются вне цепи для снижения нагрузки на блокчейн, результаты и цифровые подписи передаются непосредственно пользователям.
  • Операции на цепи: Критические функции, такие как расчеты баланса и механизмы вызова, выполняются на блокчейне для обеспечения прозрачности и безопасности.

Преимущества spML

  • Высокая безопасность: Достигается безопасность через экономические стимулы, гарантируя, что узлы действуют честно из-за возможных наказаний за нечестность.
  • Низкая вычислительная нагрузка: Валидаторам в большинстве случаев нужно только сравнивать хеши, что снижает вычислительную нагрузку при проверке.
  • Масштабируемость: Система способна обрабатывать высокую сетевую активность без значительного снижения производительности.
  • Простота: Сохраняет простоту реализации, облегчая интеграцию и обслуживание.

Сравнение с другими протоколами

  • Optimistic Fraud Proof (opML):
    • Основывается на экономических дезинцентивах для недобросовестного поведения и механизме разрешения споров.
    • Уязвим для мошеннической активности, если недостаточно валидаторов действуют честно.
  • Zero Knowledge Proof (zkML):
    • Обеспечивает высокую безопасность через криптографические доказательства.
    • Сталкивается с проблемами масштабируемости и эффективности из-за высокой вычислительной нагрузки.
  • spML:
    • Сочетает высокую безопасность через экономические стимулы, низкую вычислительную нагрузку и высокую масштабируемость.
    • Упрощает процесс проверки, фокусируясь на сравнении хешей, что снижает необходимость в сложных вычислениях при вызовах.

Заключение

Протокол Proof of Sampling (PoSP) эффективно балансирует необходимость стимулировать добросовестных участников и устранять недобросовестных, обеспечивая общую безопасность и надежность децентрализованных систем. Совмещая экономические награды с жесткими наказаниями, PoSP создает среду, в которой честное поведение не только поощряется, но и становится необходимым для успеха. По мере роста децентрализованных систем ИИ такие протоколы, как PoSP, станут необходимыми для поддержания целостности и надежности этих передовых систем.