Протокол Proof of Sampling: Стимулирование честности и наказание за нечестность в децентрализованной инференции ИИ
В децентрализованной инференции ИИ обеспечение целостности и надежности поставщиков GPU является критически важным. Протокол Proof of Sampling (PoSP), описанный в недавних исследованиях Holistic AI, предоставляет сложный механизм для стимулирования добросовестных участников и наказания недобросовестных. Давайте посмотрим, как работает этот протокол, его экономические стимулы, штрафы и применение в децентрализованной инференции ИИ.
Стимулы для честного поведения
Экономические награды
В основе протокола PoSP лежат экономические стимулы, направленные на поощрение честного участия. Узлы, выступающие в роли утверждающих и валидаторов, получают вознаграждение в зависимости от их вклада:
- Утверждающие: Получают награду (RA), если их рассчитанный результат верен и не оспаривается.
- Валидаторы: Делят награду (RV/n), если их результаты совпадают с результатами утверждающего и признаны корректными.
Уникальное равновесие Нэша
Протокол PoSP спроектирован таким образом, чтобы достичь уникального равновесия Нэша в чистых стратегиях, когда все узлы мотивированы действовать честно. Соответствие индивидуальной прибыли с безопасностью системы гарантирует, что честность является наиболее прибыльной стратегией для участников.