주 콘텐츠로 건너뛰기

샘플링 증명 프로토콜: 탈중앙화 AI 추론에서 정직을 장려하고 부정직을 처벌하기

· 1분 읽기
Lark Birdy
Chief Bird Officer

탈중앙화 AI에서는 GPU 제공자의 무결성과 신뢰성을 보장하는 것이 중요합니다. Holistic AI의 최근 연구에서 제시된 샘플링 증명 (PoSP) 프로토콜은 좋은 행위자를 장려하고 나쁜 행위자를 처벌하는 정교한 메커니즘을 제공합니다. 이 프로토콜이 어떻게 작동하는지, 경제적 인센티브, 벌칙, 그리고 탈중앙화 AI 추론에의 적용을 살펴보겠습니다.

정직한 행동에 대한 인센티브

경제적 보상

PoSP 프로토콜의 핵심은 정직한 참여를 장려하기 위해 설계된 경제적 인센티브입니다. 노드는 주장자와 검증자로서의 기여에 따라 보상을 받습니다:

  • 주장자: 계산된 출력이 정확하고 도전받지 않은 경우 보상 (RA)을 받습니다.
  • 검증자: 결과가 주장자와 일치하고 정확하다고 검증되면 보상 (RV/n)을 공유합니다.

독특한 내쉬 균형

PoSP 프로토콜은 모든 노드가 정직하게 행동하도록 동기부여하는 순수 전략의 독특한 내쉬 균형에 도달하도록 설계되었습니다. 개인의 이익을 시스템 보안과 일치시킴으로써, 이 프로토콜은 정직이 참가자에게 가장 수익성 있는 전략이 되도록 보장합니다.

부정직한 행동에 대한 벌칙

슬래싱 메커니즘

부정직한 행동을 억제하기 위해, PoSP 프로토콜은 슬래싱 메커니즘을 사용합니다. 주장자나 검증자가 부정직한 것으로 판명되면, 상당한 경제적 벌칙 (S)을 받습니다. 이는 부정직의 비용이 잠재적인 단기 이익을 훨씬 초과하도록 보장합니다.

도전 메커니즘

무작위 도전은 시스템을 더욱 안전하게 만듭니다. 미리 정해진 확률 (p)로, 프로토콜은 여러 검증자가 주장자의 출력을 다시 계산하는 도전을 시작합니다. 불일치가 발견되면 부정직한 행위자는 처벌받습니다. 이 무작위 선택 과정은 나쁜 행위자가 공모하여 부정행위를 감지되지 않게 하는 것을 어렵게 만듭니다.

PoSP 프로토콜의 단계

  1. 주장자 선택: 노드가 무작위로 선택되어 주장자로서 값을 계산하고 출력합니다.

  2. 도전 확률:

    시스템은 미리 정해진 확률에 따라 도전을 시작할 수 있습니다.

    • 도전 없음: 도전이 시작되지 않으면 주장자는 보상을 받습니다.
    • 도전 시작: 주장자의 출력을 검증하기 위해 무작위로 선택된 검증자 수 (n)가 설정됩니다.
  3. 검증:

    각 검증자는 독립적으로 결과를 계산하고 주장자의 출력과 비교합니다.

    • 일치: 모든 결과가 일치하면, 주장자와 검증자 모두 보상을 받습니다.
    • 불일치: 중재 과정이 주장자와 검증자의 정직성을 결정합니다.
  4. 벌칙: 부정직한 노드는 처벌받고, 정직한 검증자는 보상 몫을 받습니다.

SpML

spML (샘플링 기반 머신 러닝) 프로토콜은 탈중앙화 AI 추론 네트워크 내에서 샘플링 증명 (PoSP) 프로토콜의 구현입니다.

주요 단계

  1. 사용자 입력: 사용자는 무작위로 선택된 서버 (주장자)에게 디지털 서명과 함께 입력을 보냅니다.
  2. 서버 출력: 서버는 출력을 계산하고 결과의 해시와 함께 사용자에게 다시 보냅니다.
  3. 도전 메커니즘:
    • 미리 정해진 확률 (p)로, 시스템은 결과를 검증하기 위해 무작위로 다른 서버 (검증자)를 선택하는 도전을 시작합니다.
    • 도전이 시작되지 않으면, 주장자는 보상 (R)을 받고 과정이 종료됩니다.
  4. 검증:
    • 도전이 시작되면, 사용자는 동일한 입력을 검증자에게 보냅니다.
    • 검증자는 결과를 계산하고 해시와 함께 사용자에게 다시 보냅니다.
  5. 비교:
    • 사용자는 주장자와 검증자의 출력 해시를 비교합니다.
    • 해시가 일치하면, 주장자와 검증자 모두 보상을 받고 사용자는 기본 요금에 대한 할인을 받습니다.
    • 해시가 일치하지 않으면, 사용자는 네트워크에 두 해시를 방송합니다.
  6. 중재:
    • 네트워크는 불일치를 기반으로 주장자와 검증자의 정직성을 결정하기 위해 투표합니다.
    • 정직한 노드는 보상을 받고, 부정직한 노드는 처벌받습니다 (슬래싱).

주요 구성 요소 및 메커니즘

  • 결정론적 ML 실행: 고정 소수점 산술 및 소프트웨어 기반 부동 소수점 라이브러리를 사용하여 일관되고 재현 가능한 결과를 보장합니다.
  • 상태 비저장 설계: 각 쿼리를 독립적으로 처리하여 ML 과정 전반에 걸쳐 상태 비저장을 유지합니다.
  • 허가 없는 참여: 누구나 네트워크에 참여하여 AI 서버를 운영함으로써 기여할 수 있습니다.
  • 오프체인 작업: AI 추론은 블록체인의 부하를 줄이기 위해 오프체인에서 계산되며, 결과와 디지털 서명은 사용자에게 직접 전달됩니다.
  • 온체인 작업: 잔액 계산 및 도전 메커니즘과 같은 중요한 기능은 투명성과 보안을 보장하기 위해 온체인에서 처리됩니다.

spML의 장점

  • 높은 보안성: 경제적 인센티브를 통해 보안을 달성하여 노드가 부정직에 대한 잠재적 벌칙 때문에 정직하게 행동하도록 보장합니다.
  • 낮은 계산 오버헤드: 대부분의 경우 검증자는 해시만 비교하면 되므로 검증 시 계산 부하를 줄입니다.
  • 확장성: 네트워크 활동이 많아도 성능 저하 없이 처리할 수 있습니다.
  • 단순성: 구현의 단순성을 유지하여 통합 및 유지보수를 용이하게 합니다.

다른 프로토콜과의 비교

  • 낙관적 사기 증명 (opML):
    • 사기 행위에 대한 경제적 억제와 분쟁 해결 메커니즘에 의존합니다.
    • 충분한 검증자가 정직하지 않으면 사기 행위에 취약합니다.
  • 영지식 증명 (zkML):
    • 암호학적 증명을 통해 높은 보안을 보장합니다.
    • 높은 계산 오버헤드로 인해 확장성과 효율성에서 도전에 직면합니다.
  • spML:
    • 경제적 인센티브를 통한 높은 보안성, 낮은 계산 오버헤드, 높은 확장성을 결합합니다.
    • 해시 비교에 중점을 두어 검증 과정을 단순화하고 도전 시 복잡한 계산의 필요성을 줄입니다.

요약

샘플링 증명 (PoSP) 프로토콜은 좋은 행위자를 장려하고 나쁜 행위자를 억제하는 필요성을 효과적으로 균형 잡아 탈중앙화 시스템의 전반적인 보안과 신뢰성을 보장합니다. 경제적 보상과 엄격한 벌칙을 결합함으로써, PoSP는 정직한 행동이 장려될 뿐만 아니라 성공을 위해 필수적인 환경을 조성합니다. 탈중앙화 AI가 계속 성장함에 따라, PoSP와 같은 프로토콜은 이러한 고급 시스템의 무결성과 신뢰성을 유지하는 데 필수적일 것입니다.