블록체인 개념은 산업 및 사회적 응용 분야에서 광범위하게 배포될 새로운 기술의 핵심을 형성하고 있습니다. 정부, 금융 기관, 은행, 산업 공급망, 서비스 회사, 교육 기관 및 병원은 블록체인 기술을 통해 비즈니스 효율성과 운영 탄력성을 개선하기를 희망하며 대규모로 투자하고 있습니다. 본 연구는 블록체인 기술과 게임 이론을 활용해 신뢰할 수 있는 B2B 시장 플랫폼 설계에 초점을 맞추고 있습니다. 제안된 플랫폼은 세 가지 핵심 아이디어를 바탕으로 구성되었습니다. 첫째, 허가형 블록체인과 스마트 컨트랙트를 B2B 플랫폼을 구축하는 기술적으로 타당한 접근 방식으로 사용합니다. 이 블록체인은 기업 구매자와 판매자의 상호 작용을 규제하는 스마트 컨트랙트를 배포합니다. 둘째, 스마트 컨트랙트는 반복 게임 모델의 전략적 상호작용을 철저히 분석하여 설계되었습니다. 이러한 스마트 컨트랙트가 구매자와 판매자가 성실한 행동을 하도록 유도한다는 것을 보여줍니다. 셋째, 우리는 허가형 블록체인에 암호화 규제 프로토콜을 내장하여 비즈니스 관련 정보가 경쟁 업체에게 공개되지 않도록 합니다. 우리의 연구는 사회적 복지를 극대화하고 전략적인 기업 에이전트 간 신뢰할 수 있는 협력을 가능하게 하는 강력한 B2B 플랫폼을 구축하는 데 중요한 단계가 되고자 합니다.
This research focuses on designing a trustworthy B2B market platform using permissioned blockchains and game theory. The proposed solution uses smart contracts to regulate interactions between business buyers and sellers, ensuring the security of sensitive information from competitors while promoting honest behavior among participants through rigorous analysis of repeated game models. By integrating cryptographic protocols into the blockchain architecture, this framework can prevent unauthorized disclosure of business-sensitive data. The research presents a novel approach for building reliable reputation systems in B2B platforms, which enhances collaboration and protects sensitive information while maximizing social welfare.
# 암호화 프로토콜: 몇 가지 기본 사항
문명의 시작 이래, 특히 인터넷이 등장한 이후부터 모든 엔티티는 정보와 연관되어 있습니다. 일부 정보는 공개될 수 있지만 일부는 반드시 비밀로 유지해야 합니다. 온라인 계산이 주목받으면서 종종 민감하고 개인 정보를 안전하게 전송하거나 이를 다양한 엔티티에 대해 계산하는 필요성이 발생합니다. 확실히 쉽지 않지만, 안전한 통신의 목표는 잘 정의되고 이해되어 있습니다. 암호화 방식은 데이터 전송을 보호하는 데 중요한 역할을 합니다. 여러 해 동안 효율적인 암호화 기법이 개발되어 안전한 통신 문제를 해결했습니다. 그러나 최근 암호화 커뮤니티는 전송 중인 데이터의 보안뿐만 아니라 그 이상의 문제에 초점을 맞추고 있습니다. 암호학은 여러 해 동안 데이터의 개인 정보 보호 및 해당 데이터에 대한 계산 문제를 해결하기 위해 진화해 왔습니다.
본질적으로, 암호학 분야는 대략적으로 두 가지로 나눌 수 있습니다: 대칭 키 암호학과 공개 키 암호학. 특히 암호화 패러다임에서, 대칭 키 알고리즘은 메시지의 암호화 및 해독에 단일 키를 사용하지만 공개 키 알고리즘은 두 개의 키를 사용합니다: 널리 배포된 공개 키는 메시지를 암호화하는 데 사용되며 해당 소유자에게만 알려진 일치하는 비밀 키는 암호문을 해독하여 기본 메시지를 얻기 위해 사용됩니다. 많은 참여자가 포함된 통신의 경우, 대칭 키 기반 방법은 각 쌍 사이에 키를 교환해야 하므로 공개 키 기반 접근 방식이 더 타당해 보입니다.
본 절에서는 안전한 계산을 위한 우리의 암호화 프로토콜 구성에 필요한 기본 요소들을 설명합니다. 우리는 모든 참여자 간의 통신을 위해 인증된 채널이 사용 가능하다고 가정합니다.
공개 키 암호화: 공개 키 암호화 방식은 (Gen, Enc, Dec)라는 확률적 다항 시간 알고리즘 튜플로 정의됩니다.
-
Gen: ($`pk`$, $`sk`$) $`\leftarrow`$ Gen$`(1^\kappa)`$. 키 생성 알고리즘 Gen은 보안 매개변수 $`\kappa`$를 입력으로 받아 키 쌍($`pk`$, $`sk`$)을 생성합니다. 여기서 $`pk`$는 공개 키이며 $`sk`$는 비밀 키입니다. 이는 무작위화된 알고리즘입니다.
-
Enc: $`c`$ $`\leftarrow`$ Enc$`(m,pk)`$. 암호화 알고리즘 Enc은 메시지 $`m \in \mathcal{M}`$, 여기서 $`\mathcal{M}`$는 메시지 공간이며 공개 키 $`pk`$를 입력으로 받아 암호문 $`c \in \mathcal{C}`$, 여기서 $`\mathcal{C}`$는 암호문 공간을 생성합니다. 이 또한 무작위화된 알고리즘입니다.
-
Dec: $`m`$ $`\leftarrow`$ Dec$`(c,sk)`$. 해독 알고리즘 Dec은 암호문 $`c \in \mathcal{C}`$, 여기서 $`\mathcal{C}`$는 암호문 공간이며 비밀 키 $`sk`$를 입력으로 받아 원본 메시지 $`m \in \mathcal{M}`$을 생성합니다.
반복 게임
이전에 본 것처럼, 프리즈너 딜레마 게임에서 에이전트들은 자신의 수익을 최대화하려고 하여 결국 효용상 비효율적인 결과를 도출하게 됩니다. 자기 이익(또는 합리적 선택)으로 고백하지 않는 것을 막을 방법이 없기 때문에 그들은 그렇게 행동합니다. 전략형 게임은 결정의 결과와 위협에 대한 처벌을 반영하지 않으며, 이를 가능하게 하려면 중복 게임을 연구해야 합니다.
$`\Gamma = `$는 전략형 게임이라고 합시다. $`T`$-기간 반복 게임은 완벽한 정보와 동시에 이동하는 확장 게임에서 다음과 같습니다:
- $`N`$은 플레이어 집합입니다.
- 기말 경로의 집합은 게임 $`\Gamma`$의 행동 프로파일 시퀀스 집합인 ($`(s^1,s^2,\cdots,\, s^T)`$)입니다.
- $`P`$는 모든 역사 $`(s^1,s^2,\cdots,\, s^t)`$에 대해 모든 플레이어 세트를 할당합니다.
- 각 역사 이후 플레이어 $`i`$에게 제공되는 행동 집합은 $`S_i`$입니다.
- 각 플레이어 $`i`$는 기말 경로 ($`(s^1,s^2,\cdots,\, s^T)`$)에 따라 할인 합계 ($`\sum _{t=1}^T \delta ^{t-1}u_i(a^t)`$)를 평가합니다.
무한 반복 게임: $`\Gamma`$의 무한 반복 게임은 기말 경로 집합이 ($`(s^1,s^2,\cdots )`$)이고 각 플레이어 $`i`$의 기말 경로($`(s^1,s^2,\cdots )`$)에 대한 유틸리티가 할인 합계 ($`\sum _{t=1}^\infty \delta ^{t-1}u_i(a^t)`$)입니다.
반복 게임에서는 한 플레이어가 한 라운드에서 협력하지 않으면 다른 플레이어들이 미래의 라운드에서 처벌을 받게 될 수 있습니다. 프리즈너 딜레마 사례에서, 양 플레이어 모두에게 이익이 되는 것은 서로 고백하지 않는 것입니다. 어떤 전략을 선택하든 상대방이 고백하는 경우 더 나빠지기 때문에 두 플레이어들은 서로 협력하지 않겠다고 합의하고, 한 플레이어가 라운드에서 고백하면 다른 플레이어는 미래의 라운드에서 처벌로 고백할 것입니다.
보통 세 가지 종류의 반복 게임에서 처벌 전략을 연구합니다:
- grim trigger: grim trigger 전략에서는 한 플레이어가 한 라운드에서 협력하지 않으면 모든 다른 플레이어는 미래의 모든 라운드에서 흉내를 내지 않는 플레이어를 처벌할 것입니다.
- tit for tat: tit for tat에서는 한 플레이어가 한 라운드에서 협력하지 않으면 다음 라운드에 처벌을 받게 됩니다.
- 제한된 처벌: 제한된 처벌에서는 한 플레이어가 한 라운드에서 협력하지 않으면 다른 플레이어들로부터 $`k`$ 라운드 동안 처벌을 받아야 합니다.
프리즈너 딜레마의 반복 게임에서 grim trigger/tit for tat/제한된 처벌을 따르는 것이 네이시 밸런스를 형성할 수 있음을 보여줄 수 있습니다. 이러한 처벌 전략이 존재하는 경우, 실제로 협력하는 것이 네이시 밸런스가 되는지 여부는 에이전트의 할인 요인이 결정합니다. 에이전트의 할인 요인은 그들의 인내심을 나타냅니다. 이는 에이전트들이 단기적인 이익을 위해 배신하거나 장기적인 협력을 선택할지를 결정합니다.
이 글은 ArXiv의 공개 자료를 바탕으로 AI가 자동 번역 및 요약한 내용입니다.
저작권은 원저자에게 있으며, 인류 지식 발전에 기여한 연구자분들께 감사드립니다.