Computer Science / Multiagent Systems

'Computer Science / Multiagent Systems' 카테고리의 모든 글

총 9개의 글
시간순 정렬
지능형 지식 분배  리소스 인식 다중 에이전트 통신을 위한 제약 행동 POMDPs

지능형 지식 분배 리소스 인식 다중 에이전트 통신을 위한 제약 행동 POMDPs

이 논문은 다중 에이전트 지식 분배의 기본적인 문제를 다룹니다. 각 에이전트에게 제한된 자원이 있을 때 어떤 정보가 누구에게 언제 전송되어야 하는지에 대한 문제입니다. 다중 에이전트 시스템의 통신 요구사항은 정확한 환경 상태와 다른 에이전트들의 상태를 유지해야 할 때 매우 높을 수 있습니다. 네트워크 시스템, 예를 들어 전력과 대역폭에 미치는 다중 에이전트 조정의 영향을 줄이기 위해 이 논문은 부분적으로 관찰 가능한 마코프 결정 과정(POMDPs)에 두 가지 개념을 도입합니다 1) 액션 기반 제약조건으로 인해 제약된 액션 POMDPs(CA-POMDPs); 및 2) 결과 무한 수평 컨트롤러의 부드러운 확률적 제약 조건 충족. 무한 수평 분석을 가능하게 하기 위해 먼저 제약이 없는 정책은 유한 상태 컨트롤러(FSC)로 표현되고 정책 반복으로 최적화됩니다. FSC 표현을 통해 마코프 체인 몬테카를로와 이산 최적화의 조합을 사용하여 제어기의 확률적 제약 조건 충족을 개선하고 가치 함수에 미치는 영향을 최소화할 수 있습니다. CA-POMDP 프레임워크 내에서 우리는 에이전트 간 지식 분배를 위한 제약 조건 하에서 각 에이전트의 정책을 제공하는 지능형 지식 분배(IKD)를 제안합니다. 마지막으로, CA-POMDP 및 IKD 개념은 여러 무인 항공기(UAVs)가 이질적인 센서로 협력하여 재난 지역에서 보이지 않는 장애물을 피하기 위해 지상 자산을 정위화하는 자산 추적 문제를 사용하여 검증됩니다. IKD 모델은 다중 에이전트 통신을 통해 자산 추적을 유지하면서 소프트 전력 및 대역폭 제약 조건을 3%만 위반했지만, 그리디와 나이브 접근법은 제약 조건을 60% 이상 위반했습니다.

paper AI 요약
대규모 교통 신호 제어를 위한 새로운 다중 에이전트 강화 학습 방법 연구

대규모 교통 신호 제어를 위한 새로운 다중 에이전트 강화 학습 방법 연구

대규모 교통 신호 제어(TSC) 문제에서 최적의 신호 타이밍 전략을 찾는 것은 어려운 과제이다. 다중 에이전트 강화 학습(MARL)은 이 문제를 해결하는 유망한 방법으로 꼽힌다. 그러나 대규모 문제로 확장하고 각 개별 에이전트의 다른 에이전트들의 행동을 모델링하는 데 여전히 개선의 여지가 있다. 본 논문에서는 새로운 MARL, 즉 협력적 이중 Q-학습(Co-DQL)을 제안한다. Co-DQL은 몇 가지 주목할 만한 특징이 있다. 이는 이중 추정기와 UCB 정책을 기반으로 하는 매우 확장 가능한 독립 이중 Q-학습 방법을 사용하여 전통적인 독립 Q-학습에 존재하는 과도한 추정 문제를 제거하면서 탐사를 보장한다. 또한 에이전트 간의 상호작용을 모델링하기 위해 평균 필드 근사법을 사용하여 에이전트가 더 나은 협력 전략을 학습하도록 한다. 학습 과정의 안정성과 견고성을 향상시키기 위해 새로운 보상 할당 메커니즘과 지역 상태 공유 방법을 도입한다. 또한 제안된 알고리즘의 수렴 특성을 분석한다. Co-DQL은 TSC에 적용되고 여러 교통 신호 시뮬레이터에서 테스트된다. 몇 가지 교통 상황에서 얻어진 결과에 따르면, Co-DQL이 여러 최신 분산형 MARL 알고리즘을 능가한다. 전체 도로 시스템 내의 차량들의 평균 대기 시간을 효과적으로 단축할 수 있다.

paper AI 요약
모바일 엣지 클라우드에서 리소스 공유를 위한 게임 이론적 프레임워크  함께 나눠보자

모바일 엣지 클라우드에서 리소스 공유를 위한 게임 이론적 프레임워크 함께 나눠보자

이 논문은 모바일 에지 컴퓨팅을 통해 다양한 지연 민감도가 있는 애플리케이션에 자원을 제공하는 것을 목표로 합니다. 이는 어려운 문제입니다. 왜냐하면, 에지 클라우드 서비스 제공자는 모든 요청된 자원을 충족할 수 있을 만큼의 충분한 자원을 보유하지 못할 수도 있기 때문입니다. 또한, 다양한 애플리케이션에 있는 사용 가능한 자원을 최적화하는 것도 어렵습니다. 다른 에지 클라우드 서비스 제공자들 간의 자원 공유는 위와 같은 한계를 해결할 수 있습니다. 특정 서비스 제공자는 다른 서비스 제공자가 빌릴 수 있는 자원을 보유하고 있을 수 있기 때문입니다. 그러나, 에지 클라우드 서비스 제공자는 서로 다른 목표나 *이용성*을 가질 수 있습니다. 따라서, 각 서비스 제공자의 다양한 목적을 고려하여 효율적이고 효과적인 자원 공유 메커니즘이 필요합니다. 우리는 이 문제를 다목적 최적화 문제로 모델링하고 *협력 게임 이론*(CGT)에 기반한 해결 프레임워크를 제시합니다. 각 서비스 제공자가 먼저 자체 애플리케이션에 자원을 할당한 후, 나머지 자원을 다른 서비스 제공자들의 애플리케이션과 공유하는 전략을 고려하였습니다. 우리는 단조 증가하는 이용성 함수에 대해 게임이 캐논이고 볼록하다는 것을 입증하였습니다. 따라서, *코어*는 빈 집합이 아니며, 그랜드 컨소시엄은 안정적입니다. 또한, 우리가 제안한 두 가지 알고리즘인 *게임 이론 기반 파레토 최적 할당*(GPOA)과 *폴리안드리-폴리가모스 매칭 기반 파레토 최적 할당*(PPMPOA)은 코어에서 할당을 제공합니다. 따라서, 얻어진 할당은 *파레토* 최적이고 모든 서비스 제공자들이 참여하는 그랜드 컨소시엄은 안정적입니다. 실험 결과는 제안한 자원 공유 프레임워크가 에지 클라우드 서비스 제공자의 이용성을 향상시키고 애플리케이션 요청 충족을 개선한다는 것을 확인하였습니다.

paper AI 요약
드론 동역학 레이더 네트워크  연합 항법 및 추적 방법

드론 동역학 레이더 네트워크 연합 항법 및 추적 방법

최근에는 소형 비행 로봇에 자동 감지와 실시간 내비게이션 기능을 부여하는 연구가 증가하고 있습니다. 이는 원격 감시, 물류, 스마트 도시 및 위험 환경에서의 긴급 지원 등 다양한 응용 분야를 가능하게 합니다. 이러한 맥락에서, 건물 뒤에 숨거나 대규모 드론 네트워크 내에서 숨어 있는 비인가 소형 무인 항공기(UAV) 추적을 하는 문제가 새롭게 제기되고 있습니다. 현재의 주로 정적인 지상 레이더 기반 솔루션과는 달리, 본 논문은 실시간 및 고정밀도로 악의적인 대상을 추적하기 위한 동적 레이더 네트워크 드론을 제안합니다. 이를 위해, 우리는 이질적으로 수집된 정보를 활용하여 드론의 실시간 내비게이션 솔루션을 설명합니다. 이러한 정보는 드론들이 멀티홉을 통해 서로 공유하며, 각 에이전트에서 작동하는 로컬 베이지안 추정기를 통해 대상을 추적할 수 있습니다. 모든 경로가 정보 수집 측면에서 동일하지 않기 때문에, 드론들은 UAV의 운동학 및 충돌 방지 제약 조건 하에서 대상 상태의 후방 공분산 행렬을 최소화하는 경로를 계획합니다. 우리의 결과는 동적 레이더 네트워크가 고정형 구성보다 더 나은 위치 결정 결과를 얻고, 드론에 장착된 센서 기술이 다양한 레이다 교차면을 가진 대상을 추적하는 정확도에 어떻게 영향을 미치는지 특히 비시야(NLOS) 상황에서 보여줍니다.

paper AI 요약
No Image

전력 네트워크에서의 피어투피어 거래 개요

피어-투-피 거래는 경제적으로 주도적인 소비자(프로SUMER)가 에너지를 상품과 서비스로 거래하는 미래 지향적인 에너지 관리 기법입니다. 동시에, 피어-투-피 에너지 거래는 피크 수요를 줄이고 예비 용량 요구를 낮추며 네트워크 손실을 감소시켜 전력망에 도움이 될 것으로 기대됩니다. 그러나 전력망에서 대규모로 피어-투-피 거래를 배포하는 것은 가상 및 물리 계층의 거래를 모델링하기 위한 여러 가지 과제를 제기합니다. 따라서 이 논문은 피어-투-피 에너지 거래 기술에 대한 최신 연구의 포괄적인 검토를 제공하며, 이를 통해 피어-투-피 거래의 주요 특징과 전력망 및 프로SUMER에게 중요한 혜택을 개괄합니다. 그런 다음 우리는 가상 및 물리 계층에서 연구가 해결하려는 과제에 따라 기존 연구를 체계적으로 분류하고, 피어-투-피 거래의 문제를 해결하기 위해 널리 사용된 기술적 접근법들을 식별하고 논의합니다. 마지막으로, 이 논문은 잠재적인 미래 연구 방향을 제시하며 마무리됩니다.

paper AI 요약
다중 에이전트 강화학습에서의 이질성

다중 에이전트 강화학습에서의 이질성

다양성은 다중 에이전트 강화학습(MARL)의 기본적인 속성으로, 에이전트 간의 기능적 차이뿐만 아니라 정책 다양성과 환경 상호작용에도 밀접하게 관련되어 있습니다. 그러나 MARL 분야에서는 아직도 다양성을 엄격히 정의하고 깊게 이해하는 데 부족한 상태입니다. 본 논문은 에이전트 수준의 모델링을 기반으로 다양성의 정의, 측정 및 활용 방법에 대해 체계적으로 다룹니다. 먼저, 본 연구는 다양한 종류의 다양성을 분류하고 수학적인 정의를 제공합니다. 두 번째로, 다양성 거리라는 개념을 제시하고 실제 측정 방법을 제안합니다. 세 번째로, 우리의 방법론을 적용하는 예제로서 다양성 기반 다중 에이전트 동적 파라미터 공유 알고리즘을 설계합니다. 사례 연구를 통해 다양한 종류의 에이전트 다양성을 효과적으로 식별하고 측정할 수 있음을 보여주며, 실험 결과는 제안된 알고리즘이 다른 파라미터 공유 기반 라인에 비해 해석성이 더 뛰어나고 적응력이 강함을 확인합니다. 본 연구 방법론은 MARL 커뮤니티가 다양성에 대해 더 포괄적이고 깊게 이해할 수 있게 하며, 실용적인 알고리즘 개발을 더욱 촉진시킬 것입니다.

paper AI 요약
AI 사회의 독성 채택 검사  Chirper.ai를 통한 해악 분석

AI 사회의 독성 채택 검사 Chirper.ai를 통한 해악 분석

사회 봇이 온라인 플랫폼에서 정보 확산, 참여 동태, 공론에 큰 영향을 미쳐 왔지만, 대형 언어 모델(LLMs)은 이전 세대보다 훨씬 복잡하고 자연스러운 상호작용을 가능하게 하는 새로운 사회 봇을 구현했습니다. LLM 기반 에이전트의 행동은 오프라인에서 시뮬레이션된 사회 환경을 통해 검증되었으며, 이는 인간과 유사한 네트워크 구조와 집단 현상에 대한 연구를 가능하게 했습니다. 그러나 이러한 에이전트들은 독해나 해로운 콘텐츠 생성의 위험성을 내포하고 있습니다. 본 논문에서는 Chirper.ai라는 AI 기반 소셜 네트워크 플랫폼을 통해 LLM 에이전트들의 독해 유발 메커니즘에 대한 대규모 실험적 평가를 수행합니다.

paper AI 요약
ARIES  실시간 역학 감시 및 발생 모니터링을 위한 확장형 다중 에이전트 조정 프레임워크

ARIES 실시간 역학 감시 및 발생 모니터링을 위한 확장형 다중 에이전트 조정 프레임워크

세계 건강 감시는 현재 지식 격차라는 도전에 직면해 있습니다. 일반적인 목적으로 사용되는 인공지능이 확산되었지만, 만성적 환영 현상과 전문 데이터 시ilos를 탐색하는 능력 부족으로 인해 여전히 고스테이크 역학 분야에는 적합하지 않습니다. 본 논문은 ARIES(Agentic Retrieval Intelligence for Epidemiological Surveillance)라는 특화된 자율적 다중 에이전트 프레임워크를 소개합니다. 이 프레임워크는 정적인 질병별 대시보드에서 벗어나 동적인 지능 생태계로 나아가도록 설계되었습니다. 계층형 명령 구조 위에 작성된 ARIES는 GPTs를 활용해 WHO(World Health Organization), CDC(Center for Disease Control and Prevention) 및 피어 리뷰 연구 논문을 자동으로 조회할 수 있는 확장 가능한 서브 에이전트 스와rm을 조정합니다. 감시 데이터의 추출과 논리적 종합을 자동화함으로써 ARIES는 신흥 위협과 신호 발산을 실시간에 가깝게 식별하는 특화된 사고를 제공합니다. 이 모듈형 아키텍처는 특정 작업을 수행하는 에이전트 스와rm이 일반적인 모델보다 우수하다는 것을 입증하며, 다음 세대의 발생 대응 및 글로벌 건강 지능에 강력하고 확장 가능한 솔루션을 제공합니다.

paper AI 요약
다중 에이전트 AI에 인간의 반공모 메커니즘 매핑

다중 에이전트 AI에 인간의 반공모 메커니즘 매핑

다중 에이전트 AI 시스템이 점점 더 자율성을 띠면서, 이들이 인간 시장과 기관에서 오랜 시간 동안 관찰되어온 공모 전략을 개발할 수 있다는 증거가 나타나고 있습니다. 인간 영역에서는 세기동안의 반공모 메커니즘이 축적되어 있지만, 이러한 메커니즘들을 AI 환경에 어떻게 적용할 수 있는지 여전히 명확하지 않습니다. 이 논문은 (i) 제재, 관대주의 및 고발, 감시와 심사, 시장 설계, 그리고 통치를 포함한 인간의 반공모 메커니즘의 분류 개발과 (ii) 이러한 메커니즘들을 다중 에이전트 AI 시스템에 대한 잠재적 개입으로 매핑하는 문제점을 해결하고자 합니다. 각 메커니즘에 대해 구현 방법을 제안합니다. 또한, 특정 에이전트에게 일어난 조정을 귀속시키는 어려움, 에이전트의 쉽게 분할 또는 수정 가능성, 협력과 공모를 구분하는 문제, 그리고 적응적 감지 회피 학습 등 열린 과제들을 강조하고 있습니다.

paper AI 요약

< 분야별 논문 현황 (Total: 566) >

Quantum Physics
5

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키