Statistics / Machine Learning

'Statistics / Machine Learning' 카테고리의 모든 글

총 9개의 글
시간순 정렬
무한히 넓은 신경망에서의 정확한 계산에 관하여

무한히 넓은 신경망에서의 정확한 계산에 관하여

본 논문은 신경망을 훈련하는 동안 가중치 행렬이 초기화된 상태에서 크게 변하지 않는다는 것을 보여줍니다. 또한, 이 가중치의 작은 변화에도 불구하고 신경망은 여전히 빠른 수렴 속도를 유지한다는 사실을 입증합니다. 이러한 결과는 네트워크가 훈련 중에 원래 구조와 비슷하게 유지됨을 의미하며, 이를 통해 초기화된 가중치 행렬이 최적의 해에 근접하도록 훈련하는 것이 가능함을 시사합니다. ###

paper AI 요약
해석 가능성에서 추론까지  보편적 근사기의 추정 프레임워크

해석 가능성에서 추론까지 보편적 근사기의 추정 프레임워크

우리는 보편적 근사기의 넓은 범주에서 추정과 추론을 위한 새로운 프레임워크를 제시합니다. 추정은 모델 예측값을 Shapley 값으로 분해하는 것을 기반으로 합니다. 추론은 개별 Shapley 구성 요소의 편향 및 분산 특성을 분석함으로써 이루어집니다. 우리는 Shapley 값 추정이 점근적으로 편향되지 않음을 보여주며, 잡음만 있는 데이터에서 진짜 데이터 생성 과정을 파악하기 위한 도구로 Shapley 회귀를 소개합니다. 모델이 매개변수에 대해 선형일 경우, 잘 알려진 선형 회귀의 경우에는 이 프레임워크의 특별한 사례입니다. 우리는 이 연구에서 이질적인 처리 효과 추정을 안내 예제로 하여 이론적, 수치적, 실증적 결과를 제시합니다.

paper AI 요약
통신 효율적인 연방 딥러닝  비동기 모델 업데이트와 시간 가중치 결합 기법

통신 효율적인 연방 딥러닝 비동기 모델 업데이트와 시간 가중치 결합 기법

연방 학습(federated learning)은 클라이언트에서 로컬로 훈련된 모델을 집계하여 서버에 중앙 모델을 얻습니다. 결과적으로, 연방 학습은 클라이언트가 데이터를 서버에 업로드할 필요가 없기 때문에 클라이언트의 데이터 프라이버시를 보호합니다. 연방 학습에서의 한 가지 과제는 끝 장치가 일반적으로 매우 제한적인 통신 대역폭을 가지고 있기 때문에 클라이언트-서버 간의 통신량을 줄이는 것입니다. 이 논문은 서버에서 로컬 모델들의 시간 가중 합성(temporally weighted aggregation)을 사용하는 동기화된 학습 전략을 제안함으로써 강화된 연방 학습 기술을 제시합니다. 비동기 학습 전략에서는 깊은 신경망의 다양한 층이 얕은 층과 깊은 층으로 분류되며, 깊은 층의 매개변수는 얕은 층에 비해 덜 자주 업데이트됩니다. 또한 서버에서는 이전에 훈련된 로컬 모델을 활용하는 시간 가중 합성 전략이 도입되어 중앙 모델의 정확도와 수렴성을 강화합니다. 제안된 알고리즘은 두 가지 데이터셋과 다양한 깊은 신경망에서 경험적으로 평가되었습니다. 우리의 결과는 비동기 연방 딥 러닝이 통신 비용과 모델 정확성 측면에서 기준 알고리즘보다 우수하다는 것을 보여줍니다.

paper AI 요약
토마스 샘플링을 이용한 공급측 플랫폼의 헤더 비딩 전략 최적화

토마스 샘플링을 이용한 공급측 플랫폼의 헤더 비딩 전략 최적화

지난 10년 동안 디지털 미디어(웹 또는 앱 출판자)는 실시간 광고 경매를 사용하여 광고 공간을 판매하는 것을 일반화했습니다. 여러 경매 플랫폼인 공급 측면 플랫폼(SSP)이 생성되었습니다. 이러한 다수성으로 인해 출판자는 SSP들 간의 경쟁을 만들기 시작했습니다. 이 설정에서는 두 가지 연속적인 경매가 진행됩니다 각 SSP에서 제2 가격 경매와 SSP들 사이에서 이루어지는 제1 가격 경매인 헤더 입찰 경매입니다. 본 논문에서는 다른 SSP들과 경쟁하는 하나의 SSP를 고려합니다. 이 SSP는 광고주가 광고 공간을 구매하고자 할 때 중개자의 역할을 하며, 출판자가 광고 공간을 판매하길 원할 때도 마찬가지입니다. 그리고 광고주의 요구에 맞게 최대한 많은 광고를 전달하면서 최소한의 비용으로 경매에 참여하기 위한 입찰 전략을 정의해야 합니다. 이 SSP의 수익 최적화는 컨텍스트 밴딧 문제로 표현될 수 있으며, 컨텍스트에는 광고 기회에 대한 정보가 포함됩니다. 예를 들어 인터넷 사용자 또는 광고 배치 속성과 같은 정보입니다. 클래식한 다중 팔레트 밴딧 전략(UCB와 EXP3의 원본 버전을 포함)은 이 설정에서 효과적이지 않으며, 수렴 속도가 낮습니다. 본 논문에서는 이러한 상관관계를 쉽게 고려할 수 있는 Thompson Sampling 알고리즘의 변형을 설계하고 실험합니다. 이 베이지안 알고리즘과 입자 필터를 결합하여 비정상성을 다룰 수 있습니다. 이를 통해 경매에서 승리하기 위해 극대화해야 하는 최고 입찰 가격의 분포를 순차적으로 추정할 수 있습니다. 우리는 이 방법론을 두 개의 실제 경매 데이터셋에 적용하고, 더 전통적인 접근법보다 크게 우수함을 보여줍니다. 본 논문에서 정의된 전략은 전 세계 수천 명의 출판자에게 배포될 계획입니다.

paper AI 요약
대규모 교통 신호 제어를 위한 새로운 다중 에이전트 강화 학습 방법 연구

대규모 교통 신호 제어를 위한 새로운 다중 에이전트 강화 학습 방법 연구

대규모 교통 신호 제어(TSC) 문제에서 최적의 신호 타이밍 전략을 찾는 것은 어려운 과제이다. 다중 에이전트 강화 학습(MARL)은 이 문제를 해결하는 유망한 방법으로 꼽힌다. 그러나 대규모 문제로 확장하고 각 개별 에이전트의 다른 에이전트들의 행동을 모델링하는 데 여전히 개선의 여지가 있다. 본 논문에서는 새로운 MARL, 즉 협력적 이중 Q-학습(Co-DQL)을 제안한다. Co-DQL은 몇 가지 주목할 만한 특징이 있다. 이는 이중 추정기와 UCB 정책을 기반으로 하는 매우 확장 가능한 독립 이중 Q-학습 방법을 사용하여 전통적인 독립 Q-학습에 존재하는 과도한 추정 문제를 제거하면서 탐사를 보장한다. 또한 에이전트 간의 상호작용을 모델링하기 위해 평균 필드 근사법을 사용하여 에이전트가 더 나은 협력 전략을 학습하도록 한다. 학습 과정의 안정성과 견고성을 향상시키기 위해 새로운 보상 할당 메커니즘과 지역 상태 공유 방법을 도입한다. 또한 제안된 알고리즘의 수렴 특성을 분석한다. Co-DQL은 TSC에 적용되고 여러 교통 신호 시뮬레이터에서 테스트된다. 몇 가지 교통 상황에서 얻어진 결과에 따르면, Co-DQL이 여러 최신 분산형 MARL 알고리즘을 능가한다. 전체 도로 시스템 내의 차량들의 평균 대기 시간을 효과적으로 단축할 수 있다.

paper AI 요약
No Image

인터넷-of-Things을 위한 분산 딥 컨볼루션 뉴럴 네트워크

사물인터넷(IoT) 단위의 메모리와 계산에 대한 심각한 제약은 일반적으로 대규모 메모리와 높은 처리 부하를 요구하는 딥러닝(DL)-기반 솔루션의 실행을 방해할 수 있습니다. 고려된 DL 모델의 실시간 실행을 지원하기 위해서는 IoT 단위에 대한 메모리 및 처리 능력 제약 조건을 염두에 두고 디자인되어야 합니다. 본 논문에서는 분산형 IoT 애플리케이션에서 컨볼루셔널 신경망(CNNs)의 실행을 할당하는 방법론을 소개합니다. 이러한 방법론은 데이터 수집 단계와 그 이후의 의사결정 단계 사이의 지연 시간을 최소화하면서 주어진 메모리 및 처리 부하 제약 조건 내에서 최적화 문제로 정식화됩니다. 이 방법론은 동일한 IoT 시스템에서 여러 소스의 데이터뿐만 아니라 여러 개의 CNNs를 실행하는 것을 지원하여 자율성, 낮은 의사결정 지연 시간, 높은 서비스 품질을 요구하는 CNN 기반 애플리케이션을 설계할 수 있습니다.

paper AI 요약
분산식 확률적 최적화와 그래디언트 추적 소개

분산식 확률적 최적화와 그래디언트 추적 소개

분산된 합 최소화에 대한 분산 해법은 많은 신호 처리, 제어 및 머신 러닝 애플리케이션에서 중요한 역할을 합니다. 이러한 환경에서는 데이터가 임의로 연결된 노드 네트워크에 분포되어 있으며 통신이나 개인 정보 보호 문제 때문에 원시 데이터 공유가 불가능한 경우가 많습니다. 본 논문에서는 분산 стоха스틱 최적화 방법을 검토하고 최근 개선 사항을 기반으로 그라디언트 추적 및 변동 감소에 초점을 맞추어 부드럽고 강하게 볼록한 목적 함수를 설명합니다. 주요 기술적인 아이디어의 직관적인 설명과 분산 머신 러닝 모델 학습에서 알고리즘의 활용 사례도 제공합니다.

paper AI 요약
아날로그 NVM 크로스바에 배포를 위한 DNN IoT 애플리케이션 훈련

아날로그 NVM 크로스바에 배포를 위한 DNN IoT 애플리케이션 훈련

에너지 효율성, 보안 및 프라이버시에 대한 추세는 최근 딥러닝 네트워크(DNNs)를 마이크로컨트롤러에 배포하는 데 초점을 맞추게 되었습니다. 그러나 계산 및 메모리 자원의 제약으로 인해 이러한 시스템에서 배포 가능한 ML 모델의 크기와 복잡성이 제한됩니다. 저항성 비휘발성 메모리(NVM) 기술을 기반으로 하는 컴퓨테이션-인-메모리(CIM) 아키텍처는 현대 DNN에 내재된 고성능 및 저전력 요구사항을 충족시키는 데 큰 희망을 제공합니다. 그러나 이러한 기술들은 여전히 미숙하고, 본질적인 아날로그 영역 노이즈 문제와 NVM 구조에서 음수 가중치를 표현할 수 없는 문제가 있습니다. 이로 인해 크로스바의 크기가 커지고, ADC와 DAC에 부정적 영향을 미칩니다. 본 논문에서는 이러한 과제들을 해결하기 위한 훈련 프레임워크를 제공하고 회로 수준에서 얻어진 효율성 증가를 정량적으로 평가합니다. 두 가지 기여를 제안합니다 첫째, 개별 DNN 계층의 튜닝을 필요로 하지 않는 훈련 알고리즘으로 각 계층의 가중치와 활성화에 일관성을 보장하여 아날로그 블록 재사용과 주변 하드웨어를 크게 줄입니다. 둘째, NAS 방법론을 사용하여 단극 가중치(모두 양수 또는 모두 음수) 행렬/서브행렬의 사용을 제안합니다. 가중치 단극성은 크로스바 영역을 두 배로 늘릴 필요를 없애고 아날로그 주변 장비를 간소화합니다. CIFAR10과 HAR 애플리케이션에 대한 검증 결과, 4비트 및 2비트 장치를 사용하여 크로스바로 매핑했을 때 95%의 부동소수점 정확도에서 2비트 양수 가중치만으로 92.91%의 정확도를 달성했습니다. 제안된 기법의 조합은 80%의 면적 개선과 최대 45%의 에너지 감소를 가져왔습니다.

paper AI 요약
수요 추정을 넘어  누적 경향 가중치를 통한 소비자 여유 평가

수요 추정을 넘어 누적 경향 가중치를 통한 소비자 여유 평가

이 논문은 관찰 데이터를 활용하여 AI 기반의 결정, 특히 타겟팅 가격 설정과 알고리즘 대출에 대한 소비자 여유 효과를 심사하기 위한 실용적인 프레임워크를 개발합니다. 전통적 접근법에서는 먼저 수요 함수를 추정한 후 이를 통합하여 소비자 여유를 계산하지만, 이러한 방법은 모수적 수요 형태에서의 모형 사양 오류와 유연한 비모수적 또는 기계 학습 접근법에 따른 큰 데이터 요구사항과 느린 수렴으로 인해 실제 적용이 어려울 수 있습니다. 대신 우리는 현대 알고리즘 가격 설정에서 발생하는 탐색과 활용의 균형을 위해 본래 내재된 무작위성을 활용하고, 수요 함수의 명시적 추정 및 수치 적분을 피할 수 있는 추정자를 도입합니다. 무작위 가격에서 관찰된 각 구매 결과는 수요에 대한 편향 없는 추정치이며, 새로운 누적 경향 가중치(CPW)를 사용하여 구매 결과를 세심하게 재가중함으로써 적분을 재구성할 수 있습니다. 이러한 아이디어를 바탕으로 정확히 수요 모델이나 역사적인 가격 책정 정책 분포 중 하나만 올바르게 사양되어 있으면 되는 복수로 견고한 변형인 증강 누적 경향 가중치(ACPW) 추정자를 도입합니다. 또한 이 접근법은 소비자 여유를 추정할 때 기계 학습 방법의 활용을 용이하게 하며, 특히 기계 학습 추정값이 느린 수렴 속도를 보일 때조차도 수요 추정을 포함함으로써 빠른 수렴 속도를 달성합니다. 이러한 추정자는 목표 추정 대상인 소비자 여유가 관찰되지 않는다는 점에서 오프-폴리시 평가 기법의 표준적 응용이 아닙니다. 공평성을 고려하기 위해 이 프레임워크를 부등식 인식 여유 측정으로 확장하여 규제 당국과 기업들이 수익-공정성 트레이드오프를 정량화할 수 있도록 합니다. 마지막으로, 포괄적인 수치 연구를 통해 우리의 방법을 검증합니다.

paper AI 요약

< 분야별 논문 현황 (Total: 566) >

Quantum Physics
5

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키