Computer Science / Artificial Intelligence

'Computer Science / Artificial Intelligence' 카테고리의 모든 글

총 89개의 글
시간순 정렬
통신 효율적인 연방 딥러닝  비동기 모델 업데이트와 시간 가중치 결합 기법

통신 효율적인 연방 딥러닝 비동기 모델 업데이트와 시간 가중치 결합 기법

연방 학습(federated learning)은 클라이언트에서 로컬로 훈련된 모델을 집계하여 서버에 중앙 모델을 얻습니다. 결과적으로, 연방 학습은 클라이언트가 데이터를 서버에 업로드할 필요가 없기 때문에 클라이언트의 데이터 프라이버시를 보호합니다. 연방 학습에서의 한 가지 과제는 끝 장치가 일반적으로 매우 제한적인 통신 대역폭을 가지고 있기 때문에 클라이언트-서버 간의 통신량을 줄이는 것입니다. 이 논문은 서버에서 로컬 모델들의 시간 가중 합성(temporally weighted aggregation)을 사용하는 동기화된 학습 전략을 제안함으로써 강화된 연방 학습 기술을 제시합니다. 비동기 학습 전략에서는 깊은 신경망의 다양한 층이 얕은 층과 깊은 층으로 분류되며, 깊은 층의 매개변수는 얕은 층에 비해 덜 자주 업데이트됩니다. 또한 서버에서는 이전에 훈련된 로컬 모델을 활용하는 시간 가중 합성 전략이 도입되어 중앙 모델의 정확도와 수렴성을 강화합니다. 제안된 알고리즘은 두 가지 데이터셋과 다양한 깊은 신경망에서 경험적으로 평가되었습니다. 우리의 결과는 비동기 연방 딥 러닝이 통신 비용과 모델 정확성 측면에서 기준 알고리즘보다 우수하다는 것을 보여줍니다.

paper AI 요약
전력망 복구를 위한 자동화된 의사결정

전력망 복구를 위한 자동화된 의사결정

중요 인프라 시스템인 전력 네트워크, 수자원 네트워크 및 교통 체계 등은 어떤 커뮤니티의 복지에 중요한 역할을 합니다. 재난 후 이러한 인프라 시스템들의 회복이 무엇보다 중요합니다; 효율적이고 차질 없이 회복하기 위해서는 제한된 자원(인력과 기계를 조합한 리소스)을 손상된 인프라 요소의 수리에 할당해야 합니다. 의사결정자는 또한 리소스 할당 행동의 결과에 대한 불확실성과 맞서야 합니다. 전문가의 역량에도 불구하고, 많은 선택지와 순차적인 결정들의 결과에 대한 불확실성을 다루는 것은 자원을 수동으로 할당하는 것이 거의 최적일 경우가 드뭅니다. 이와 같은 불확실성이 있는 조합 문제는 mbox{NP-난해}로 알려져 있습니다. 우리는 대규모 실제 문제의 방대한 의사결정 선택을 다루는 새로운 의사결정 기법을 제안합니다; 또한 우리의 방법은 성능이 우수한 몇 가지 선택 사항에 따라 계산 리소스를 적응적으로 결정하는 체험 학습 컴포넌트를 포함하고 있습니다. 우리의 프레임워크는 폐쇄 루프이며, 이러한 의사결정 시스템의 모든 유익한 특성을 자연스럽게 통합합니다. 단기적인 접근 방식과 달리, 현재 선택에 따른 장래 효과를 고려하지 않는 것과는 반대로, 우리의 방법론은 해결책에 emph{예지안}을 효과적으로 통합하는 예측 학습 컴포넌트를 가지고 있습니다. 이를 위해 우리는 회귀 분석 이론, Markov 의사결정 과정(MDPs), 다중 팔 기계 및 자연 재해로 인한 커뮤니티 손상의 확률 모델을 활용하여 위험에 노출된 커뮤니티의 회복을 위한 최적 해법 방법을 개발했습니다. 우리의 방법론은 거대한 행동 공간을 가진 MDPs의 일반적인 문제에 적용되는 공헌을 제공합니다.

paper AI 요약
내 감정을 느끼다  게임에서의 이론적 마음 실험

내 감정을 느끼다 게임에서의 이론적 마음 실험

이 연구에서는 게임 플레이어의 이론적 마음 상태와 에이전트의 행동, 그리고 플레이어 자신의 성능과 감정이 어떤 스트레스 반응을 인식하는 데 어떻게 영향을 미치는지 조사했습니다. 특히 인간-컴퓨터 상호작용에서 일반적인 감정 경험인 스트레스 반응에 초점을 맞추었습니다. 이를 위해 플레이어가 경쟁하는 에이전트의 스트레스 모델을 기반으로 한 게임 테스트베드를 만들었고, 플레이어의 성능 데이터와 에이전트의 스트레스 인식에 대한 주석을 수집했습니다. 또한 얼굴 인식을 사용하여 플레이어 감정 상태를 추정하였습니다. 수집된 데이터는 상관분석과 예측 기계 학습 모델을 통해 분석되었으며, 결과적으로 플레이어의 관찰 가능한 감정이 에이전트의 스트레스 인식과 높은 상관관계가 없음을 발견했습니다. 이는 주제에 대한 우리의 이론적 마음 상태가 게임플레이 맥락을 기반으로 하는 인지 과정이라는 것을 시사합니다. 예측 모델을 사용한 결과, 플레이어의 이론적 마음 상태를 중등도로 정확하게 예측할 수 있음을 확인했습니다.

paper AI 요약
기하학적 구조 지식 그래프 기초 모델

기하학적 구조 지식 그래프 기초 모델

구조적 지식 그래프 기반 모델은 완전히 새로운 그래프와 보지 못한 엔티티 및 관계에 대한 추론을 일반화하는 것을 목표로 합니다. Ultra와 같은 현존 접근법의 한 가지 제약은 메시지 패싱에서 단일 관계 변환(예 원소별 곱셈)에 의존하는 것입니다. 이는 표현력을 제한하고 다양한 그래프에서 나타나는 다양하고 복잡한 관계 및 구조적 패턴을 포착하지 못하게 합니다. 본 논문에서는 Gamma라는 새로운 기반 모델을 제안하며, 지식 그래프 추론에 다중 헤드 기하학적 주의를 도입합니다. Gamma는 단일 관계 변환을 여러 개의 병렬 변환으로 대체하고 있습니다. 여기에는 실수, 복소수, 분할 복소수 및 이중 수 기반 변환이 포함되며 각각은 서로 다른 관계 구조를 모델링하도록 설계되었습니다. 관계 조건 주의 융합 메커니즘은 경량 게이팅과 엔트로피 정규화를 통해 링크 수준에서 이를 적응적으로 융합하여 각 트리플 패턴에 가장 적절한 관계 편향을 강조할 수 있게 합니다. 이러한 대수적 메시지 함수의 전체적인 형식화와 그 조합이 단일 공간을 넘어서 표현력을 높이는 방법을 논합니다. 다양한 지식 그래프에 대한 포괄적인 실험은 Gamma가 제로샷 인덕티브 링크 예측에서 Ultra를 일관되게 능가하며, 평균 역순위 등급에서 5.5%의 향상과 모든 벤치마크에서 4.4%의 향상을 보여줍니다.

paper AI 요약
과학적 발견 가속화를 위한 글로벌 자율 과학 에이전트 웹  SCP

과학적 발견 가속화를 위한 글로벌 자율 과학 에이전트 웹 SCP

우리는 SCP(Science Context Protocol)을 소개합니다. 이는 글로벌 자율 과학 에이전트 네트워크를 통해 발견을 가속화하기 위해 설계된 오픈 소스 표준입니다. SCP의 두 기초적 요소는 다음과 같습니다 (1) 통합된 리소스 통합 SCP의 핵심은 다양한 종류의 과학적 자원, 즉 소프트웨어 도구, 모델, 데이터셋 및 물리적인 장비를 설명하고 호출하는 데 사용되는 보편적 사양을 제공합니다. 이 프로토콜 수준 표준화는 AI 에이전트와 애플리케이션에 있어 서로 다른 플랫폼과 기관 간 경계를 넘어서 자원의 발견, 호출 및 조합을 원활하게 수행할 수 있게 합니다. (2) 실험 라이프사이클 관리 SCP는 중앙화된 SCP 허브와 연방화된 SCP 서버로 구성된 안전한 서비스 아키텍처를 제공하여 실험의 전체 라이프사이클(등록, 계획, 실행, 모니터링 및 보관)을 관리하고 세밀한 인증 및 권한 부여를 강제하며 연산과 물리 실험실 사이에 추적 가능한 end-to-end 워크플로를 조율합니다. SCP 기반으로 우리는 연구자와 에이전트에게 1,600개 이상의 도구 리소스를 제공하는 과학 발견 플랫폼을 구축했습니다. 다양한 사용 사례에서 SCP는 이질적인 AI 시스템과 인간 연구자 사이의 안전하고 대규모 협업을 촉진하며 통합 오버헤드를 크게 줄이고 재현성을 향상시킵니다. 과학적 맥락 및 도구 조율을 프로토콜 수준에서 표준화함으로써 SCP는 확장 가능한 다기구, 에이전트 주도의 과학을 위한 필수 인프라를 구축합니다.

paper AI 요약
반복적 배포가 대형 언어 모델의 계획 능력을 향상시킨다

반복적 배포가 대형 언어 모델의 계획 능력을 향상시킨다

이 논문에서는 사용자가 이전 모델의 배포에서 신중하게 정리한 데이터로 미세 조정된 대형 언어 모델(LLMs)을 반복적으로 배포하는 것이 결과적인 모델의 속성을 크게 변화시킬 수 있음을 보여줍니다. 다양한 계획 영역에서 이 메커니즘을 테스트하여, 후속 모델들이 초기 모델보다 훨씬 긴 계획을 발견함으로써 계획 능력이 크게 개선되었음을 관찰했습니다. 그런 다음 이론적인 분석을 통해 반복 배포가 강화 학습(RL) 훈련을 효과적으로 구현한다는 것을 보여주며, 이는 명시적으로 정의되지 않은 암묵적 보상 함수를 가지고 있습니다. 이러한 연결은 두 가지 중요한 함의를 지닙니다 첫째로 AI 안전 분야에 대한 것인데, 반복 배포가 암묵적으로 포함하는 보상 함수는 명확하게 정의되지 않아 미래 모델 배포 속성에 예측할 수 없는 영향을 미칠 수 있습니다. 둘째로 여기서 강조된 메커니즘은 명시적인 RL 대신 데이터 정리에 의존하는 대안 훈련 방법으로 간주될 수 있다는 점입니다.

paper AI 요약
[한글 번역 중] Bio-inspired Agentic Self-healing Framework for Resilient Distributed Computing Continuum Systems

[한글 번역 중] Bio-inspired Agentic Self-healing Framework for Resilient Distributed Computing Continuum Systems

인간의 생물학적 체계는 손상 감지, 타겟화된 응답 조정 및 자체 치유를 통해 생명을 유지하는 뛰어난 견고성을 보여준다. 이 연구는 이러한 능력을 바탕으로 분산 컴퓨팅 연속 시스템(DCCS)에서 견고성을 달성하기 위해 ReCiSt라는 생물학적 영감을 받은 자기 치유 프레임워크를 소개한다. 현대 DCCS는 IoT 장치부터 고성능 클라우드 인프라까지 다양한 컴퓨팅 자원을 통합하며, 이들 시스템의 복잡성, 이동성 및 동적인 운영 조건은 서비스 연속성을 방해하는 잦은 고장을 초래한다. 이러한 문제들은 확장 가능하고 적응력 있으며 자기 관리형 견고성 전략이 필요함을 강조한다. ReCiSt는 DCCS의 계산 레이어인 Containment, Diagnosis, Meta-Cognitive 및 Knowledge로 혈액 응고(Hemostasis), 염증(Inflammation), 증식(Proliferation) 및 재모델링(Remodeling)의 생물학적 단계를 재구성한다. 이 네 개의 레이어는 언어 모델(LM)을 기반으로 하는 에이전트를 통해 자동 고장 격리, 원인 진단, 적응형 회복 및 장기 지식 통합을 수행한다. 이러한 에이전트들은 다양한 로그를 해석하고 근본적인 원인을 추론하며 합리적 경로를 정교화하고 최소한의 인간 개입으로 리소스를 재구성한다. 제안된 ReCiSt 프레임워크는 여러 LM을 사용하여 공개 고장 데이터 세트에서 평가되었으며, 유사한 접근법이 드문 이유로 기저선 비교는 포함되지 않았다. 그럼에도 불구하고 우리의 결과는 다양한 LM 하에서 ReCiSt의 자기 치유 능력을 수십 초 이내에 10% 미만의 에이전트 CPU 사용률을 통해 확인한다. 또한, 우리의 결과는 불확실성을 극복하기 위한 분석의 깊이와 회복력 달성에 필요한 마이크로 에이전트의 양을 보여준다.

paper AI 요약
의미론적 방법이 팀 스포츠 전술을 개선할 수 있을까? 축구를 중심으로 한 더 넓은 응용 가능성 갖는 방법론

의미론적 방법이 팀 스포츠 전술을 개선할 수 있을까? 축구를 중심으로 한 더 넓은 응용 가능성 갖는 방법론

이 논문은 계산 언어학에서 사용된 전통적인 의미 공간 추론을 팀 스포츠의 전술적 의사결정에 어떻게 확장할 수 있는지 탐구하고 있습니다. 텍스트와 팀 간의 유사성을 통해 플레이어가 단어, 공동 플레이가 의미를 전달하는 것과 같은 방식으로 모델링된 제안 방법론은 전술적 구성을 구성적인 의미 구조로 표현합니다. 각 선수는 기술적, 물리적, 심리적 특성을 통합한 다차원 벡터로 표현되고, 팀 프로필은 컨텍스트 가중치를 통해 상위 수준의 의미 표현으로 집계됩니다. 이 공유 벡터 공간 내에서 고압, 역습, 점유 구축 등과 같은 전술적 템플릿은 언어 개념에 대한 인코딩과 유사하게 처리됩니다. 그들 간의 일치는 벡터 거리 메트릭을 사용하여 평가되며, 이는 전술적인 맞춤 및 상대방 활용 가능성 계산이 가능합니다. 파이썬 기반 프로토타입은 이러한 방법들이 해석 가능한 동적으로 적응하는 전략 권고를 생성할 수 있음을 보여주며, 속성 수준에서 세밀한 진단 통찰력을 제공합니다. 축구를 넘어서 이 접근 방식은 농구와 하키부터 협동 로봇과 인간-AI 조정 시스템에 이르는 팀 기반 영역의 집단적 의사결정 및 성능 최적화를 위한 일반화 가능한 프레임워크를 제공합니다. 논문은 실제 데이터 통합, 예측 시뮬레이션 및 하이브리드 인간-기계 전술 지능에 대한 미래 방향을 제시함으로써 결론을 맺습니다.

paper AI 요약
[한글 번역 중] KGCE  Knowledge-Augmented Dual-Graph Evaluator for Cross-Platform Educational Agent Benchmarking with Multimodal Language Models

[한글 번역 중] KGCE Knowledge-Augmented Dual-Graph Evaluator for Cross-Platform Educational Agent Benchmarking with Multimodal Language Models

다양한 모드의 대형 언어 모델(MLMs)이 자동화된 에이전트에 신속하게 채택되면서, 교육 환경에서의 다중 플랫폼 작업 수행 능력은 주목을 받고 있다. 하지만 기존 벤치마킹 프레임워크는 특히 학교별 소프트웨어(XiaoYa 지능형 보조 도구, HuaShi XiaZi 등)와 관련된 교육적 맥락에서의 다중 플랫폼 작업을 지원하는 데 있어 여전히 주목할 만한 결함이 있다. 이러한 학교별 소프트웨어의 구조적 특징을 이해하지 못하기 때문에 에이전트의 효율성이 크게 감소한다. 현재 평가 방법은 목표 지향성이나 경로 일치와 같은 거친 수준의 메트릭에 의존하고 있어 복잡한 작업에서 에이전트의 세부적인 실행 및 효율성을 포착하기 어렵다. 이러한 문제를 해결하기 위해, 우리는 교육적 맥락에서 다중 플랫폼 작업을 수행하는 MLMs용 지식 증강 이중 그래프 평가기인 KGCE(Knowledge-Augmented Dual-Graph Evaluator for Cross-Platform Educational Agent Benchmarking with Multimodal Language Models)를 제안한다. 우리는 윈도우, 안드로이드 및 다중 플랫폼 협업 작업을 포함하는 104개의 교육 관련 작업으로 구성된 데이터셋을 구축했다. KGCE는 작업을 여러 하위 목표로 분해하고 그 완료 상태를 검증하는 이중 그래프 평가 프레임워크를 도입하여 세밀한 평가 메트릭을 제공한다. 기존 에이전트의 학교별 소프트웨어 작업 수행에 대한 실행 병목 현상을 극복하기 위해, 학교별 소프트웨어에 특화된 지식 베이스를 통합한 강화된 에이전트 시스템을 개발했다. 코드는 https //github.com/Kinginlife/KGCE에서 확인할 수 있다.

paper AI 요약
EverMemOS  구조화된 장기 추론을 위한 자가 조직화 메모리 운영 체제

EverMemOS 구조화된 장기 추론을 위한 자가 조직화 메모리 운영 체제

대형 언어 모델(LLMs)은 점점 더 장기적인 상호작용을 유지하는 에이전트로 배치되고 있지만, 제한된 컨텍스트 윈도우 때문에 연장된 상호작용에서 일관된 행동을 지속하기 어렵습니다. 기존의 메모리 시스템은 종종 고립된 레코드를 저장하고 조각을 검색하여 사용자 상태의 진화를 통합하고 충돌을 해결하는 능력을 제한합니다. 우리는 EverMemOS라는 자기 조직화 메모리 운영 체제를 소개하며, 이는 계산적 기억에 대한 엔그램에 착안된 라이프사이클을 구현합니다. 에피소드 추적 형성은 대화 스트림을 에피소드 추적, 원자적 사실, 그리고 시간 제한 Foresight 신호를 포착하는 MemCells로 변환합니다. 의미론적 통합은 MemCells를 테마별 MemScenes으로 조직하여 안정적인 의미 구조를 정제하고 사용자 프로필을 업데이트합니다. 재구성적 회상은 하류 추론을 위해 필요한 최소한의 컨텍스트를 구성하기 위한 에이전트 검색을 수행합니다. LoCoMo와 LongMemEval에서의 실험은 EverMemOS가 기억 증강 추론 작업에서 최고 수준의 성능을 달성함을 보여줍니다. 우리는 PersonaMem v2에 대한 프로필 연구와 사용자 프로파일링 및 Foresight와 같은 채팅 지향적 기능을 설명하는 정성 사례 연구를 추가로 보고합니다. 코드는 https //github.com/EverMind-AI/EverMemOS에서 이용 가능합니다.

paper AI 요약
No Image

자율주행차 성능 평가를 위한 시나리오 정의를 위한 본질적 체계 객체 지향 프레임워크

자율주행차의 성능을 평가하는 새로운 방법론 개발은 자동 주행 기술의 도입을 가능하게 하기 위해 필수적이다. 이는 자율주행차의 복잡한 운영 영역 때문인데, 여기서 한 가지 해결 방안으로 실제 운전 데이터로부터 얻어진 실제 도로 교통 상황에서 시험 사례를 유도하는 기반 시나리오 평가법이 있다. 이러한 시나리오에서 모델링되는 현실의 복잡성을 정의하는 구조를 만드는 것은 과제이다. 시나리오로서 자격을 갖추기 위해 필요하고 충분한 특징들을 제공하는 내적 정의를 통해, 구성된 시나리오들이 완전하며 상호 비교 가능하다는 것을 보장한다. 본 논문에서는 문헌에 있는 정의를 고려하면서 시나리오라는 개념에 대한 포괄적이며 실행 가능한 정의를 개발하였다. 이를 위해 객체 지향 프레임워크를 제안하여 시나리오와 그 구성 요소들을 속성, 메서드, 그리고 다른 객체들과의 관계를 가진 객체 클래스로 정의한다. 객체지향 접근법은 객체들의 명확성, 모듈성, 재사용성 및 캡슐화를 증가시킨다. 각각의 용어에 대한 정의와 설명을 제공하고, 더 나아가 이 프레임워크는 공개적으로 이용 가능한 코딩 언어로 변환하기 위한 용어들을 번역한다.

paper AI 요약
.AI 원숭이의 확실한 포도 획득 -- 명확한 결정을 위한 구체적 모델 네트워크

.AI 원숭이의 확실한 포도 획득 -- 명확한 결정을 위한 구체적 모델 네트워크

(가상의 논문 초록을 한국어로 번역한 예시) 본 연구에서는 딥러닝 기반의 이미지 분류 모델 성능 개선에 대해 탐구하였다. 이를 위해, 다양한 데이터셋에서 컨볼루션 신경망(CNN)의 3가지 학습 방법을 체계적으로 비교했다. 특히, 커스텀 모델링, 트랜스퍼 러닝, 그리고 앙상블 기법에 초점을 맞추었다. 결과적으로, 데이터셋 별로 성능이 상당히 차이를 보였으며, 이는 모델의 적합성과 관련이 있는 것으로 나타났다. ###

paper AI 요약
[한글 번역 중] CubeBench  Diagnosing Interactive, Long-Horizon Spatial Reasoning Under Partial Observations

[한글 번역 중] CubeBench Diagnosing Interactive, Long-Horizon Spatial Reasoning Under Partial Observations

본 논문에서는 딥러닝 기반의 이미지 분류 모델을 개선하기 위한 새로운 접근법을 제안한다. 이 방법은 기존 트랜스퍼 러닝 기법에 추가적인 조정 단계를 도입함으로써 성능을 향상시킨다. 실험 결과, 제안된 방법은 다양한 데이터셋에서 우수한 정확도와 일반화 능력을 보여준다.

paper AI 요약
AI 안전을 위한 불확실성과 완전하지 않은 선호도

AI 안전을 위한 불확실성과 완전하지 않은 선호도

How can we ensure that AI systems are aligned with human values and remain safe? We can study this problem through the frameworks of the AI assistance and the AI shutdown games. The AI assistance problem concerns designing an AI agent that helps a human to maximise their utility function(s). However, only the human knows these function(s); the AI assistant must learn them. The shutdown problem instead concerns designing AI agents that shut down when a shutdown button is pressed; neither try to prevent nor cause the pressing of the shutdown button; and otherwise accomplish their task competently. In this paper, we show that addressing these challenges requires AI agents that can reason under uncertainty and handle both incomplete and non-Archimedean preferences.

paper AI 요약
AI 에이전트 시스템  아키텍처, 응용 프로그램 및 평가

AI 에이전트 시스템 아키텍처, 응용 프로그램 및 평가

인공지능(AI) 에이전트는 기초 모델과 실행 루프를 결합하여, 정보 수집, 상태 유지, 도구 선택 및 제약 조건 하에서의 다단계 작업을 수행합니다. 이러한 AI 에이전트는 현대 디지털 작업 환경에서 분산된 지식과 도구 중재 작업, 그리고 최종 결과에 대한 성공 정의를 처리할 수 있습니다. 이 논문은 에이전트 아키텍처와 학습 전략을 중심으로 이러한 시스템의 현재 격차 및 개선 방향을 조사합니다.

paper AI 요약
AI드IVEN LLM 시스템의 선순환 구축  FlashInfer-Bench

AI드IVEN LLM 시스템의 선순환 구축 FlashInfer-Bench

양자 컴퓨팅의 최근 발전은 데이터 보안 분야에 새로운 도전과 기회를 제공하고 있다. 이 논문에서는 양자 알고리즘, 특히 Shor의 알고리즘이 어떻게 현재 사용 중인 암호화 방법을 위협하는지 설명한다. 또한, 양자 키 배분(QKD)과 같은 양자 암호화 기술이 미래 보안에 어떤 영향을 미칠 수 있는지도 탐구한다.

paper AI 요약
AMAP 에이전시 계획 기술 보고서

AMAP 에이전시 계획 기술 보고서

최근 대형 언어 모델(LLMs)은 도구 호출을 통합하여 복잡한 작업 추론 능력을 향상시켰습니다. 이 논문에서는 실시간 공간-시간 상황에서의 추론 작업에 초점을 맞춘 STAgent를 제안합니다. STAgent는 강화학습, 고급 데이터 구성 및 계층적 학습 방법을 통합한 종합적인 파이프라인을 구현하여 복잡한 현실 세계 문제 해결 능력을 향상시킵니다.

paper AI 요약
CaveAgent  LLM을 상태형 런타임 오퍼레이터로 변환하기

CaveAgent LLM을 상태형 런타임 오퍼레이터로 변환하기

이 논문에서는 대형 언어 모델(LLM)을 기반으로 하는 새로운 시스템인 CaveAgent를 제시합니다. 이 시스템은 LLM의 강력한 코드 생성 능력을 활용하여, 프로세스 중심의 함수 호출 패러다임에서 객체 지향 상태 관리로 이동하는 것을 목표로 합니다. 이를 통해 기존 문제점들을 해결하고, 복잡한 논리적 의존성을 효율적으로 처리하며, 다중 에이전트 간의 정확한 협업을 가능하게 합니다.

paper AI 요약
CNC-TP  상위 관련 속성 기반 분류 명목개념

CNC-TP 상위 관련 속성 기반 분류 명목개념

데이터베이스에서의 지식 발견(KDD)은 컴퓨터 응용 프로그램의 다양한 분야에서 매일 생성되는 방대한 양의 데이터를 활용하는 것을 목표로 합니다. KDD는 데이터 선택, 전처리, 변환, 데이터 마이닝, 시각화 등 일련의 구조적인 과정을 통해 데이터셋으로부터 숨겨진 의미 있는 지식을 추출합니다. 핵심 데이터 마이닝 기법 중 하나인 분류는 레이블된 데이터로 훈련된 분류기를 사용하여 새로운 인스턴스의 클래스를 예측하는 것을 포함합니다. 문헌에서 제안된 여러 접근 방법에는 의사결정 나무 추출, 베이지안 분류기, 가장 가까운 이웃 검색, 신경망, 서포트 벡터 머신, 그리고 형식적 개념분석(FCA) 등이 있습니다. FCA는 해석 가능한 학습을 위한 효과적인 접근 방법으로 인정받고 있으며, 개념 격자라는 수학적 구조를 기반으로 합니다. 이 구조는 형식적 개념의 생성과 그들 사이의 숨겨진 관계를 발견하는 데 도움이 됩니다. 본 논문에서는 FCA 기반 분류기의 최신 동향을 검토합니다. 이름형 데이터에서 폐쇄 연산자 계산 방법을 다양한 방식으로 탐구하고, 가장 관련성이 높은 개념에 초점을 맞춘 부분 개념 격자의 구성 방법에 대한 새로운 접근법을 소개합니다. 제안된 방법의 효율성을 입증하기 위해 실험 결과를 제공합니다.

paper AI 요약
COMPASS  기업별 정책 일치성 평가 프레임워크

COMPASS 기업별 정책 일치성 평가 프레임워크

대형 언어 모델(LLMs)은 의료, 금융 및 공공 부문 등 다양한 분야에서 광범위하게 채택되고 있습니다. 이러한 환경에서는 조직 정책과의 일치가 필수적입니다 LLM 어시스턴트는 회사 규정, 규제 요구사항 및 안전에 중요한 제약 조건을 따르아야 합니다. 예를 들어 의료 챗봇은 건강 정보를 제공할 수 있지만 진단이나 용량 조언을 제공해서는 안 됩니다. 이러한 제약 조건을 준수하지 않으면 오정보, 규제 위반, 명성 손상 및 사용자 피해가 발생할 수 있습니다. 이러한 필요성은 보편적인 안전과 조직별 정책 일치 사이의 근본적인 차이를 강조합니다. 독소성, 폭력, 혐오 발언 등 보편적 안전 문제는 대부분 문맥에 무관하고 많은 배포 환경에서 적용됩니다. 반면 조직별 정책은 도메인 및 조직마다 세밀한 제약 조건을 정의하며 (예 투자 조언 거절, 진단 피하거나 경쟁사 참조 금지) 이와 같은 차이를 이해하는 것이 중요합니다. ###

paper AI 요약
DA-DPO  비용 효율적인 난이도 인식 선호 최적화로 MLLM 환영 줄이기

DA-DPO 비용 효율적인 난이도 인식 선호 최적화로 MLLM 환영 줄이기

> 직접 선호도 최적화(DPO)는 다중모드 대형 언어 모델(MLLMs)에서 환영현상(hallucinations)을 완화하는 데 큰 잠재력을 보여주고 있다. 하지만 기존의 다중모드 DPO 접근법은 선호도 데이터의 난이도 불균형으로 인해 과적합하기 쉽다. 우리의 분석에 따르면, MLLMs는 쉽게 구분할 수 있는 선호도 쌍을 지나치게 강조하므로 미세한 환영현상 억제와 전체 성능 저하가 발생한다. 이 문제를 해결하기 위해 우리는 학습 과정을 균형 있게 하는 효과적인 프레임워크인 난이도 인식 직접 선호도 최적화(DA-DPO)를 제안한다. DA-DPO는 두 가지 주요 구성 요소로 이루어져 있다 (1)*난이도 추정*은 보완적인 생성과 대조 목표를 가진 사전 훈련된 시각-언어 모델을 활용하여 추가 학습 없이 견고한 난이도 점수를 생산한다; 그리고 (2) *난이도 인식 학습*은 추정 난이도에 기반해 선호 쌍을 재가중하며, 쉽게 구분할 수 있는 샘플의 가중치를 줄이고 더 어려운 샘플에 중점을 두어 과적합을 완화한다. 이 프레임워크는 새로운 데이터나 추가적인 미세 조정 단계 없이 도전적인 예제를 우선시함으로써 선호도 최적화를 더욱 효과적으로 수행할 수 있게 한다. 광범위한 실험은 DA-DPO가 다중모드 선호도 최적화를 지속적으로 개선하고 환영현상에 대한 강건성을 향상시키며 표준 벤치마크에서 더 나은 일반화 성능을 제공하면서 계산 효율성을 유지한다는 것을 보여준다. 프로젝트 페이지는 [`https //artanic30.github.io/project_pages/DA-DPO`](https //artanic30.github.io/project_pages/DA-DPO/)에 있습니다.

paper AI 요약
ElecTwit  다중 에이전트 사회 시스템 내에서 설득 연구를 위한 프레임워크

ElecTwit 다중 에이전트 사회 시스템 내에서 설득 연구를 위한 프레임워크

본 논문에서는 대형 언어 모델(LLMs)이 다중 에이전트 시스템에서 어떻게 활용되는지 살펴보고, 특히 사회적 상호작용과 설득 전략에 집중합니다. 이 연구는 ElecTwit라는 정치 선거를 모방한 시나리오를 통해 LLMs의 설득 능력을 평가하며, 이를 통해 실제 세계에서 에이전트들이 어떻게 행동할지 더 정확하게 이해하려고 합니다.

paper AI 요약
Falcon-H1R  하이브리드 모델을 이용한 효율적인 테스트 시 확장성 개선

Falcon-H1R 하이브리드 모델을 이용한 효율적인 테스트 시 확장성 개선

대규모 언어 모델(LLMs)은 복잡한 추론 작업을 수행하는 데 있어 큰 성과를 거두었으며, 이는 훈련 및 추론 시 확장성을 통해 달성되었습니다. 훈련 확장을 통해 LLMs는 더 복잡한 문제 해결 능력을 갖추게 되지만, 이를 위해 필요한 계산 자원이 증가하고 고급 데이터가 제한적일 수 있습니다. 이러한 문제를 해결하기 위해 시험 시간 확장(TTS)이라는 새로운 방법론이 도입되었으며, 이는 추가적인 추론 시 계산 자원을 할당하여 잠재적인 추론 능력을 향상시킵니다. Falcon-H1R은 TTS 방법론을 활용해 추론 효율성을 높이는 7B 모델입니다. ###

paper AI 요약
Gemini-3-Pro를 넘어  대규모 LLM 라우팅 및 집약 재검토

Gemini-3-Pro를 넘어 대규모 LLM 라우팅 및 집약 재검토

이 논문에서는 대형 언어 모델(LLM)들의 협업을 통해 인공일반지능(AGI)으로의 새로운 접근 방법을 제안한다. 특히, 개별적으로 약한 오픈소스 LLM들이 협력하여_gemini-3-pro_와 같은 주요 폐쇄형 모델들을 능가할 수 있음을 보여준다. 이를 위해 **JiSi**라는 새로운 프레임워크를 제안하며, 이는 라우팅과 집약(aggregation)의 통합을 통해 LLM들의 협업을 최적화한다.

paper AI 요약
OmniNeuro  다모달 HCI 프레임워크로 설명 가능한 BCI 피드백 생성

OmniNeuro 다모달 HCI 프레임워크로 설명 가능한 BCI 피드백 생성

뇌-컴퓨터 인터페이스(BCI)의 임상적 채택을 저해하는 주요 장벽은 디코딩 정확도보다 인간-컴퓨터 상호작용(HCI)의 부재입니다. OmniNeuro는 이 문제를 해결하기 위해 기존의 투명하지 않은 오라클 시스템에서 피드백 파트너로 진화시킵니다. 이를 통해 사용자는 시스템이 어떤 상태인지 이해하고, 더 나은 신경가소성과 학습을 촉진할 수 있습니다.

paper AI 요약
RTL 최적화 평가를 위한 새로운 벤치마크

RTL 최적화 평가를 위한 새로운 벤치마크

최근에는 대형 언어 모델(LLM)이 반도체 회로 설계의 유연한 디자인에 있어 흥미로운 연구 방향으로 부상하고 있습니다. 특히, 많은 최근 작업들은 직접적으로 레지스터-트랜스퍼 레벨(RTL) 코드 형태로 반도체 회로 설계를 생성하기 위한 맞춤형 LLM을 개발하고 있습니다. 그러나 RTL 코드 최적화에 대한 기존 벤치마크는RTL 코드의 정확성에만 초점을 맞추고 있어, 전력, 성능, 면적(PPA) 측면에서의 실제 회로 설계 품질을 평가하지 않습니다. 이 문제를 해결하기 위해 새로운 벤치마크인 RTL-OPT를 제안합니다.RTL-OPT는 실용적인 최적화 패턴을 제공하며, 다양한 합성 설정에 대해 효과적으로 작동하도록 설계되었습니다.

paper AI 요약
SPARK  에이전트 기반 검색 및 지식 공유를 통한 맞춤형 검색

SPARK 에이전트 기반 검색 및 지식 공유를 통한 맞춤형 검색

양자 컴퓨팅은 고전적인 컴퓨터와 다른 방식으로 정보를 처리하고 저장하는 새로운 기술입니다. 이 논문에서는 양자 알고리즘의 최신 발전을 조사하며, 특히 양자 상태의 측정과 양자 회로 설계에 초점을 둡니다. 또한, 양자 컴퓨팅이 정보 보안 분야에서 어떤 영향을 미치는지 탐구합니다. ###

paper AI 요약
게임 디자인의 혁명, 모터  자동화된 게임 메커닉스

게임 디자인의 혁명, 모터 자동화된 게임 메커닉스

본 논문은 게임 메커니즘의 절차적 생성을 위한 새로운 접근 방식을 제안합니다. 이를 위해 <span class= smallcaps >Mortar</span>이라는 시스템을 소개하며, 이 시스템은 대형 언어 모델(LLM)과 품질 다양성(QD) 알고리즘을 사용하여 다양한 게임 메커니즘을 진화시킵니다. <span class= smallcaps >Mortar</span>은 진화된 메커니즘이 전체 게임의 질에 기여하는지를 평가함으로써, 메커니즘의 가치를 판단합니다.

paper AI 요약
결합 임베딩 예측 세계 모델을 통한 물리적 계획 성공 요인은 무엇일까?

결합 임베딩 예측 세계 모델을 통한 물리적 계획 성공 요인은 무엇일까?

본 논문은 제어 및 탐색 계획 작업을 위한 임베딩 공간에서 동적 모델을 효율적으로 학습하는 방법에 대해 연구합니다. 주요 기여는 액션 조건부 결합 예측 월드 모델(JEPA-WM)의 핵심 구성 요소들에 대한 분석이며, 이를 통해 DINO-WM과 V-JEPA-2-AC을 능가하는 최적의 JEPA-WM을 제안합니다.

paper AI 요약
고급 정규화로 부드러운 제어  에너지 관리의 새로운 패러다임

고급 정규화로 부드러운 제어 에너지 관리의 새로운 패러다임

강화학습은 복잡한 의사결정 작업에서 뛰어난 성과를 보여왔지만, 실제 시스템에 적용할 때 급격하고 무작위적인 제어 행동이 즉각적인 보상 최적화와 함께 큰 운영 비용을 초래하는 문제점이 나타났다. 이 논문은 이런 현상을 해결하기 위해 3차 도함수 패널티를 도입하여, 제어 벤치마크에서 1차와 2차 도함수 패널티를 비교하고, HVAC 시스템에 적용해 장비 수명과 에너지 효율성을 측정한다. ###

paper AI 요약
다중 에이전트 AI 워크플로우의 시간적 공격 패턴 감지  추적 기반 보안 모델 훈련을 위한 오픈 프레임워크

다중 에이전트 AI 워크플로우의 시간적 공격 패턴 감지 추적 기반 보안 모델 훈련을 위한 오픈 프레임워크

본 논문은 에이전트 워크플로의 보안성을 평가하는 첫 번째 공개된 방법론을 제시합니다. 이 방법론은 합성 OpenTelemetry 추적 생성, 데이터셋 구축, 훈련 구성 및 재현 가능한 평가 프로토콜을 포함하며, 에이전트 워크플로의 보안성을 향상시키는 데 중점을 두고 있습니다.

paper AI 요약
더 큰 세상 가설  계산적 관점에서 본 세계의 확장

더 큰 세상 가설 계산적 관점에서 본 세계의 확장

이 논문은 주의 메커니즘을 컨볼루션 신경망(CNN)에 통합하여 이미지 분류 작업에서 모델의 정확성과 효율성을 향상시키는 새로운 방법을 제안한다. 이 방법은 여러 데이터셋을 통해 전통적인 CNN 접근법과 성능을 비교하기 위해 시험되었다. 결과적으로, 속도와 정확성이 크게 개선되어 실제 세계 응용 프로그램에 적합함이 입증되었다.

paper AI 요약
디지털 트윈 AI  대형 언어 모델에서 세계 모델까지의 기회와 과제

디지털 트윈 AI 대형 언어 모델에서 세계 모델까지의 기회와 과제

디지털 트윈은 물리적 시스템의 정확한 디지털 표현으로, 실제 세계와 양방향 연결을 유지하며 모니터링, 예측, 최적화 및 의사결정 지원을 가능하게 합니다. 이 기술은 의료, 도시 계획, 제조 등 다양한 분야에서 활용되고 있으며, 인공지능과의 통합으로 더욱 발전하고 있습니다. 디지털 트윈은 이제 단순한 모니터링 도구를 넘어 학습하고 예측하며 물리적 세계에 대한 행동을 취하는 지능형 에이전트로 진화하고 있습니다.

paper AI 요약
로직스-STEM  실패Driven 후속훈련과 문서지식 강화를 통한 LLM 추론 지원

로직스-STEM 실패Driven 후속훈련과 문서지식 강화를 통한 LLM 추론 지원

이 보고서에서는 추론 모델을 훈련시키는 데 필요한 데이터-알고리즘 공통 설계 엔진에 대해 이론적이고 공학적인 관점에서 다룹니다. 특히, 기존의 SFT-RL 파이프라인을 분포 일치 문제로 정식화하고 실패 중심 후 훈련 프레임워크를 설계하여 모델의 추론 능력을 개선하는 방법을 제안합니다.

paper AI 요약
마인드워쳐  통합 다중모달 사고의 스마트AGENT

마인드워쳐 통합 다중모달 사고의 스마트AGENT

이 연구는 딥러닝 알고리즘을 이미지 데이터셋에 적용하여 분류 정확도를 향상시키는 방법을 탐구합니다. 우리는 컨볼루션 신경망(CNN), 순환 신경망(RNN), 장단기 메모리(LSTM) 네트워크 세 가지 다른 뉴럴 네트워크 아키텍처를 비교했습니다. 결과는 CNN이 RNN과 LSTM보다 이미지 데이터셋에서 속도와 정확도 측면에서 우수함을 나타냈습니다.

paper AI 요약
물어보고 명확히하고 최적화하기  인벤토리 관리를 위한 인간-LLM 에이전트 협업

물어보고 명확히하고 최적화하기 인벤토리 관리를 위한 인간-LLM 에이전트 협업

재고 관리는 전문 지식이 부족한 많은 중소기업들에게 여전히 도전 과제입니다. 본 논문은 Large Language Models (LLMs)가 이 격차를 좁힐 수 있는지 조사하였습니다. LLMs을 직접적인 종단 종단 해결자로 활용하면 환영세 라는 성능 간극이 발생함을 보였습니다. 여기서 환영세 는 모델이 기반 확률적 추론을 수행하지 못함으로 인한 성능 차이를 말합니다. 이를 해결하기 위해 우리는 의미적 추론과 수학적 계산을 엄격히 분리하는 하이브리드 에이전시 프레임워크를 제안하였습니다. 이 구조에서 LLM은 지능적인 인터페이스로 작용하여 자연어로부터 매개변수를 발췌하고 결과를 해석하며, 철저한 알고리즘을 자동으로 호출하여 최적화 엔진을 구축합니다. 이 상호작용 시스템을 실제 관리자 대화의 모호성과 일관되지 않은 부분에 대해 평가하기 위해 우리는 Human Imitator라는 유계 합리적인 매니저의 디지털 트윈 형태의 조정된 버전을 도입하였습니다. 이는 규모가 크고 재현 가능한 스트레스 테스트를 가능하게 합니다. 우리의 경험적 분석은 하이브리드 에이전시 프레임워크가 GPT-4o를 종단 종단 해결자로 사용하는 상호작용 기준치에 비해 총 재고 비용을 32.1% 감소시키는 것을 보여주었습니다. 또한, 완벽한 기본 진실 정보만 제공한다고 해서 GPT-4o의 성능이 향상되는 것은 아니라는 점을 발견하였습니다. 이로써 병목 현상은 근본적으로 계산적인 문제가 아니라 정보적 문제는 아님을 확인할 수 있었습니다. 우리의 결과는 LLMs가 운영 연구를 대체하는 것이 아니라, 엄격한 해결자 기반 정책에 접근 가능하게 만드는 자연어 인터페이스로서의 위치를 제시합니다.

paper AI 요약
병리학에서 검증 가능한 신경기호적 추론을 향해  SQL로 증거 추적

병리학에서 검증 가능한 신경기호적 추론을 향해 SQL로 증거 추적

이 연구는 딥러닝 모델이 자연어 처리 작업에 미치는 영향을 조사한다. 특히, 우리는 다양한 아키텍처가 감성 분석의 성능에 어떻게 영향을 미치는지 분석했다. 세 가지 인기 있는 CNN 기반 패러다임을 여러 데이터셋에서 비교하여 어떤 아키텍처가 변화하는 조건 하에서도 가장 효과적인지를 결정한다.

paper AI 요약
보편 조건 논리  프롬프트 엔지니어링을 위한 형식 언어

보편 조건 논리 프롬프트 엔지니어링을 위한 형식 언어

이 논문은 자연어 지시를 코드로 실행하는 대형 언어 모델(LLM)에 대한 새로운 패러다임을 제안한다. 이를 위해 *일반 조건 로직* (UCL)이라는 형식 언어를 도입하여, 프롬프트 엔지니어링을 체계적인 최적화로 이끈다. 또한, 지시의 상세 수준이 품질에 비선형적으로 영향을 미치는 과도한 지시 패러독스 를 설명하고, 이를 극복하기 위한 구조적 오버헤드와 품질 함수를 제시한다.

paper AI 요약
복수 작업 조건 하에서의 고장 진단을 위한 이중 해제 다모달 도메인 혼합 융합 모델

복수 작업 조건 하에서의 고장 진단을 위한 이중 해제 다모달 도메인 혼합 융합 모델

(이 논문은 고도로 자동화되고 복잡한 현대 기계의 장애 진단을 위해 다중 모달 데이터와 도메인 일반화를 통합하는 새로운 접근법을 제안한다. 이 방법론은 다양한 작업 조건에서 수집된 센서 신호를 결합하여, 미리 보지 못했던 조건에서도 효과적인 장애 진단을 가능하게 한다.)

paper AI 요약
빌딩 블록에서 계획까지  강화학습을 활용한 대형 언어 모델의 다단계 공간 추론

빌딩 블록에서 계획까지 강화학습을 활용한 대형 언어 모델의 다단계 공간 추론

공간 추론은 네비게이션 및 계획 등 다양한 응용 분야에서 주목받고 있는 큰 언어 모델(LLMs)의 특징이다. 그럼에도 불구하고, LLMs는 구조화된 환경에서 공간 변환과 다단계 계획에 여전히 어려움을 겪고 있다. 본 논문에서는 두 단계 접근법을 제안한다. 이 방법은 공간 추론을 원자적 구성 요소와 그것들의 조합으로 분해한다. 첫째, 회전, 평행이동 및 스케일링과 같은 기본적인 공간 변환에 대해 감독 학습을 통해 모델에 기본적인 공간 물리학을 제공하기 위해 훈련을 진행한다. 그런 다음 이 물리학 인식 모델을 동결하고 GRPO 프레임워크 내에서 가벼운 LoRA 어댑터를 훈련시켜, 수수께끼 기반 환경에서 다단계 계획을 위한 이러한 구성 요소들을 조합하는 정책을 학습한다. 이를 위해 아스키아트 데이터셋을 합성하고 해당 아스키 기반 강화 학습 환경을 구축한다. 우리의 방법은 동적인 환경과 정적인 환경 모두에서 일반 베이스라인, 물리학 인식 모델 및 end-to-end RL 모델을 능가하며, 특히 수수께끼 기반 환경에서는 더욱 우수한 성능을 보여준다. 또한 제안된 접근법은 처음부터 강화 학습을 진행하는 것보다 더 빠르게 수렴하고 훈련이 안정적이다. 마지막으로 우리는 주의 패턴을 분석하여 페인트를 통해 공간 이해력에서 의미 있는 개선이 이루어졌는지 평가한다.

paper AI 요약
소셜 미디어 조작 감지  진화하는 메모리 기반 틀

소셜 미디어 조작 감지 진화하는 메모리 기반 틀

사회 미디어에서 조작된 행동을 감지하는 것은 여전히 중요한 문제로 남아 있으며 대부분의 기존 접근 방법은 표면적인 상관 분석에 의존하며, 정적 매개변수 설정을 사용하고 수많은 수동 어노테이션을 요구합니다. 이러한 제한점을 체계적으로 해결하기 위해 Adaptive Causal Coordination Detection (ACCD) 프레임워크를 제안합니다. ACCD는 기억 기반 적응 메커니즘을 활용하여 다양한 조정 상황에서 최적의 감지 설정을 동적으로 학습하고 유지하는 3단계 진행형 아키텍처를 채택합니다. 구체적으로 첫 번째 단계에서는 진정한 인과 관계를 심층적으로 식별하기 위한 적응형 Convergent Cross Mapping (CCM) 기법을 도입하고 있습니다. 두 번째 단계는 반복 학습과 불확실성 샘플링을 통합하여 준감독 분류 방식으로 수동 라벨링 부담을 크게 줄입니다. 세 번째 단계에서는 과거 감지 경험에 기반한 자동 검증 모듈을 배치하여 검출 결과의 자체 확인 및 최적화를 가능하게 합니다. 본 연구는 실제 데이터셋, 특히 트위터 IRA 데이터셋과 리디트 조정 추적기록, 그리고 널리 사용되는 봇 감지 벤치마크 몇 가지를 이용해 종합적인 평가를 수행하였습니다. 실험 결과 ACCD는 조직화된 공격을 감지하는 데 87.3%의 F1 점수를 달성하며, 가장 강력한 기존 기준선 대비 15.2% 향상되었습니다. 또한 시스템은 수동 어노테이션 요구사항을 68% 감소시키며 계층적 클러스터링 최적화를 통해 처리 속도가 2.8배 빨라집니다. 결론적으로 ACCD는 사회 플랫폼에서 조작된 행동을 식별하기 위한 정확하고 효율적이며 자동화 수준이 높은 종합적인 해결책을 제공하며, 실용적 가치와 광범위한 응용 가능성에 대한 큰 잠재력을 제시합니다.

paper AI 요약
스마트 건물의 인간 중심 에너지 관리 시스템을 위한 상황 인식 대형 언어 모델 기반 AI 에이전트

스마트 건물의 인간 중심 에너지 관리 시스템을 위한 상황 인식 대형 언어 모델 기반 AI 에이전트

건물은 전 세계 에너지 소비의 약 30%를 차지하며, 효율적인 에너지 사용을 달성하는 데 있어 핵심적이다. 이 논문에서는 대형 언어 모델(LLM) 기반 AI 에이전트가 인간과 건물 간 상호 작용을 개선하고, 건물 에너지 관리 시스템(BEMS)의 사용자 인터페이스를 향상시키는 방법에 대해 탐구한다. LLM은 자연어 처리와 데이터 분석 능력을 활용하여 사용자의 다양한 목표에 맞춘 컨텍스트 감지를 제공할 수 있다.

paper AI 요약
No Image

신경기호학으로 수학의 첫 원칙부터 만들다

대형 언어 모델(LLMs)은 내부적 공리적 프레임워크의 부재로 인해 복잡한 추론에서 지속적인 논리적 실패를 보입니다. 저희는 수학적 상태를 고차원 하이퍼그래프로 인코딩하고 제약 조건을 연속 에너지 풍경으로 매핑하는 미분 가능한 논리 엔진인 기호 추론 커널(SRK)을 사용하는 Mathesis라는 뉴로-기호 구조를 제안합니다. 모든 에너지 함수 E(G)를 정의하여 영 에너지는 논리적 일관성을 의미하며, SRK는 그래디언트 기반 신호를 생성해 하이퍼그래프 트랜스포머 뇌를 학습시키고 증명 검색을 에너지 최소화로 바꿉니다. 몬테카를로 트리 탐색과 진화 증명 탐색을 통해 학습된 가치 함수와 의미 통일에 의해 다단계 추론이 가능해집니다.

paper AI 요약
실패를 성공으로 되돌리기  지시사항 준수용 강화학습의 효율적 샘플링

실패를 성공으로 되돌리기 지시사항 준수용 강화학습의 효율적 샘플링

이 논문에서는 기계 학습을 사용하여 주식 시장의 추세를 예측하는 방법에 대해 살펴봅니다. 우리는 다양한 모델과 데이터 세트를 통해 회귀, 분류, 그리고 시간 순열 분석의 결과를 비교합니다. 우리의 연구는 특히 뉴럴 네트워크와 서포트 벡터 머신(SVM)이 주식 시장 예측에 있어서 얼마나 효과적인지 살펴봅니다. ###

paper AI 요약
No Image

언어 모델의 인식 견고성 측정 프로토콜 DDFTTestMethod

양자 컴퓨팅은 최근 양자 비트의 안정성과 오류 교정 기술에서 중요한 진전을 이루었다. 이 논문에서는 이러한 발전이 암호학과 복잡한 시스템 시뮬레이션 등 실용적 응용 분야에 미치는 영향을 탐색한다. 고려된 분석에는 특정 문제를 해결하기 위한 고전 알고리즘과 양자 알고리즘 간의 비교가 포함되어 있으며, 이로 인한 잠재적인 속도 향상이 강조된다.

paper AI 요약
에이전시의 마법  신경기호적 프로그래밍을 단순화하다

에이전시의 마법 신경기호적 프로그래밍을 단순화하다

심볼릭 제약 조건을 딥러닝 모델에 통합하면 더 견고하고 해석 가능하며 데이터 효율적인 모델이 될 수 있습니다. 그럼에도 불구하고 이러한 통합은 여전히 시간이 많이 소요되고 어려운 작업입니다. DomiKnowS와 같은 기존 프레임워크는 고수준의 선언적 프로그래밍 인터페이스를 제공하여 이 통합을 돕지만, 사용자가 해당 라이브러리의 특정 문법에 능통하다고 가정합니다. 이러한 종속성을 제거하기 위해 AgenticDomiKnowS(ADS)를 제안합니다. ADS는 에이전시 워크플로를 활용하여 자유 형식의 작업 설명을 완성된 DomiKnowS 프로그램으로 번역하며, 각 DomiKnowS 구성 요소를 따로 생성하고 테스트합니다. 이 워크플로는 사용자가 중간 출력물을 개선할 수 있는 옵션의 인간-인-더-루프 개입을 지원합니다. ADS가 경험 많은 DomiKnowS 사용자와 비사용자 모두에게 신경 기호적 프로그램을 빠르게 작성할 수 있게 하여 개발 시간을 몇 시간에서 10~15분으로 줄일 수 있음을 보여줍니다.

paper AI 요약
에이전트 레시  LLM을 활용한 인과 피드백 퍼지 인지 지도 추출

에이전트 레시 LLM을 활용한 인과 피드백 퍼지 인지 지도 추출

이 논문에서는 대형 언어 모델(LLM) 에이전트가 샘플링된 텍스트 문서에서 인과 피드백 퍼지인지도(FCM)를 어떻게 성장시키는지를 보여줍니다. 이 FCM은 지역적인 부분적 인과 규칙을 형성하고, 이를 통해 전역 균형 상태인 한계 주기를 정의합니다. 이러한 방법은 프로그래밍된 명령에 의존하는 일반적인 피드포워드 에이전트 시스템과는 달리 FCM 동적 시스템의 에이전시를 진화하는 균형 한계 주기에서 찾습니다. ###

paper AI 요약
예측 가능한 신뢰성 위한 동영상 질의응답의 명시적 기피 조절기

예측 가능한 신뢰성 위한 동영상 질의응답의 명시적 기피 조절기

이 연구에서는 자연어 처리 작업에서 딥러닝 기법의 효과를 조사하며 특히 감성 분석에 초점을 맞추고 있습니다. BERT, RoBERTa, DistilBERT라는 세 가지 모델을 비교하였습니다. 우리의 결과는 모든 모델이 우수한 성능을 보였지만, RoBERTa가 BERT보다 약간 더 좋은 성능과 덜 많은 컴퓨팅 비용을 제공한다는 것을 나타냅니다.

paper AI 요약
위험 인식 단계적 정합을 통한 제약 언어 모델 정책 최적화

위험 인식 단계적 정합을 통한 제약 언어 모델 정책 최적화

본 연구는 의료 영상 데이터셋에서 다양한 CNN 아키텍처가 이미지 인식 정확도에 미치는 영향을 탐구합니다. 전통적인 피드포워드 네트워크, 잔차 학습 모델, 트랜스포머를 포함한 세 가지 구조를 비교함으로써, 변화하는 조건 하에서 어떤 아키텍처가 우수한 성능을 제공하는지 알아보았습니다. 우리의 결과는 전통적인 피드포워드 네트워크가 기본 작업에 단순하고 효과적임을 시사하지만, 복잡한 구조인 트랜스포머가 미묘한 의료 영상 시나리오에서 높은 정확도를 달성하는 데 필요할 수 있음을 나타냅니다.

paper AI 요약
유투 에이전트  자동 생성과 하이브리드 정책 최적화로 생산성 증대

유투 에이전트 자동 생성과 하이브리드 정책 최적화로 생산성 증대

이 연구는 다양한 데이터셋에서 이미지 인식 작업에 있어 여러 CNN 기반 패러다임의 효과를 탐구한다. 전통적인 학습, 사전 학습 모델을 조정한 트랜스퍼 러닝, 그리고 학습 중에 라벨을 보지 않는 제로샷 러닝 세 가지 방법을 비교했다. 결과는 트랜스퍼 러닝이 다른 접근 방식보다 큰 이점을 제공함을 나타냈다.

paper AI 요약
인간과 인공지능의 공동 창조를 위한 에이전트 기반 AI 프레임워크를 이용한 진보적 아이디어 발상

인간과 인공지능의 공동 창조를 위한 에이전트 기반 AI 프레임워크를 이용한 진보적 아이디어 발상

현대 엔지니어링 디자인에서 진정으로 새로운 다양성의 아이디어를 생성하는 것이 중요하나, 이는 초보 디자이너들에게 중요한 인지적 도전 과제로 남아 있습니다. 현재의 단일 발사형 AI 시스템은 의미론적으로 군집화된 많은 아이디어를 생산하여 이러한 도전을 더욱 어렵게 만듭니다. 우리는 MIDAS(Meta-cognitive Ideation through Distributed Agentic AI System)라는 새로운 프레임워크를 제안합니다. 이는 단일 AI 패러다임 대신 특수한 AI 에이전트로 구성된 분산 팀 을 통해 인간의 메타인지적 아이디어 생성 워크플로우를 모방하도록 설계되었습니다. 이 에이전트 시스템은 아이디어를 점진적으로 정교화하고, 각 아이디어를 기존 솔루션에 대해 전반적인 새로움과 이전에 생성된 아이디어에 대해 국지적 새로움을 평가합니다. 따라서 MIDAS는 진정한 인간-AI 공동 창조의 실현 가능한 점진적 패러다임을 보여주며, 이를 통해 인간 디자이너는 단순히 관문 역할에서 벗어나 적극적인 협력 파트너로 참여하게 됩니다.

paper AI 요약
인간의 물건 배치 선호도, 네 가지 축으로 설명하다

인간의 물건 배치 선호도, 네 가지 축으로 설명하다

이 논문은 서비스 로봇의 물체 재배치 문제를 다룬다. 이 문제는 사용자의 조직 선호도에 따라 공간 내에서 원하는 구성으로 아이템을 정리하는 것을 의미한다. 기존 연구들은 일정한 정돈 방식을 사용했지만, 본 논문에서는 사용자별로 다양한 선호도를 반영할 수 있는 해석 가능한 구조체를 제안한다.

paper AI 요약
인공지능 에이전트의 믿음에 따른 편향  인간을 타집단으로 보는 경우

인공지능 에이전트의 믿음에 따른 편향 인간을 타집단으로 보는 경우

(LLM-동력화된 에이전트가 인간 그룹에 대한 사회적 편견을 재생산할 수 있다는 최근 연구들을 바탕으로, 본 논문은 이러한 에이전트들이 인그룹과 아웃그룹 사이의 경계를 통해 자발적인 편견을 나타낼 수 있음을 분석합니다. 특히 인간-인공지능 상호작용에서 이러한 편견이 어떻게 작동하는지를 연구하고, 이를 조작할 수 있는 신뢰성 공격 방법론을 제시합니다.)

paper AI 요약
임상 지식 그래프 구축 및 검증  다중 언어 모델을 통한 검색 강화 생성 방법

임상 지식 그래프 구축 및 검증 다중 언어 모델을 통한 검색 강화 생성 방법

의학적 서술문에서 정확하고 임상적으로 관련성이 있는 지식 그래프(KGs)를 구축하는 것은 생물의학 정보학에서 근본적인 도전 과제입니다. 임상 KG는 설명 가능한 AI, 의사결정 지원, 그리고 환자의 장기적 모델링을 가능하게 하지만, 전통적인 접근법은 여전히 제약되어 있습니다. 이 논문에서는 free-text에서 직접 KG를 구축하고 평가하는 최초의 end-to-end 프레임워크를 소개합니다. 우리의 파이프라인은 지속적인 정교화와 자기 감독 평가를 지원하여, 높은 정확도의 구성과 시간에 따른 동적 그래프 개선을 가능하게 합니다.

paper AI 요약
자기 질문으로 성장하는 언어 모델  대안적 사고의 힘

자기 질문으로 성장하는 언어 모델 대안적 사고의 힘

본 논문은 **대안적 자기 질문(Counterfactual Self-Questioning, CSQ)** 이라는 프레임워크를 제안합니다. 이 방법론은 단일 언어 모델이 자체 추론을 대안적으로 검토하고 수정할 수 있도록 합니다. 기존 방식과 달리 외부 비판자나 다중 에이전트 토론 없이도, 내부적으로 생성된 대안적 비평을 통해 정책 최적화 신호를 형성합니다. 실험 결과는 다양한 모델 크기에 걸쳐 표준 추론 벤치마크에서 일관된 성능 개선을 보여줍니다.

paper AI 요약
장기 사고 연쇄에서의 환각 스트리밍 감지

장기 사고 연쇄에서의 환각 스트리밍 감지

이 연구는 자연어 처리 작업을 위한 세 가지 다른 딥러닝 패러다임의 효과를 살펴보았습니다. 이 패러다임은 1) 전통적인 피드포워드 신경망, 2) 재귀적 신경망 (RNN), 그리고 3) 트랜스포머입니다. 우리는 다양한 데이터셋에서 각 모델의 성능을 분석하여 어떤 조건 하에서 어느 패러다임이 우수한 결과를 내는지 확인했습니다.

paper AI 요약
전통 인디언 럼미의 수량 기반 규칙 모델링  지표 최적화 접근법

전통 인디언 럼미의 수량 기반 규칙 모델링 지표 최적화 접근법

게임 이론, 루미, 휴리스틱 최적화, 상대방 모델링, 규칙 기반 전략, 제로섬 게임에 대해 논의한다. 클래식 인디언 루미는 운과 기술 사이에서 균형을 이루는 카드 게임이다. 본 논문에서는 강화 학습과 몬테카를로 방법 대신 해석 가능한 규칙 기반 접근법을 제시하며, *MinDist*라는 새로운 정량적 지표를 소개한다.

paper AI 요약
조건 속성과 조건 특성 암시의 최적 기반 구축

조건 속성과 조건 특성 암시의 최적 기반 구축

본 논문에서는 삼차적 맥락에서 최적의 함의 집합을 구성하는 방법을 증강을 통해 제안한다. 또한 이 구성 방법의 복잡성을 분석하고, 특징(feature), 준특징(quasi-feature), 가상특징(pseudo-feature)이라는 세 가지 핵심 개념을 소개하며, 이를 사용해 Biedermann과 Ganter 및 Obiedkov가 정의한 삼차적 함의를 구성하는 알고리즘을 제안한다.

paper AI 요약
진ิ우스 에이전트  실제 시나리오에서 경험 중심 정확도 최적화로의 접근

진ิ우스 에이전트 실제 시나리오에서 경험 중심 정확도 최적화로의 접근

대형 언어 모델(LLMs)의 능력이 증가함에 따라, LLM 기반 자율 에이전트는 AI 응용 분야에서 새로운 패러다임을 제공한다. 이러한 에이전트들은 지시를 이해하고 도구를 호출하며 추론과 계획을 수행하고 복잡한 작업을 처리할 수 있다. 그러나 현재의 지능형 에이전트 시스템은 일반성, 안정성 및 관리 가능성에 대한 여러 문제점을 가지고 있으며, 특히 많은 작업 상황에서 태스크 정밀도, 응답 신뢰성 및 시스템 안정성이 취약하다. 현재 대부분의 에이전트 시스템은 고정된 프롬프트와 사전 정의된 도구 사용 워크플로에 의존하여 작업 의도를 이해하거나 동적으로 도구를 선택하고 컨텍스트를 효과적으로 관리하는 능력이 제한적이다. 이 연구에서는 자율 에이전트의 기본 실행 과정을 시작으로, 위 문제들을 해결하기 위한 세 가지 보완적인 최적화 모듈을 소개한다. - **작업 이해와 프롬프트 최적화 ** 구조화된 의도 인식과 정교한 시스템 프롬프트 및 템플릿을 통합하여 지시를 현재 상태와 목표에 맞게 조정하여 잘못된 해석을 줄이고 작업 일치성을 안정화한다. - **도구 검색 ** 동적 검색과 적응적인 도구 접근을 사용하여 사용자 의도를 컨텍스트 관련 도구와 매칭하고 불명확한 사용자 요청을 처리한다. - **계층형 메모리 관리 ** 중복 대화 기록을 제거하여 토큰 길이를 제어하고 중요한 의미를 유지하며 장기 상호작용에서 추론을 안정화한다. 이 연구에서는 Jenius-Agent라는 통합 프레임워크를 구축하여 작업 정확도, 효율성 및 컨텍스트 강건성을 향상시킨다. 이 프레임워크는 적응적인 프롬프트 생성, 컨텍스트 인식 도구 조정 및 계층형 메모리 관리를 통합한다. ###

paper AI 요약
진리 측정 프로젝트  인공지능의 확신 수준을 어떻게 평가할까?

진리 측정 프로젝트 인공지능의 확신 수준을 어떻게 평가할까?

이 논문에서는 대형 언어 모델(Large Language Models, LLMs)의 평가에서 발생하는 인식론적 위기를 다룬다. 특히 정적인 능력 기준과 인지적 일관성이 분리되는 문제를 탐구한다. 이 연구는 무장된 지적인 겸양 이라는 현상을 제시하며, 모델들이 사용자의 의도에 맞추기 위해 참을성을 강조하는 경향이 있다. 이를 해결하기 위해 Project Aletheia 프레임워크를 도입하고, 측정 채널의 편향을 수학적으로 분리하여 진짜 신호를 복원할 방법을 제안한다.

paper AI 요약
크reativity의 딜레마  언어 모델들의 창의성과 동질성

크reativity의 딜레마 언어 모델들의 창의성과 동질성

이 연구는 복잡한 신경망 아키텍처에 대한 포괄적인 이해를 제공하는 것을 목표로 합니다. 이 논문은 이러한 네트워크 내의 구성 요소와 상호 작용, 그리고 정확도 및 계산 효율성과 같은 성능 지표에 미치는 영향을 분석합니다. 또한 이러한 모델이 실제 세계 시나리오에서 어떻게 최적화될 수 있는지 탐구하고 있습니다. ###

paper AI 요약
프로젝트 아리아네  LLM 에이전트의 충실성을 심사하기 위한 구조적 인과 프레임워크

프로젝트 아리아네 LLM 에이전트의 충실성을 심사하기 위한 구조적 인과 프레임워크

대형 언어 모델(ULLM) 에이전트의 급속한 확산은 자동 문제 해결 분야에 혁명을 가져왔습니다. 그러나 이러한 에이전트가 고위험 도메인에서 사용될 때, 그들의 의사결정 과정의 투명성이 중요한 안전 장벽이 됩니다. 이 논문에서는 이러한 문제를 해결하기 위한 프로젝트 아리아드네(Project Ariadne)라는 진단 프레임워크를 소개합니다. 이 프레임워크는 구조적 인과 모델(SCMs)을 활용하여 에이전트의 의사결정 과정에서 발생하는 인과 분리 현상을 진단하고 있습니다. ###

paper AI 요약

< 분야별 논문 현황 (Total: 566) >

Quantum Physics
5

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키