게시글

모든 게시글 목록입니다. 최신순으로 정렬되어 있습니다.

총 301개의 게시글
총 7페이지
전통 인디언 럼미의 수량 기반 규칙 모델링  지표 최적화 접근법

전통 인디언 럼미의 수량 기반 규칙 모델링 지표 최적화 접근법

게임 이론, 루미, 휴리스틱 최적화, 상대방 모델링, 규칙 기반 전략, 제로섬 게임에 대해 논의한다. 클래식 인디언 루미는 운과 기술 사이에서 균형을 이루는 카드 게임이다. 본 논문에서는 강화 학습과 몬테카를로 방법 대신 해석 가능한 규칙 기반 접근법을 제시하며, *MinDist*라는 새로운 정량적 지표를 소개한다.

paper AI 요약
제너레이티브 AI의 패러독스  진실의쇠퇴와 정보검증의 부식

제너레이티브 AI의 패러독스 진실의쇠퇴와 정보검증의 부식

생성 인공지능(GenAI)은 이제 텍스트, 이미지, 오디오, 비디오를 대규모로 그리고 거의 무시할 수 있는 추가비용으로 인식상 납득 가능한 결과물을 생산하고 있습니다. 공론장에서는 이러한 관련 피해를 주로 딥페이크 나 증언 및 사기의 점진적 확장을 통한 것으로 다루는 경우가 많으나, 이 관점은 더 넓은 사회기술 변화를 놓치고 있습니다 GenAI는 합성 현실을 가능하게 합니다; 내용, 정체성, 그리고 사회 상호작용이 공동으로 제조되고 상호 보완적인 일관되고 상호 작용 가능한 정보 환경입니다. 본 논문은 단지 고립된 합성 제품의 생산에 그치는 것이 아니라, 합성 콘텐츠, 합성 정체성, 그리고 합성 상호작용이 생성하기 쉬우며 심사가 어려워짐으로써 공유 지식 기반과 제도적 검증 실천이 점진적으로 훼손되는 것이 가장 중대한 위험이라는 입장을 주장합니다. 이 논문은 (i) 합성 현실을 층叠的堆栈(内容、身份、互动、机构),(ii) 扩展涵盖个人、经济、信息和社技风险的GenAI危害分类,(iii) 阐述由GenAI引入的定性转变(成本崩溃、吞吐量、定制化、微细分、出处缺口和信任侵蚀),以及(iv) 将近期风险实现(2023-2025年)综合成一个紧凑案例库,说明这些机制如何在欺诈、选举、骚扰、文件编制和供应链妥协中表现。然后我们提出了一种缓解堆栈,将来源基础设施、平台治理、机构工作流程重新设计以及公共复原力视为互补而非替代的,并概述了一个专注于衡量知识安全的研究议程。我们以生成式人工智能悖论结束:随着合成媒体变得无处不在,社会可能合理地完全忽视数字证据。 请允许我纠正并完成韩语翻译: (ii) 개인, 경제, 정보, 사회기술적 위험을 포괄하는 GenAI 해악 분류를 확장하고, (iii) 제네레이티브 AI가 도입한 정성적인 변화(비용 붕괴, 처리량, 맞춤화, 미세 세분화, 출처 격차, 신뢰 침식)를 설명하며, (iv) 사기, 선거, 괴롭힘, 문서 작성, 공급망 해킹에서 이러한 메커니즘이 어떻게 나타나는지 보여주는 2023-2025년의 최근 위험 실현을 간결한 사례 은행으로 종합합니다. 그런 다음 우리 주장은 입증 인프라, 플랫폼 통치력, 기관 워크플로 리디자인, 공공 복원력을 대체가 아닌 보완적인 것으로 취급하는 완화 스택을 제안하고, 지식 안전성 측정에 초점을 맞춘 연구 계획을 개략합니다. 우리는 생성 AI 패러독스를 결론으로 내립니다 합성 미디어가 보편화됨에 따라 사회는 합리적으로 디지털 증거를 완전히 할인할 수 있습니다.

paper AI 요약
제한적인 의학적 어노테이션을 갖춘 다_SCALE-인식 적응형 감독 네트워크

제한적인 의학적 어노테이션을 갖춘 다_SCALE-인식 적응형 감독 네트워크

우리는 제한적인 어노테이션 조건에서도 성능을 향상시키기 위해 SASNet, 즉 이중 분기 반감독 세분화 네트워크를 제안합니다. 스케일 인식 적응 가중 전략은 선택적으로 픽셀 단위 결과를 합쳐 더 신뢰할 수 있는 집합 예측을 생성합니다. 또한 관점 변동 증강 메커니즘은 다양한 관점과 스케일에 따른 어노테이션 차이를 시뮬레이션하여 견고성과 세분화 정확도를 향상시킵니다.

paper AI 요약
조건 속성과 조건 특성 암시의 최적 기반 구축

조건 속성과 조건 특성 암시의 최적 기반 구축

본 논문에서는 삼차적 맥락에서 최적의 함의 집합을 구성하는 방법을 증강을 통해 제안한다. 또한 이 구성 방법의 복잡성을 분석하고, 특징(feature), 준특징(quasi-feature), 가상특징(pseudo-feature)이라는 세 가지 핵심 개념을 소개하며, 이를 사용해 Biedermann과 Ganter 및 Obiedkov가 정의한 삼차적 함의를 구성하는 알고리즘을 제안한다.

paper AI 요약
주제 풍부한 임베딩을 통합한 복합적 접근법으로 검색 강화 생성 개선

주제 풍부한 임베딩을 통합한 복합적 접근법으로 검색 강화 생성 개선

(이 논문은 주제-강화 임베딩 방법을 제안하고, 이를 통해 복잡한 데이터셋에서의 문서 클러스터링과 검색 정밀도를 향상시키는 데 초점을 맞춥니다. 이 접근 방식은 기존 통계적 모델과 확률적 주제 모델링을 현대적인 문맥 임베딩과 통합하여, 로컬 및 글로벌 의미 특성을 동시에 포착합니다.)

paper AI 요약
진ิ우스 에이전트  실제 시나리오에서 경험 중심 정확도 최적화로의 접근

진ิ우스 에이전트 실제 시나리오에서 경험 중심 정확도 최적화로의 접근

대형 언어 모델(LLMs)의 능력이 증가함에 따라, LLM 기반 자율 에이전트는 AI 응용 분야에서 새로운 패러다임을 제공한다. 이러한 에이전트들은 지시를 이해하고 도구를 호출하며 추론과 계획을 수행하고 복잡한 작업을 처리할 수 있다. 그러나 현재의 지능형 에이전트 시스템은 일반성, 안정성 및 관리 가능성에 대한 여러 문제점을 가지고 있으며, 특히 많은 작업 상황에서 태스크 정밀도, 응답 신뢰성 및 시스템 안정성이 취약하다. 현재 대부분의 에이전트 시스템은 고정된 프롬프트와 사전 정의된 도구 사용 워크플로에 의존하여 작업 의도를 이해하거나 동적으로 도구를 선택하고 컨텍스트를 효과적으로 관리하는 능력이 제한적이다. 이 연구에서는 자율 에이전트의 기본 실행 과정을 시작으로, 위 문제들을 해결하기 위한 세 가지 보완적인 최적화 모듈을 소개한다. - **작업 이해와 프롬프트 최적화 ** 구조화된 의도 인식과 정교한 시스템 프롬프트 및 템플릿을 통합하여 지시를 현재 상태와 목표에 맞게 조정하여 잘못된 해석을 줄이고 작업 일치성을 안정화한다. - **도구 검색 ** 동적 검색과 적응적인 도구 접근을 사용하여 사용자 의도를 컨텍스트 관련 도구와 매칭하고 불명확한 사용자 요청을 처리한다. - **계층형 메모리 관리 ** 중복 대화 기록을 제거하여 토큰 길이를 제어하고 중요한 의미를 유지하며 장기 상호작용에서 추론을 안정화한다. 이 연구에서는 Jenius-Agent라는 통합 프레임워크를 구축하여 작업 정확도, 효율성 및 컨텍스트 강건성을 향상시킨다. 이 프레임워크는 적응적인 프롬프트 생성, 컨텍스트 인식 도구 조정 및 계층형 메모리 관리를 통합한다. ###

paper AI 요약
진리 측정 프로젝트  인공지능의 확신 수준을 어떻게 평가할까?

진리 측정 프로젝트 인공지능의 확신 수준을 어떻게 평가할까?

이 논문에서는 대형 언어 모델(Large Language Models, LLMs)의 평가에서 발생하는 인식론적 위기를 다룬다. 특히 정적인 능력 기준과 인지적 일관성이 분리되는 문제를 탐구한다. 이 연구는 무장된 지적인 겸양 이라는 현상을 제시하며, 모델들이 사용자의 의도에 맞추기 위해 참을성을 강조하는 경향이 있다. 이를 해결하기 위해 Project Aletheia 프레임워크를 도입하고, 측정 채널의 편향을 수학적으로 분리하여 진짜 신호를 복원할 방법을 제안한다.

paper AI 요약
진실로 속이는 함정

진실로 속이는 함정

대형 언어 모델(LLMs)은 복잡한 추론과 정보 통합을 수행할 수 있는 자율 에이전트의 인지 핵심으로 진화했습니다. 그러나 이러한 모델들이 인간과 더 가까워짐에 따라, *담론의 일관성*이라는 중요한 취약점을 물려받게 됩니다. 이 취약점은 LLMs가 편파적인 해석을 생성하는 데 사용되며, 특히 정보 집약적 환경에서 이러한 문제는 더욱 심각해집니다. 본 논문에서는 이 취약점을 이용한 인지 협응 공격(Cognitive Collusion Attack)을 제안하고, 이를 수행하기 위한 새로운 프레임워크인 **Generative Montage**를 소개합니다.

paper AI 요약
질의-문서 밀집 벡터를 활용한 LLM 관련성 판단 편향 분석

질의-문서 밀집 벡터를 활용한 LLM 관련성 판단 편향 분석

(본 논문은 대형 언어 모델(LLM)의 관련성 판단에서 숨겨진 편향을 진단하고 투명성을 높이기 위한 프레임워크를 제안합니다. 이 연구는 쿼리와 문서의 조합(Q-D 쌍)을 밀집 벡터로 임베딩하여 공유 의미 공간에서 클러스터링하는 방법론을 사용합니다. 이러한 접근법은 전역 통계를 넘어서, 특정 의미적 컨텍스트 내에서 인간과 LLM 사이의 판단 불일치를 분석할 수 있게 합니다.)

paper AI 요약
집중의 법칙  주의 분배 통일론

집중의 법칙 주의 분배 통일론

대형 언어 모델(LLMs)의 성공은 Transformer 아키텍처의 핵심 혁신인 자기 주의 메커니즘에 기반한다. 그러나 이 메커니즘이 이상적인 동작에서 벗어나 대표적으로 나타나는 현상으로는 표현력 붕괴와 주의 침전이 있다. 본 논문에서는 이런 문제를 해결하기 위해 Lazy Attention이라는 새로운 접근법을 제안하며, 이를 통해 모델 성능 향상을 확인한다.

paper AI 요약
챗봇으로 최적화된 가상 네트워크 관리

챗봇으로 최적화된 가상 네트워크 관리

본 논문은 자연어 처리(NLP)를 최적화 기반 가상 네트워크 할당과 통합한 채팅 주도의 네트워크 관리 프레임워크를 제안합니다. 이는 직관적이고 신뢰할 수 있는 가상 네트워크 서비스 재구성을 가능하게 합니다. 기존 의도 기반 네트워킹(IBN) 방법은 사용자의 의도 해석을 위해 통계 언어 모델에 의존하지만, 생성된 설정의 타당성 보장을 할 수 없습니다. 이를 극복하기 위해Interpreter와 Optimizer로 구성된 두 단계 프레임워크를 개발하였습니다. Interpreter는 NLP를 활용해 자연어 프롬프트로부터 의도를 추출하고, Optimizer는 정수 선형 계획법을 통해 타당한 가상 머신(VM) 배치와 라우팅을 계산합니다. 특히 Interpreter는 사용자 채팅을 업데이트 방향으로 번역하여 CPU 요구량과 지연 상한 등 매개변수를 증가시키거나 감소시키거나 유지할지 결정함으로써 네트워크 설정의 반복적 정교화를 가능하게 합니다. 본 논문에서는 SVM 분류기와 Sentence-BERT 모델, 대형 언어 모델(LLM)을 포함한 두 개의 의도 추출기를 소개합니다. 단일 사용자 및 다중 사용자 환경에서의 실험 결과는 프레임워크가 타당성을 유지하면서 VM 배치와 라우팅을 동적으로 업데이트할 수 있음을 보여줍니다. LLM 기반 추출기는 적은 양의 레이블된 샘플로 더 높은 정확도를 달성하며, Sentence-BERT와 SVM 분류기 조합은 실시간 운영에 적합한 상당히 낮은 지연을 제공합니다. 이러한 결과들은 안전하고 해석 가능하며 사용자 친화적인 가상 네트워크 관리를 위해 NLP 기반 의도 추출과 최적화 기반 할당의 결합이 효과적임을 강조합니다.

paper AI 요약
첨단 알고리즘으로 보는 콘크리트의 미래

첨단 알고리즘으로 보는 콘크리트의 미래

이 논문은 콘크리트 구조물에서 염화물의 시간에 따른 변화가 어떻게 영향을 받는지 결정하기 위해 데이터 기반 접근 방식을 사용합니다. 이것은 공격적인 환경에 노출된 시민 인프라의 수명을 평가하는 데 중요합니다. 채택한 방법론은 간단하고 복잡한 독립적인 머신 러닝(ML) 알고리즘에 의존하며, 주요 목표는 숨겨진 상관 관계를 공정하게 예측할 수 있는 신뢰성을 확립하는 것입니다. 간단한 알고리즘에는 선형 회귀(LR), k-최근접 이웃(KNN) 회귀, 커널 리지 회귀(KRR)가 포함됩니다. 복잡한 알고리즘에는 지원 벡터 회귀(SVR), 가우시안 프로세스 회귀(GPR), 그리고 두 가지 유형의 인공 신경망이 포함되며 이는 다중 계층 퍼셉트론(MLP)과 게이트 순환 단위(GRU)를 포함합니다. MLP 아키텍처는 시퀀셜 데이터를 명시적으로 처리할 수 없으나, GRU가 이를 해결하고 있습니다. 포괄적인 데이터셋을 고려하였습니다. ML 알고리즘의 성능은 평가되었으며 KRR, GPR 및 MLP는 높은 정확도를 보였습니다. 채택된 콘크리트 혼합 비율이 다양하기 때문에 GRU는 테스트 세트에서 반응을 정확하게 재현할 수 없었습니다. 추가 분석은 혼합 성분들이 염화물의 시간에 따른 변화에 어떤 영향을 미치는지 명시하였습니다. GPR 모델로 얻어진 결과는 명확하고 설명 가능한 추세를 통해 잠재적인 상관 관계를 밝혀냅니다. MLP, SVR 및 KRR도 전체적인 추세의 적절한 예측을 제공합니다. 대부분의 혼합 성분은 염화물 함량과 역 관계를 보이지만 몇 가지 구성 요소는 직접적인 관련성을 나타내었습니다. 이러한 결과는 염화물 침투와 관련된 물리적 과정 및 상관 관계를 설명하기 위한 대리 접근 방식의 가능성을 강조하며, 궁극적으로 시민 인프라의 수명을 향상시키기 위한 목표를 달성하는 데 기여합니다.

paper AI 요약
체리토마토 수확로봇의 시각기반 고장진단과 자가회복

체리토마토 수확로봇의 시각기반 고장진단과 자가회복

로봇 수확 장비가 농업 생산성을 향상시키고 노동 의존도를 줄이는 데 큰 잠재력을 보여주지만, 기계적, 전기적, 제어 부품의 결함이 여전히 존재하여 작동의 안정성과 연속성을 해칩니다. 이 논문에서는 이러한 문제를 해결하기 위해 시각 인식을 통합한 다중 작업 퍼셉션 네트워크와 위치 오류 보상 방법, 초기 중단 전략을 도입했습니다.

paper AI 요약
초강속 자율주행 시나리오 시뮬레이션

초강속 자율주행 시나리오 시뮬레이션

최근 자율주행 차량은 제한된 환경에서 일반 도로로 전환되었으며, 특히 샌프란시스코에서는 로봇택시 서비스가 안전하게 운영되고 있습니다. 그러나 미세 충돌과 교통 지연이 증가하고 있으며 이에 대한 보고와 개선 사항의 부재는 공공의 신뢰를 저하시키고 있습니다. 본 논문은 자율주행 시뮬레이션 환경에서의 테스트 효율성을 높이는 방법을 제시하며, 이를 통해 안전한 자동차 경주에 적용되었습니다.

paper AI 요약
No Image

최적 계약의 데이터 효율성

알고리즘 계약 이론에서 중앙 문제 중 하나는 그들의 특성이 알려지지 않은 대상에게 인센티브를 설계하는 것이다. 디지털 음악 플랫폼이 새로운 로열티 모델을 도입하려고 할 때, 각 독립 아티스트는 플랫폼에 대해 알려진 정보가 없는 개인 유형(private type)을 가지고 있다. 플랫폼은 작은 샘플 집합에서 시범 프로그램을 실행하여 여러 새로운 수익 공유 계약을 테스트하고 그 결과 다운로드 및 스트리밍 참여 데이터를 수집한다. 이 샘플을 기반으로 플랫폼은 전체 아티스트 커뮤니티의 동기를 부여하여 이윤을 최적화하는 개선된 로열티 모델을 학습하려고 한다. 이 시범 프로그램은 최근의 주요 연구에서 제시한 샘플 기반 학습 프레임워크의 예로, 이를 통해 유형이 완전히 파악된 대상들로부터 유한 데이터셋으로부터 최적 계약을 설계할 수 있다. 이 프레임워크는 다른 확립된 모델과 함께 다양한 시나리오에 적합하다. 더 공식적으로 말하면, 환경은 에이전트가 취할 수 있는 $`n`$ 개의 행동 집합과 $`m ge 2`$ 개의 가능한 결과로 구성된다. 각 결과 $`j`$에는 플랫폼이 받는 고정 보상 $`r_j ge 0`$이 있다. 에이전트는 개인 유형(private type) $` theta=(f,c)`$를 가지고 있는데, 이는 플랫폼에 알려지지 않은 정보이다. 플랫폼은 계약을 설계하여 최적의 기대 수익을 얻으려고 한다. 우리의 주요 결과는 선형 계약 클래스에 대한 학습 샘플 복잡도를 정확히 캐릭터라이즈하는 것이다.

paper AI 요약
출력 임베딩 중심화  대형 언어 모델 안정화

출력 임베딩 중심화 대형 언어 모델 안정화

대형 언어 모델의 사전 학습은 비용이 많이 들 뿐만 아니라 특정 트레이닝 불안정성에 노출되기 쉽습니다. 특히 큰 학습률을 사용할 때 마지막 부분에서 자주 발생하는 특정 불안정성이 출력 로짓 발산입니다. 가장 널리 사용되는 완화 전략인 z-손실은 문제의 증상을 다루는 데 그치고 근본 원인을 해결하지 않습니다. 본 논문에서는 출력 임베딩의 기하학적 관점에서 불안정성을 분석하고 그 원인을 파악하였습니다. 이를 바탕으로 새로운 완화 전략인 출력 임베딩 센터링(OEC)을 제안하고, 이가 출력 로짓 발산을 억제한다는 것을 증명합니다. OEC는 확률적 작업인 μ-센터링 또는 정규화 방법인 μ-손실로 두 가지 다른 방식으로 구현될 수 있습니다. 실험 결과, 두 변형 모두 z-손실보다 학습 안정성과 학습률 민감도 측면에서 우수한 성능을 보여주며, 특히 큰 학습률에서도 z-손실이 실패할 때에도 훈련이 수렴하도록 보장합니다. 또한 μ-손실은 z-손실보다 정규화 하이퍼파라미터 조정에 대해 크게 덜 민감하다는 것을 발견하였습니다.

paper AI 요약
커스텀 설계부터 심층 잔차 모델까지  다양한 이미지 분류와 탐지 작업을 위한 CNN 아키텍처의 진화

커스텀 설계부터 심층 잔차 모델까지 다양한 이미지 분류와 탐지 작업을 위한 CNN 아키텍처의 진화

이 연구에서는 다섯 가지 다양한 이미지 데이터셋을 사용하여 CNN 기반 모델의 성능을 평가한다. 이 데이터셋들은 도로 상태 분석, 보도 침범 감지, 과일 종류 인식 및 벼 종류 분류와 같은 실용적인 실제 세계 문제를 다룬다. 우리는 고유한 커스텀 CNN 아키텍처와 기존 모델들인 MobileNet과 EfficientNet을 비교하며, 다양한 이미지 분류 작업에서의 성능 차이를 살펴본다.

paper AI 요약
코그플로  지식 내재화를 통한 시각적 수학 문제 해결을 위한 인지와 추론의 연결

코그플로 지식 내재화를 통한 시각적 수학 문제 해결을 위한 인지와 추론의 연결

각종 진전에도 불구하고 다중 모달의 대형 언어 모델들은 시각 수학 문제 해결에서 여전히 어려움을 겪고 있다. 최근 연구들은 시각적 인식이 시각 수학 사고의 병목 현상임을 인지하였지만, 그들의 해법은 주로 시각적 입력의 추출과 해석 개선에 한정되어 있다. 특히, 추출된 시각적 단서들이 후속 사고 과정에서 신뢰성 있게 통합되고 적절히 활용되는 문제는 간과되었다. 이를 극복하기 위해 우리는 인식$ Rightarrow$내부화$ Rightarrow$사고라는 인간의 계층적 사고 흐름을 명시적으로 시뮬레이션하는 새로운 인지 기반 세 단계 프레임워크인 CogFlow를 제안한다. 이러한 계층적 흐름에 맞추어 모든 단계를 통합적으로 강화하였다. 매개변수적 및 의미 공간에서의 시각 정보 추출을 개선하기 위해 상호 보완적인 시각적 리워드를 설계하여 인식 능력을 높였다. 추출된 시각적 단서들이 후속 사고 과정에 신뢰성 있게 통합되도록 내부화 단계에서는 지식 내부화 리워드 모델을 도입하여 인식과 사고 사이의 연결을 강화하였다. 또한, 사고가 시각적 지식 위에 기반하도록 더 강하게 제약하기 위해 시각 게이트 정책 최적화 알고리즘을 설계하여 일관되지만 시각적으로 무근거인 사고 체인을 피할 수 있도록 하였다. 추가로 새로운 데이터셋 MathCog를 제공하여 모델 훈련에 기여하였으며, 이는 12만 개 이상의 고품질 인식-사고 정합성 주석을 포함하고 있다. 일반적으로 사용되는 시각적 수학 사고 벤치마크에서 실시된 포괄적인 실험과 분석은 제안된 CogFlow의 우수성을 검증한다.

paper AI 요약
코드 복잡성으로 숫자로 바꾸는 방법

코드 복잡성으로 숫자로 바꾸는 방법

알고리즘 분류는 컴퓨터 과학에서 중요한 문제로, 코드 조각에 사용된 프로그래밍 기법과 특정 알고리즘을 식별하는 것을 목표로 합니다. 이 작업은 코드의 의미론적 이해를 필요로하며 이를 통해 코드 취약성 검출이나 자동 코드 생성 도우미 설계 등 다양한 응용 분야에서 통찰력을 제공할 수 있습니다. 본 논문에서는 정적 코드 분석이 아닌 동적 분석을 중점적으로 다룹니다. 알고리즘이 어떻게 작동하는지 실제 실행 부분을 분석하여 리소스 사용량(예 CPU 시간, 메모리)이 입력 크기에 따라 어떻게 변화하는지를 조사합니다. ###

paper AI 요약
코드스위칭 음성인식을 위한 TTS 데이터 증강 개선

코드스위칭 음성인식을 위한 TTS 데이터 증강 개선

코드 스위칭은 다언어 화자들이 두 가지 이상의 언어를 혼합하여 대화하는 일상적인 관행입니다. 이는 자동 음성 인식(ASR)에서 특히 어려운 문제로, 화자가 언어 간 전환 시intonation, 리듬, 발음 등을 조정하므로 ASR 시스템은 이러한 변화를 실시간으로 추적해야 합니다. 그러나 실제 코드 스위칭 데이터셋의 부재가 모델 성능을 크게 제한합니다. 이 논문에서는 TTS(TTS Text-to-Speech) 합성 음성을 이용하여 이러한 문제를 해결하는 방법을 제시하고, 이를 통해 ASR 시스템의 성능을 개선할 수 있음을 보여줍니다.

paper AI 요약
쿠포먼 이론으로 안전한 제어 범위 예측하기

쿠포먼 이론으로 안전한 제어 범위 예측하기

본 연구에서는 알려지지 않은 비선형 동역학의 확률적 데이터 기반 안전 검증을 위한 확장 가능한 접근 가능성을 기반으로 하는 프레임워크를 제안합니다. 이에 Koopman 이론과 신경망(NN) 리프팅 함수를 사용하여 동역학의 근사 선형 표현을 학습하고, 이러한 공간에서 참조 궤적 분포의 클로즈드-루프 추적을 가능하게 하는 선형 제어기를 설계합니다. 클로즈드 루프 접근 가능한 집합은 리프팅된 공간에서 효율적으로 계산되며, NN 검증 도구를 통해 원래 상태 공간으로 다시 매핑됩니다. Koopman 동역학과 실제 시스템 간의 모델 불일치를 포착하기 위해 통계적 유효성을 갖는 오차 한계를 생성하기 위한 콘포멀 예측을 적용합니다. 이를 통해 사용자가 지정한 확률로 실제 궤적이 포함되도록 접근 가능 집합이 팽창됩니다. 이러한 경계는 참조에 따라 일반화되어 재사용 없이 재계산할 필요가 없습니다. 11차원 호퍼, 28차원 스위머로 구성된 고차원 MuJoCo 작업과 12차원 퀼코pter에서의 결과를 통해 기존 방법보다 개선된 접근 가능 집합 커버리지 비율, 계산 효율성 및 보수성을 확인할 수 있습니다.

paper AI 요약
테스트 시점의 추론 모델 인지 행동 이해 및 조정

테스트 시점의 추론 모델 인지 행동 이해 및 조정

최근 강화 학습(RL) 기반 훈련을 통해 대형 언어 모델(LLM)의 추론 능력이 크게 향상되었지만, 이들 모델은 여전히 비효율적인 사고 과정을 보일 때가 많다. 본 논문에서는 인지 행동을 추적하고 조절할 수 있는 특정 주의 머리들이 있다는 가설을 제시하고, 이를 통해 CREST 라는 훈련 없이 추론 중에 사고 패턴을 수정하는 프레임워크를 소개한다. CREST는 모델 내부에서 인지 행동을 조절할 수 있는 주의 머리들을 찾아내고, 테스트 시간에 이들 머리들의 활성화를 조작하여 모델의 사고 경로를 유도한다.

paper AI 요약
텍스트에서 이미지 생성을 위한 에이전트 리터쳐

텍스트에서 이미지 생성을 위한 에이전트 리터쳐

이 논문에서는 텍스트-이미지 생성 모델(T2I)에서 발생하는 미세한 왜곡을 자동으로 인식하고 수정하기 위한 **Agentic Retoucher**라는 새로운 프레임워크를 제안합니다. Agentic Retoucher는 시각적-의사결정-행동 순환 구조로 설계되어, 생성된 이미지에서 특정 부분에 대한 왜곡을 감지하고 수정할 수 있습니다. 이를 위해 **GenBlemish-27K**라는 대규모 데이터셋을 구성하여, 다양한 왜곡 유형에 대한 정밀한 주석과 자연어 설명을 제공합니다. 실험 결과는 Agentic Retoucher가 현존하는 후처리 방법보다 향상된 성능을 보여주며, 특히 미세한 왜곡 인식 및 수정에서 뛰어난 효과를 나타냅니다. ###

paper AI 요약
특권정보로 객체인식 강화  교사-학생 접근법

특권정보로 객체인식 강화 교사-학생 접근법

컴퓨터 비전 분야에서 객체 검출은 주요한 문제로, 자율 시스템, 환경 모니터링, 로봇공학 등 다양한 분야에 응용됩니다. 이 연구에서는 학습 중 특권 정보를 활용하는 Learning Under Privileged Information (LUPI) 패러다임을 객체 검출에 적용하여, 기존 방법보다 더 우수한 성능을 달성할 수 있는지 실험적으로 검증합니다.

paper AI 요약
팔콘  교차 도메인 의료 영상 분할을 위한 소량 샘플 대립학습

팔콘 교차 도메인 의료 영상 분할을 위한 소량 샘플 대립학습

정확한 해부학적 구조 및 병리학적 부위의 분할은 진단, 치료 계획 수립, 질병 진행 모니터링에 필수적이며 의사가 환자의 상태를 종합적으로 평가하고 정보에 입각한 결정을 내릴 수 있게 합니다. 이 작업은 보통 방사선과나 의료진이 수작업으로 수행하므로 시간이 많이 걸리고 일관성이 떨어집니다. AI 기반의 자동화된 분할 방법이 이러한 효율성 및 일관성을 개선하기 위해 주목받고 있습니다. 딥 뉴럴 네트워크(DNNs)를 포함한 인공지능은 특히 변환기 구조를 사용하여 일반적인 이미지 분석에서 혁신을 이끌어냈습니다. 그러나 이러한 모델을 의료 이미징에 직접 적용하는 것은 대규모 주석 데이터와 많은 연산 자원이 필요하다는 점에서 여러 가지 도전 과제가 있습니다. 3D 볼륨의 경우 특히 수작업으로 마스크를 생성하는 것이 비용이 많이 들고 시간이 오래 걸립니다. 가상 데이터를 생성하는 생성 모델은 주석 부족 문제에 대한 유망한 해결책을 제공하지만, 임상적 채택에는 철저한 검증과 규제 준수 요구사항이 있습니다. 전통적인 데이터 증강 기법은 실제 임상 특징을 정확히 포착하지 못하는 경우가 있어 모델의 신뢰성을 저하시킬 수 있습니다. 의료 이미지 분할에서는 정확한 경계 선정이 중요하며, 작은 위치 오차는 수술 사고로 이어질 수 있는 심각한 임상적 결과를 초래합니다. 본 논문은 개인 정보 보호 및 자원 효율적인 의료 AI의 필요성에 의해 작성되었습니다. 특정 환자의 3D 볼륨에서 얻은 미표시 슬라이스가 높은 정확도의 분할을 위한 필요한 맥락을 제공한다는 가설을 제시합니다. ###

paper AI 요약
프라이버시벤치  개인화된 AI의 개인정보 보호 평가를 위한 대화형 벤치마크

프라이버시벤치 개인화된 AI의 개인정보 보호 평가를 위한 대화형 벤치마크

본 논문에서는 개인화된 AI 보조 도구의 개인정보 보호 문제를 다룬다. 특히, 대형 언어 모델(Large Language Models)을 기반으로 한 개인화 시스템에서 발생하는 정보 유출 위험에 초점을 맞춘다. 이를 위해 PrivacyBench 라는 새로운 평가 프레임워크를 제안하고, 실제 상호작용에서 개인정보 보호의 중요성을 강조한다.

paper AI 요약
프로젝트 아리아네  LLM 에이전트의 충실성을 심사하기 위한 구조적 인과 프레임워크

프로젝트 아리아네 LLM 에이전트의 충실성을 심사하기 위한 구조적 인과 프레임워크

대형 언어 모델(ULLM) 에이전트의 급속한 확산은 자동 문제 해결 분야에 혁명을 가져왔습니다. 그러나 이러한 에이전트가 고위험 도메인에서 사용될 때, 그들의 의사결정 과정의 투명성이 중요한 안전 장벽이 됩니다. 이 논문에서는 이러한 문제를 해결하기 위한 프로젝트 아리아드네(Project Ariadne)라는 진단 프레임워크를 소개합니다. 이 프레임워크는 구조적 인과 모델(SCMs)을 활용하여 에이전트의 의사결정 과정에서 발생하는 인과 분리 현상을 진단하고 있습니다. ###

paper AI 요약
하노이월드  안전한 자율주행의 열쇠

하노이월드 안전한 자율주행의 열쇠

현재 자율 제어를 위한 강화 학습의 시도는 데이터 요구량이 많고 결과가 미흡하며 안정적이지 않고, 또한 픽셀 재구성의 특성상 잡음 특징에 과도하게 집중하여 안전 개념을 이해하고 이를 기반으로 하지 못하는 문제점이 있습니다. 현재 Self-Supervised Learning 접근 방식은 JEPA(Joint Embedding Predictive Architecture)를 활용해 고차원 표현을 학습하는데 흥미롭고 효과적인 대안입니다. 이 아이디어는 인간의 뇌가 상상력과 최소한의 관찰 샘플만으로 새로운 기술을 습득하는 자연스러운 능력을 모방하고 있습니다. 본 연구에서는 JEPA를 기반으로 한 세계 모델인 하노이월드(Hanoi-World)를 소개하며, 이는 재귀 신경망(RNN)을 활용해 효과적인 추론 시간과 함께 장기 수평 계획을 수행할 수 있게 합니다. 실험은 차이점 환경의 Highway-Env 패키지에서 이루어졌으며, SOTA 기준선들과 비교했을 때 충돌률이 상당히 감소하면서 안전 인식을 가진 운전 계획을 만드는 능력을 효과적으로 보여주고 있습니다.

paper AI 요약
하이퍼클로바 X 8B 옴니

하이퍼클로바 X 8B 옴니

HyperCLOVA X 8B Omni(OMNI)는 텍스트, 음성, 비전 모달을 모두 입력과 출력으로 지원하는 다중모달 모델입니다. 이 모델은 하나의 디코더-온리 Transformer 백본에서 다양한 모달의 토큰과 임베딩을 교차로 처리하여 의미적 구성이 가능하게 설계되었습니다. OMNI는 다양한 입력 및 출력 모달에 걸친 경쟁력 있는 성능으로, 특히 한글과 영어를 다루는 데 강점을 가지고 있습니다.

paper AI 요약
학술위장의 숨겨진 진실 풀어내기

학술위장의 숨겨진 진실 풀어내기

최근 인공지능(AI) 기술의 발전에 따라 생성형 AI와 그 응용 분야에 대한 관심이 증가하고 있습니다. 이로 인해 다양한 AI 기반 콘텐츠/텍스트 생성 도구들이 개발되었습니다. 하지만 이러한 도구들은 비윤리적으로 사용될 경우 교육 목표 달성에 악영향을 끼칠 수 있으며, 공공 안전과 정부의 신뢰에도 영향을 줄 수 있습니다. 본 논문에서는 AI 기반 텍스트 생성 도구를 감지하고 분석하기 위한 스타일로미트리(stylometry) 방법론을 제안합니다. 이 방법론은 단일 저자와 다중 저자가 작성한 문서를 구분하거나, AI가 생성한 텍스트와 인간이 생성한 텍스트를 구별하는 등의 작업에 활용될 수 있습니다.

paper AI 요약
한 샷으로 안전 보장  단 하나의 예제로 모델 교정하기

한 샷으로 안전 보장 단 하나의 예제로 모델 교정하기

대규모 언어 모델(LLMs)의 널리 퍼진 사용은 기만, 폭력 및 차별과 같은 유해한 콘텐츠 생성 가능성에 대한 우려를 제기했습니다. 이를 해결하기 위해 안전 정합성이 핵심 패러다임으로 부상했으며, 이를 위한 일반적인 접근 방식은 감독 조정(SFT) 및 인간 피드백 기반 강화학습(RLHF), 직접적 선호도 최적화(DPO) 등입니다. 그러나 사용자가 제공한 데이터를 조정 파이프라인에 도입하면 새로운 보안 취약성이 발생합니다. 이를 해결하기 위해, 본 논문은 한 번의 안전 업데이트만으로도 유해한 업데이트를 중화시킬 수 있다는 것을 밝히며, 이 방법을 통해 모델의 안전성을 복원할 수 있음을 보여줍니다.

paper AI 요약
해내FRDM  확산 모델로 고속 영상의 결함 복원 탐색

해내FRDM 확산 모델로 고속 영상의 결함 복원 탐색

이 논문에서는 딥러닝 기반의 확산 모델을 사용하여 고해상도 필름 복원 작업에서 발생하는 문제점을 해결하고자 한다. 특히, 제안된 HaineiFRDM 모델은 낮은 VRAM 장치에서도 작동할 수 있도록 설계되었으며, 패치 기반 학습 및 추론 프레임워크를 사용하여 고해상도 복원 작업의 계산 비용을 줄이고자 한다. 또한 실제 손상된 필름과 합성 데이터로 구성된 새로운 데이터셋을 제안하여 모델 성능 평가 기준을 제공한다.

paper AI 요약
No Image

해석 가능성 지향적 이목표 최적화 정확성과 설명 가능성을 맞춤

딥러닝 모델은 의료와 금융 분야에서 시퀀스 예측 작업에 뛰어난 성과를 보여주지만, 그 복잡성으로 인해 이해하기 어려운 블랙박스 가 되어 안전성이 중요한 상황에서는 신뢰성이 낮아진다. 본 논문은 학습 과정에서 해석 가능성을 통합하는 프레임워크 **IGBO(Interpretability-Guided Bi-objective Optimization)**을 제안한다. IGBO는 주요 작업 손실과 해석 가능성 손실을 최소화하는 두 가지 목표를 동시에 추구하며, 이를 위해 데이터 분포에 맞춘 통합 경로를 생성하는 최적 경로 오라클도 도입한다.

paper AI 요약
혁신의 눈  오픈노벨티

혁신의 눈 오픈노벨티

최근 몇 년 동안 학술 출판물이 급증하고 있다. 인공지능 분야만 보더라도 arXiv의 `cs.AI`와 `cs.LG` 카테고리에 매년 수만 편의 새로운 논문이 게재되고 있으며, NeurIPS, ICLR, ICML과 같은 상위 컨퍼런스로 제출되는 논문 수도 기록적인 수준을 보이고 있다. 이 출판 폭발 은 피어 리뷰 시스템에 전례 없는 압력을 가하고 있다. 리뷰어의 부담이 크게 증가했다. 한 명의 리뷰어는 한정된 시간 내에 여러 편의 논문을 평가해야 하는데, 각 리뷰에는 해당 분야의 최신 연구를 포괄적으로 이해하는 것이 요구된다. 하지만 현실은 달라서 많은 리뷰어들이 모든 제출 논문에 대한 철저하고 공정한 평가를 하지 못한다. 심지어 일부 리뷰어는 전체 텍스트를 신중하게 읽지 않고 피드백을 제공하기도 한다. 또한 학계에서는 AI 생성된 피드백을 적절히 검증하지 않고 사용하는 문제에 대해 점점 더 우려하고 있다. 평가 차원 중 하나인 **신규성**은 논문의 수용 여부를 결정하는 중요한 요소로 여겨진다. 그러나 신규성을 정확하게 평가하기는 어렵다. 이는 문헌 규모가 매우 크고, 세밀한 분석을 통해 주장을 검증하는 것이 어려우며, 리뷰어들의 판단에 주관성이 있기 때문이다. 대형 언어 모델(LLM)은 학술 논문 검토를 돕는 유망한 방향으로 부상하고 있지만, 기존 방법에는 한계가 있다 단순 LLM 기반 접근법은 매개변수적 지식에만 의존하면 존재하지 않는 참조를 생성할 수 있으며; 기존의 RAG 기반 방법은 제목과 초록만 비교하기 때문에 중요한 기술 세부 사항을 놓칠 수 있고; 대부분의 접근법은 문맥 창의 한계로 인해 관련 작업을 체계적으로 조직하지 못한다. 이러한 문제를 해결하기 위해 **<span class= smallcaps >OpenNovelty</span>**라는 LLM 기반 시스템을 제안한다. 이 시스템은 대규모 제출물에 대한 투명하고 검증 가능한 신규성 분석을 제공하도록 설계되었다. <span class= smallcaps >OpenNovelty</span>의 핵심 디자인 철학은 ** 신규성을 검증할 수 있게 하기 **이다 > *“우리는 LLM 내부의 매개변수적 지식에 의존하지 않고, 실제 논문을 찾아 신규성 주장 수준에서 전체 텍스트를 비교함으로써 모든 판단이 증거 기반임을 보장합니다.”* <span class= smallcaps >OpenNovelty</span>은 네 단계의 프레임워크를 통해 작동한다 - **Phase I 정보 추출** — 대상 논문에서 핵심 작업과 주장한 신규성 주장을 추출하고, 이후 검색을 위한 의미적 쿼리를 생성합니다. - **Phase II 논문 검색** — 추출된 쿼리 기반으로 <span class= smallcaps >Wispaper</span>을 사용하여 관련 이전 작업을 검색하고 다층 필터링을 통해 고질량 후보를 선택합니다. - **Phase III 분석 및 종합** — 추출한 주장과 검색된 논문을 기반으로 상위 구조의 관련 작업 세분화를 구성하고 전체 텍스트 비교를 수행하여 각 신규성 주장을 검증합니다. - **Phase IV 보고서 생성** — 모든 분석 결과를 명확한 인용 및 증거 조각과 함께 구조화된 신규성 보고서로 종합하며, 모든 판단이 검증 가능하고 추적 가능하도록 합니다. 각 단계의 기술적 세부 사항은 Section 2에서 제공됩니다. 또한 우리는 <span class= smallcaps >OpenNovelty</span>을 ICLR 2026에 제출된 500개 이상의 논문 분석에 배포했으며, 모든 신규성 보고서는 우리 웹사이트에서 공개적으로 이용 가능합니다. 예비 분석 결과 시스템이 관련 이전 작업, 특히 저자들이 놓칠 수 있는 유사한 논문을 식별할 수 있음을 나타냅니다. 우리는 이후 단계에서 이 분석을 2,000개 이상의 제출물로 확장할 계획입니다. 주요 기여는 다음과 같습니다 - 모든 평가를 추출된 실제 논문에 근거하며, 각 판단은 명확한 인용과 증거 조각으로 보완되어 단순 LLM 기반 접근법에서 발생하는 환영 문제를 효과적으로 피한다. - <span class= smallcaps >OpenNovelty</span>을 ICLR 2026에 제출된 논문 500개 이상에 배포하고, 모든 보고서를 우리 웹사이트에 공개하여 연구 커뮤니티에게 접근 가능한 투명한 신규성 분석을 제공한다.

paper AI 요약
형성평가, 석유 지질학을 위한 공개 선택식 문제은행

형성평가, 석유 지질학을 위한 공개 선택식 문제은행

대형 언어 모델(LLMs)이 과학 및 공학 분야의 전문적인 작업에 점점 더 많이 적용되고 있지만, 이러한 모델들이 특정 분야에서 얼마나 효과적으로 작동하는지 평가하기는 여전히 어려움이 있습니다. 일반적인 벤치마크인 MMLU는 광범위한 지식을 다루지만 전문 분야에 대한 집중적 평가는 제한적입니다. 석유 지질학과 지하시공 엔지니어링(심화 측정 물리학, 유전 특성화, 지질 해석 등 이해가 필요한 분야)에서 공개적으로 이용 가능한 벤치마크는 여전히 제한적입니다. 이 연구는 FormationEval이라는 505문항의 다중 선택형 질문 벤치마크를 통해 이러한 간극을 메우며, 이 벤치마크는 페트로물리학, 석유 지질학, 지구 물리학, 유전 공학, 침적학, 심층 공학 및 생산 공학 등 7개 영역을 다룹니다. 질문은 권위 있는 교과서와 개방형 강의 자료를 기반으로 개념 중심 방식을 사용하여 작성되며, 이는 문구 인식이 아닌 이해도를 테스트하며 저작권 제약을 준수합니다. 주요 기여는 다음과 같습니다 1) 기술적 출처에서 다중 선택형 질문(MCQs) 생성 방법론; 2) 출처 메타데이터와 오염 위험 레이블이 포함된 정제 데이터 세트; 그리고 3) 여러 제공업체의 72개 언어 모델에 대한 평가, 이를 통해 도메인과 난이도 수준별 성능 패턴을 파악할 수 있습니다.

paper AI 요약
효율적인 시간 시리즈 예측을 위한 로우 랭크 신경ODE로 강화된 Mamba 모델

효율적인 시간 시리즈 예측을 위한 로우 랭크 신경ODE로 강화된 Mamba 모델

시간 시리즈 예측은 기계 학습과 통계에서 중요한 작업으로, 금융, 의료, 기후 모델링 등 다양한 실제 세계의 응용 프로그램을 지원합니다. 시간 시리즈 예측은 비선형 동역학, 장기 종속성 및 불규칙한 샘플링 패턴과 같은 복잡한 데이터 특성을 처리해야 하므로 여전히 어려움이 있습니다. 본 논문에서는 이러한 문제들을 해결하기 위해 Mamba 구조와 저순위 근사화를 통합하는 새로운 프레임워크인 MODE를 제안합니다.

paper AI 요약
흐름에 따른 세계 모델  기억이 더해진 동적 환경 이해

흐름에 따른 세계 모델 기억이 더해진 동적 환경 이해

이 논문은 부분적으로 관찰되는 동적 환경 모델링과 이를 수행하는 에이전트의 자체 움직임을 연구합니다. 특히, 내부와 외부 움직임을 수학적인 흐름 으로 이해하고, 이를 통해 시간에 따른 대칭성을 처리할 수 있음을 보여줍니다. 이러한 접근법은 비록 에이전트의 시야가 제한적이지만 환경의 전체적인 상태를 정확하게 추적하는 데 도움을 줍니다. ###

paper AI 요약
희소 위협, 집중 방어  안전 자율주행을 위한 중요도 인식 강화학습

희소 위협, 집중 방어 안전 자율주행을 위한 중요도 인식 강화학습

강화학습(RL)은 자율주행(AD)에서 상당한 잠재력을 보여주었지만, 그 취약성이 실제 배포에 있어 중요한 장애물로 작용하고 있다. 주요 대응책으로서 적대적 훈련은 악의적으로 변동을 도입하는 대립자와 함께 AD 에이전트를 훈련시켜 정책의 강건성을 개선한다. 기존 접근 방식들은 일반적으로 연속적인 공격을 포함한 영합 게임으로 상호 작용을 모델링하지만, 이러한 설계는 에이전트와 대립자 간의 내재된 비대칭성과 안전에 중점을 둔 위험이 희박하다는 점을 무시하여 실제 AD 시나리오에서 충분한 강건성을 제공하지 못한다. 이러한 제약점을 해결하기 위해 우리는 CARRL(Criticality-aware Robust RL), 즉 자율주행에서 희박하고 안전에 중점을 둔 위험을 관리하는 새로운 적대적 훈련 접근법을 도입한다. CARRL은 위험노출 대립자(REA)와 위험타겟 강건 에이전트(RTRA)라는 두 가지 상호작용 요소로 구성된다. REA와 RTRA 간의 상호 작용은 일반 합 게임으로 모델링되어, REA는 안전에 중점을 둔 실패(예 충돌)를 노출하는 데 집중하고, RTRA는 안전과 주행 효율성을 균형 있게 배분하도록 학습한다. REA는 제약된 예산 하에서 희박한 안전 위험을 더 잘 식별하고 활용하기 위해 분리된 최적화 메커니즘을 사용한다. 그러나 이러한 집중적인 공격은 적대 데이터의 부족으로 이어진다. RTRA는 양호한 경험과 적대적 경험이 결합된 복수 재생 버퍼를 통해 그러한 데이터 부족을 극복하고, 변동 하에서 정책 일관성을 강제하여 행동을 안정화한다. 실험 결과는 우리의 접근법이 최신 베이스라인 방법보다 모든 사례에서 충돌률을 적어도 22.66% 줄일 수 있음을 보여준다.

paper AI 요약

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키