게시글

모든 게시글 목록입니다. 최신순으로 정렬되어 있습니다.

총 301개의 게시글
총 7페이지
기계를 위한 코드, 인간만을 위한 것이 아니라  코드 헬스 메트릭으로 AI 친화성을 측정하기

기계를 위한 코드, 인간만을 위한 것이 아니라 코드 헬스 메트릭으로 AI 친화성을 측정하기

AI가 코드를 이해하고 개선하는 데 있어, 인간이 읽기 쉬운 코드는 어떻게 도움을 줄 수 있을까? 본 논문은 CodeHealth 지표를 사용하여 AI 친화적인 코드 디자인이 더 나은 결과를 내는지 분석한다. 또한, Perplexity와 Source Lines of Code(SLOC)와 비교해보며, 인간이 이해하기 쉬운 코드가 실제로 AI에게도 더 친근한지 확인한다.

paper AI 요약
기하학적 및 양자 커널 방법을 활용한 만성 폐쇄성 폐질환의 골격근 예측 방법론 연구

기하학적 및 양자 커널 방법을 활용한 만성 폐쇄성 폐질환의 골격근 예측 방법론 연구

골격근 기능 장애는 만성 폐쇄성 폐질환(COPD)의 임상적으로 중요한 폐외 증상이며 체내 및 기도 염증과 밀접하게 연관되어 있습니다. 이를 바탕으로 최소 침습적 생물학적 표지자로부터 근육 결과를 예측하는 모델링을 실시하고자 합니다. 본 연구에서는 총 213마리의 동물을 대상으로 가짜 수술과 담배 연기 노출 조건을 비교한 사전 임상 데이터셋을 분석하였습니다. 이는 혈액 및 기관지알ве올라세척액 측정치와 함께 근육중량(mg), 특이력(mN), 근질 지수(mN/mg)라는 세 가지 연속 목표를 포함하고 있습니다. 연구에서는 조정된 전통적 베이스라인, 기하학을 인식하는 대칭 양의 결정체(SPD) 설명자와 Stein 발산량, 그리고 저차원 표형 데이터를 위한 양자 커널 모델들을 평가하였습니다. 근육중량 설정에서, 혈액 C-반응 단백질, 호중구 수치, 기관지알베올라세척액 세포도, 조건을 포함한 네 가지 해석 가능한 입력을 사용하는 양자 커널 리지 회귀는 테스트 루트 평균 제곱 오차 4.41mg과 결정 계수 0.605를 달성하였으며 동일 특징 집합에서 대응되는 리지 베이스라인(4.70mg 및 0.553)보다 향상되었습니다. 기하학적 정보를 포함한 Stein 발산량 프로토타입 거리는 생물학적 표지자만을 사용하는 설정에서 더 작은 그러나 일관된 개선(4.55mg 대비 4.79mg)을 보였습니다. 연속 결과를 훈련 가짜 수술 평균의 0.8배로 임계값 설정한 스크리닝 평가에서는 근육중량이 낮은 상태를 탐지하는 수신자 작동 특성 곡선(AUC-ROC) 최대 값까지 0.90을 달성하였습니다. 이러한 결과는 저데이터, 저특징 생물의학 예측 문제에서 기하학적 및 양자 커널 향상이 해석 가능성과 투명한 모델 선택을 유지하면서 측정 가능한 이점을 제공할 수 있음을 나타냅니다.

paper AI 요약
긴 법적 문서를 짧은 무작위 조각으로 분류하기

긴 법적 문서를 짧은 무작위 조각으로 분류하기

법적 문서 분류는 전문 용어뿐만 아니라 때때로 매우 긴 문서가 될 수 있어挑战组合中的中文被错误地包含进去了。以下是符合要求的日韩翻译: 법적 문서를 분류하는 것은 전문적인 어휘 외에도 종종 매우 긴 문서라는 점에서 과제입니다. 이는 전체 문서를 변형 모델 기반의 분류 모델에 입력하는 것이 불가능하거나 비용이 많이 들거나 느릴 수 있다는 것을 의미합니다. 따라서 본 논문에서는 48개의 임의로 선택된 짧은 조각(max 128 토큰)을 입력으로 사용하는 DeBERTa V3와 LSTM을 기반으로 한 법적 문서 분류기를 제시합니다. 또한 지속 가능한 실행 솔루션인 Temporal을 사용한 배포 파이프라인도 제시하여 신뢰성 있고 견고한 처리 워크플로를 확보할 수 있습니다. 최상의 모델은 가중치 F 점수 0.898을 기록했으며, CPU에서 작동하는 파이프라인의 처리 중앙값 시간은 100개 파일당 498초였습니다.

paper AI 요약
길이 인식 샘플링으로 더 안정적인 트래젝토리 생성 모델

길이 인식 샘플링으로 더 안정적인 트래젝토리 생성 모델

이 논문은 다양한 영역에서 시뮬레이션과 역사적 분석을 위한 실제적인 경로와 순서 모델 학습의 중요성을 강조한다. 특히, 이동성 분석, 추천 시스템, 교육 분야에서의 순차적인 결정 로그 등에서 길이가 다양한 트래JECTORY를 처리하는 데에 어려움이 있다. 이러한 문제를 해결하기 위해 제안된 방법은 길이 인식 샘플링(LAS) 기법으로, 이는 미니배치 내의 길이 다양성을 통제하고 생성자/판별자의 업데이트를 더 일관되게 만드는 트레이닝 시 개입이다. 또한, LAS와 조건부 트래JECTORY GAN 및 보조 시간 정렬 손실을 결합하여 트래JECTORY 데이터용 디지털 트윈을 구축한다.

paper AI 요약
No Image

깊은 계층 모델을 배우는 신경망 레이어별로 어떻게 학습할까?

본 논문에서는 $n$개의 레이블을 갖는 감독 학습을 고려하고 잔차 네트워크에서 계층별 SGD가 효율적으로 특정 계층 모델을 학습할 수 있음을 보여줍니다. 이 모델 클래스는 알려지지 않은 레이블 계층 $L_1 subseteq L_2 subseteq dots subseteq L_r = [n]$의 존재를 가정합니다. 여기서 $L_1$에 속한 레이블들은 입력의 간단한 함수이며, $i > 1$인 경우 $L_i$에 속한 레이블들은 더 간단한 레이블들의 간단한 함수입니다. 이러한 클래스는 깊은 학습 알고리즘으로 학습할 수 있음이 이전에 입증된 모델들보다 더 넓은 범위를 포함하며, 효율적인 학습 가능성을 도달하는 깊이 한계를 설정합니다. 즉, 해당 클래스에는 다항식 깊이가 필요한 표현을 요구하는 모델들이 있으며 이전의 모델들은 로그 깊이 회로에서 계산될 수 있습니다. 또한 이러한 계층 모델들의 학습 가능성은 깊은 학습을 이해하기 위한 기반으로 될 수 있음을 제안합니다. 깊은 학습이 뛰어난 성능을 보이는 도메인에서의 자연스러운 적합성뿐만 아니라 인간 교사 의 존재는 계층 구조가 본질적으로 가능하다는 가설을 지지한다고 주장합니다. 교사는 세밀한 레이블을 제공함으로써 두뇌가 사용하는 내부 알고리즘의 힌트 또는 스니펫 을 드러내는데 효과적입니다. 이 직관성을 형식화하여 교사가 부분적으로 자신의 내부 논리를 인식하는 간략한 모델에서 계층 구조가 효율적인 학습 가능성을 촉진시키는 방식으로 나타남을 보여줍니다.

paper AI 요약
노래봇  감성 가창 로봇얼굴의 새로운 시대

노래봇 감성 가창 로봇얼굴의 새로운 시대

이 논문은 로봇의 노래를 표현하는 방법을 제안하며, 이는 인간의 감정과 행동을 모방하는 중요한 기준이다. 특히, 데이터 주도적인 접근법을 사용하여 가수의 감정과 리듬에 맞춰 로봇의 얼굴 표정을 동기화시키는 데 중점을 두었다. 이를 통해 로봇은 노래하면서 자연스러운 입동작과 감정 표현을 할 수 있다.

paper AI 요약
놀라움과 은유 신선도 판단  대규모 데이터 기반 분석을 통한 중등도 상관 및 효과 차이

놀라움과 은유 신선도 판단 대규모 데이터 기반 분석을 통한 중등도 상관 및 효과 차이

최근 언어 모델링의 발전은 전통적인 자연어 처리 시스템에서 어려웠던 언어 창조성 연구에 대한 새로운 관심을 불러일으켰다. 이 논문에서는 기존과 신규 메타포 사이의 차이점을 탐구하고, 언어 모델(LM)을 사용하여 메타포의 창조성을 측정하는 방법을 제안한다. 특히, LM에서 계산된 surprisal 점수와 메타포 창조성 간의 상관관계를 분석하며, 이를 통해 신규 메타포와 기존 메타포 사이의 차이점을 구분할 수 있는 새로운 방법을 제시한다.

paper AI 요약
No Image

다중 기능 지능 표면이 도와주는 효율적인 네트워크 설계

(이 논문에서는 다중 기능 지능형 표면(MF-RIS)을 사용하여 하향 링크 NOMA 네트워크의 에너지 효율을 높이는 방법에 대해 연구합니다. MF-RIS는 신호 반사, 전송, 증폭 및 무선 에너지를 수확하는 기능을 결합하고 있습니다. 이를 통해 시스템의 에너지 효율과 배치 유연성을 향상시킵니다. 또한 하이브리드 딥 강화 학습(DRL) 기법을 이용하여 복잡한 연속-이산 행동 공간에서 적응적인 정책 학습을 구현합니다.)

paper AI 요약
다중 에이전트 AI 워크플로우의 시간적 공격 패턴 감지  추적 기반 보안 모델 훈련을 위한 오픈 프레임워크

다중 에이전트 AI 워크플로우의 시간적 공격 패턴 감지 추적 기반 보안 모델 훈련을 위한 오픈 프레임워크

본 논문은 에이전트 워크플로의 보안성을 평가하는 첫 번째 공개된 방법론을 제시합니다. 이 방법론은 합성 OpenTelemetry 추적 생성, 데이터셋 구축, 훈련 구성 및 재현 가능한 평가 프로토콜을 포함하며, 에이전트 워크플로의 보안성을 향상시키는 데 중점을 두고 있습니다.

paper AI 요약
다중 에이전트 AI에 인간의 반공모 메커니즘 매핑

다중 에이전트 AI에 인간의 반공모 메커니즘 매핑

다중 에이전트 AI 시스템이 점점 더 자율성을 띠면서, 이들이 인간 시장과 기관에서 오랜 시간 동안 관찰되어온 공모 전략을 개발할 수 있다는 증거가 나타나고 있습니다. 인간 영역에서는 세기동안의 반공모 메커니즘이 축적되어 있지만, 이러한 메커니즘들을 AI 환경에 어떻게 적용할 수 있는지 여전히 명확하지 않습니다. 이 논문은 (i) 제재, 관대주의 및 고발, 감시와 심사, 시장 설계, 그리고 통치를 포함한 인간의 반공모 메커니즘의 분류 개발과 (ii) 이러한 메커니즘들을 다중 에이전트 AI 시스템에 대한 잠재적 개입으로 매핑하는 문제점을 해결하고자 합니다. 각 메커니즘에 대해 구현 방법을 제안합니다. 또한, 특정 에이전트에게 일어난 조정을 귀속시키는 어려움, 에이전트의 쉽게 분할 또는 수정 가능성, 협력과 공모를 구분하는 문제, 그리고 적응적 감지 회피 학습 등 열린 과제들을 강조하고 있습니다.

paper AI 요약
다중 에이전트 강화학습에서의 이질성

다중 에이전트 강화학습에서의 이질성

이 논문에서는 다중 에이전트 강화 학습(MARL)에서 상이성을 활용하는 방법을 제안하고, 이를 실용적으로 적용하기 위한 알고리즘을 개발한다. 제안된 HetDPS(Heterogeneity-based Dynamic Parameter Sharing) 알고리는 에이전트 간의 상이성을 정량화하여 파라미터 공유 방식을 동적으로 조정하며, 이를 통해 더 나은 해석 가능성과 적응력을 제공한다.

paper AI 요약
다차원 프롬프트 체이닝으로 대화 질 끌어올리기

다차원 프롬프트 체이닝으로 대화 질 끌어올리기

대형 언어 모델(LLMs)은 자연어 처리를 혁신적으로 발전시켰지만, 이로 인해 필요한 컴퓨팅 자원이 많이 필요합니다. 본 논문에서는 작은 규모의 언어 모델(SLMs)을 사용하여 대형 모델과 동등한 수준의 대화 품질을 달성하기 위한 새로운 다차원 프롬프트 체이닝 프레임워크를 제안합니다. 이 프레임워크는 생성된 응답의 맥락적 일관성, 자연스러움, 그리고 매력성을 각각 개선하는 세 가지 단계로 구성됩니다.

paper AI 요약
단계별 심장 박동 듣기  생리학적 단계 인식 ECG 바이오메트리кс

단계별 심장 박동 듣기 생리학적 단계 인식 ECG 바이오메트리кс

이 논문은 IEEE에 출판을 위해 제출되었으며, 저작권 이전 후에는 이 버전이 더 이상 접근할 수 없을 수도 있음을 알립니다. 본 연구는 중국 국립자연과학연구재단의 지원을 받았습니다 (지원번호 62466038); 또한 Jiangxi 주 키 라벨러 이미지 처리 및 패턴 인식 연구소에서 지원받았으며, 그 외에도 Nanchang 항공대학교 정보센터의 고성능 컴퓨팅 서비스를 이용하였습니다. *(대응 저자 Lu Leng과 Ziyuan Yang*)

paper AI 요약
No Image

대규모 실증적 사례 연구 AI 레드팀 테스트를 위한 Go-Explore 적응

(이 논문에서는 Go-Explore 알고리즘을 사용하여 LLM 에이전트의 안전성을 테스트하고, 무작위 시드 변동성이 알고리즘 선택보다 큰 영향을 미친다는 것을 보여줍니다. 또한, 악성 공격 탐지에 대한 다중 에이전트 조합 전략이 공격 유형 다양화를 제공한다는 점도 확인했습니다.)

paper AI 요약
대량 분석의 미래  질량 스펙트럼에서 구조 예측

대량 분석의 미래 질량 스펙트럼에서 구조 예측

액체 크로마토그라피 질량 분석법(LC-MS)을 기반으로 한 대사물질omics와 노출omics는 생물학적 샘플 내에서 감지 가능한 작은 분자들을 측정하는 것을 목표로 합니다. 이러한 결과는 대사 변화 및 질병 메커니즘에 대한 가설 생성 발견을 용이하게 하고, 환경 노출과 그들이 인간 건강에 미치는 영향에 대한 정보를 제공합니다. 대사물질omics와 노출omics는 LC의 높은 해상도 및 MS의 높은 질량 측정 정확도 덕분에 가능해졌습니다. 하지만, 이러한 연구에서 대부분의 신호들은 기존 스펙트럼 라이브러리가 LC-MS/MS로 포착된 광범위한 화학 공간을 거의 다 커버하지 못하기 때문에 전통적인 라이브러리 검색을 통해 식별하거나 주석하기 어렵습니다. 이러한 도전과제를 해결하고 대사물질omics와 노출omics의 전체 잠재력을 발휘하기 위해, 단일 질량 스펙트럼을 기반으로 화합물을 예측하는 여러 계산적 접근법이 개발되었습니다. 이러한 접근법들에 대한 출판된 평가는 다른 데이터셋과 평가를 사용했습니다. 실제 응용 프로그램을 위한 예측 워크플로우를 선택하고 더 나아갈 방향을 식별하기 위해, 최신 예측 알고리즘의 체계적인 평가를 수행하였습니다. 특히, 다양한 유형의 부가물에 대한 공식 예측 및 구조 예측의 정확도를 평가했습니다. 이로 인해 실제 성능 기준을 설정하고, 중요한 병목 현상을 식별하며, MS 기반 화합물 예측을 향상시키는 데 도움이 되는 지침을 제공하였습니다.

paper AI 요약
대형 언어 모델로 자동 이슈 할당 혁신

대형 언어 모델로 자동 이슈 할당 혁신

본 논문에서는 소프트웨어 개발 프로젝트에서 이슈 할당의 중요성과 그 과정에 대한 문제점을 다룹니다. 특히 수동 할당이 비효율적이며, 시간을 많이 잡아먹는다는 점을 강조합니다. 이를 해결하기 위해 LLM 기반의 자동화된 이슈 할당 방법론인 LIA(Large Language Model-based Issue Assignment)를 소개하며, 이 방법론은 텍스트 기반과 그래프 기반 방법론들의 한계점을 극복할 수 있는 가능성을 제시합니다. 본 연구에서는 두 개의 대규모 오픈소스 프로젝트 데이터셋(EclipseJDT와 Mozilla)을 사용하여 LIA가 기존 방법론들보다 우수한 성능을 보이는 것을 입증하였습니다. ###

paper AI 요약
대형 언어 모델로 측정하는 온라인 편향 분석

대형 언어 모델로 측정하는 온라인 편향 분석

(대규모 언어 모델(LLM)을 이용해 사회적 매체에서 발생하는 감정적 극단화를 측정하는 새로운 방법론을 소개합니다. 본 논문에서는 기존의 감성 분석에 대비하여 LLM이 제공하는 맥락 이해와 텍스트 분류 능력을 활용하여 주제별 입장, 감정 표현, 그리고 합의 수준을 추출하는 프레임워크를 제안합니다. 이를 통해 사회적 매체에서 발생하는 감정적 극단화를 더 정교하게 측량하고 이해할 수 있습니다.)

paper AI 요약
대형 언어 모델을 이용한 범주형 데이터 클러스터링의 의미적 간극 해소

대형 언어 모델을 이용한 범주형 데이터 클러스터링의 의미적 간극 해소

범주형 데이터는 의료, 마케팅, 바이오정보학과 같은 분야에서 패턴 발견의 기본 도구로 클러스터링을 사용합니다. 범주형 데이터 클러스터링의 핵심 과제 중 하나는 내재적인 순서나 거리가 없는 속성 값 간의 유사성을 측정하는 것입니다. 적절한 유사성 지표 없이 값을 등거리로 취급하면 의미론적 격차가 발생하여 잠재 구조를 가리고 클러스터링 품질을 저하시킵니다. 기존 방법들은 데이터셋 내에서의 공발생 패턴으로부터 값 간 관계를 추론하지만, 샘플이 제한적일 때 이러한 추론은 신뢰할 수 없게 되어 데이터의 의미론적 맥락이 충분히 탐색되지 않습니다. 이 격차를 메우기 위해 우리는 ARISE(Attention-weighted Representation with Integrated Semantic Embeddings)를 제시합니다. ARISE는 대형 언어 모델(LLMs)로부터 외부 의미론적 지식을 끌어와 범주형 데이터의 거리 공간을 보완하는 의미론 인식 표현을 구성하여 정확한 클러스터링을 실현합니다. 즉, LLM은 표현 강화를 위해 속성 값을 설명하고, LLM으로 향상된 임베딩은 원래 데이터와 결합되어 의미론적으로 중요한 클러스터를 탐색합니다. 8개의 벤치마크 데이터셋에 대한 실험에서 ARISE는 대표적인 일곱 가지 방법보다 19-27% 향상된 성능을 보여주며, 코드는 https //github.com/develop-yang/ARISE에서 이용 가능합니다.

paper AI 요약
대형 언어 모델의 공모 행위

대형 언어 모델의 공모 행위

알고리즘의 상업적 의사결정에 대한 신속한 채택은 점점 더 많은 규제 감시를 받게 되었다. 연방거래위원회(FTC)와 법무부(DOJ)는 알고리즘 가격 결정 시스템이 명시적인 경쟁업체 간의 합의 없이 불법 공모를 가능하게 할 수 있다고 경고했다. 판매자가 대형 언어 모델(LLM)을 가격결정에 의존하는 것이 증가하면서 규제는 아직 이 영역을 다루지 못하고 있다. LLM들이 사전 훈련된 인간 지식을 기반으로 가격 결정 전략을 학습하기 때문에, 이런 모델이 경쟁 회사 간의 공모를 용이하게 할 위험이 있다.

paper AI 요약
대형 언어 모델의 자각 깨우침

대형 언어 모델의 자각 깨우침

대형 언어 모델에서 내성적 인식의 발현 본 연구는 대형 언어 모델이 그들의 내부 상태에 대해 반성할 수 있는지 조사합니다. 이러한 질문을 단순한 대화만으로는 답변하기 어렵습니다. 진정한 반성이 착각과 구별되기 때문입니다. 여기서 우리는 이 도전 과제를 해결하기 위해 모델의 활성화 상태에 알려진 개념들의 표현을 주입하고, 이러한 조작이 모델의 자기 보고된 상태에 미치는 영향을 측정합니다. 연구 결과, 특정 상황에서는 모델들이 주입된 개념의 존재를 인식하고 정확하게 식별할 수 있음을 발견했습니다. 모델들은 이전 내부 표현을 회상하는 일부 능력을 보여주며, 이를 원문 텍스트 입력과 구분할 수 있습니다. 가장 놀라운 결과는 일부 모델들이 자신의 출력과 인공적인 사전 채우기를 구분하기 위해 이전 의도를 회상하는 능력을 사용한다는 것입니다. 모든 실험에서 가장 우수한 모델인 Claude Opus 4 및 4.1이 일반적으로 최고 수준의 내성적 인식을 보여주지만, 각 모델 간의 경향은 복잡하고 후 훈련 전략에 민감합니다. 마지막으로 우리는 모델들이 명시적으로 자신의 내부 표현을 조절할 수 있는지 탐색했습니다. 결과는 개념에 대해 생각해보라 는 지시나 유인책이 있으면 모델들의 활성화 상태를 조정할 수 있다는 것을 나타냅니다. 전체적으로 우리의 결과는 현재 언어 모델들이 자신들의 내부 상태에 대한 기능적인 반성적 인식을 어느 정도 가지고 있음을 보여줍니다. 그러나 이러한 능력은 오늘날의 모델에서 매우 불안정하고 문맥에 크게 의존하며, 모델의 성능 개선을 통해 계속 발전할 수 있습니다.

paper AI 요약
대형 언어 모델의 주관적 텍스트 영역 식별 능력은?

대형 언어 모델의 주관적 텍스트 영역 식별 능력은?

텍스트 스패닝을 식별하는 것은 NLP의 여러 하류 작업에 중요하며, 이는 모델 설명 가능성에 기여합니다. 대부분의 스패닝 식별 접근 방법은 BERT와 같은 상대적으로 작은 사전 훈련된 언어 모델에 의존하지만, 최근 몇 가지 접근 방식은 대규모 언어 모델(LLMs)을 이 작업에 활용하였습니다. 현재의 연구는 명명된 엔터티 인식(NER)과 같이 명시적인 스패닝 식별에 집중한 반면, 주관적 스패닝 식별과 LLMs를 사용한 감성 기반 분석(ABSA) 작업은 충분히 탐구되지 않았습니다. 본 논문에서는 이 중요한 간극을 메꾸기 위해 세 가지 인기 있는 작업인 감성 분석, 모욕적 언어 식별 및 주장 검증에서 다양한 LLMs의 성능을 평가합니다. 우리는 지시 조정, 상황 학습, 사고 체인 등 여러 가지 LLM 전략을 탐구하였습니다. 우리의 결과는 텍스트 내의 기본적인 관계가 LLMs이 정확한 텍스트 스패닝을 식별하는 데 도움이 된다는 것을 나타냅니다.

paper AI 요약
데이터 복잡도로 모델 성능 예측, 새로운 방법론

데이터 복잡도로 모델 성능 예측, 새로운 방법론

딥러닝 모델은 컴퓨터 비전을 포함한 다양한 분야에서 널리 사용되고 있다. 모델 유도 과정에서는 주어진 데이터셋에 적합한 아키텍처를 선택하는 데 반복적인 시도와 오류 절차가 종종 필요하다. 이 절차는 시간이 많이 소요되고 자원을 많이 사용하며 자동화하기 어렵다. 이전 연구에서는 부분적 학습이나 복잡한 시뮬레이션을 활용해 성능 예측을 탐구하였으나, 이러한 방법들은 종종 큰 계산 부담을 필요로 하거나 일반화 능력이 부족하다는 문제가 있다. 본 논문에서는 이에 대한 대안적인 접근 방식을 제시한다 데이터셋과 집중된 딥 모델 구조를 이해함으로써 학습 전 모델 성능을 추정할 수 있는 가벼운 두 단계 프레임워크다. 첫 번째 단계에서는 데이터셋의 측정 가능한 속성 분석을 기반으로 베이스라인 예측을 수행하고, 두 번째 단계에서는 모델 아키텍처와 하이퍼파라미터 세부 정보에 대한 추가 정보를 활용해 추정치를 조정한다. 이 구성은 프레임워크가 다양한 데이터셋과 모델 유형을 초월하여 일반화할 수 있게 한다. 더불어, 예측을 위한 일부 기본 특성 - 예컨대 데이터셋 변동성 -는 모델 선택에 대한 실제적 지침을 제공하고 데이터 품질의 조기 지표로도 활용될 수 있다. 결과적으로 이 프레임워크는 단순히 모델 성능을 예측하는 데만 그치지 않고 아키텍처 선택을 안내하며, 필요한 전처리 절차를 통보하고 학습 시작 전에 문제 있는 데이터셋을 검출하는 데도 활용될 수 있다.

paper AI 요약
동적 대형 개념 모델  적응적 의미 공간에서의 잠재적 추론

동적 대형 개념 모델 적응적 의미 공간에서의 잠재적 추론

대형 언어 모델(Large Language Models, LLMs)은 자연어 처리에서 큰 성공을 거두었지만, 이들 모델은 모든 토큰에 동일한 계산을 적용하는 통상적인 가정을 가지고 있다. 본 논문에서는 이 제약을 벗어나, [[IMG_PROTECT_N]] 동적 대형 개념 모델(Dynamic Large Concept Model, DLCM)을 제안한다. DLCM은 토큰 수준의 예측에 필요한 계산량을 최소화하고, 정보 밀도가 높은 부분에 더 많은 계산 자원을 할당함으로써 효율성을 극대화한다.

paper AI 요약
동적 모델 연합 그래프로 실시간 이상 감지

동적 모델 연합 그래프로 실시간 이상 감지

온라인 시간 시리즈 이상 감지는 데이터 포인트가 정상적인 시간 패턴에서 크게 벗어나는 것을 식별하는 작업입니다. 이 연구에서는 고주파수 데이터의 급증과 실시간 모니터링에 대한 요구 증대로 인해 오프라인 분석에서 온라인 처리로 주목이 이동했습니다. GDME(GRAPH 기반 시간 시리즈 이상 감지 모델 앙상블 프레임워크)은 이러한 문제를 해결하기 위해 그래프 구조와 커뮤니티 검출, 개념 유동성 탐지를 통합한 새로운 접근 방식을 제시합니다.

paper AI 요약
두단계 의사결정-표본 추측 가설  RL 트레이닝된 대형 언어 모델에서의 자반성의 등장 이해

두단계 의사결정-표본 추측 가설 RL 트레이닝된 대형 언어 모델에서의 자반성의 등장 이해

이 논문에서는 대형 언어 모델에서 자기 반성 능력이 어떻게 생겨나는지에 대한 이론적 해석을 제시합니다. 특히, 강화학습(RL) 훈련 과정에서 이러한 능력이 발달하는 메커니즘과 이를 기존의 감독 학습(SFT) 훈련과 어떻게 구별할 수 있는지에 대해 설명합니다.

paper AI 요약
드라이빙젠  자율주행의 미래를 그리다

드라이빙젠 자율주행의 미래를 그리다

비디오 생성 모델은 세계 모델의 한 형태로 AI에서 가장 흥미로운 분야 중 하나로 부상하고 있으며, 이는 복잡한 장면의 시간적 변화를 통해 미래를 상상할 수 있는 능력을 에이전트에게 제공합니다. 자율주행에서는 이러한 비전이 주행 세계 모델이라는 개념을 탄생시켰습니다 자신과 다른 에이전트의 미래를 상상하는 생성 시뮬레이터로, 이는 확장 가능한 시뮬레이션, 안전한 경계 사례 테스트 및 풍부한 합성 데이터 생성을 가능하게 합니다. 그럼에도 불구하고 빠르게 성장하고 있는 연구 활동에도 불구하고, 이 분야에는 진척을 측정하고 우선순위를 설정하는 엄격한 벤치마크가 부족합니다. 현재의 평가는 제약적입니다 일반적인 비디오 메트릭은 안전에 중요한 이미징 요소를 무시하며; 트레젝토리 가능성은 거의 측정되지 않으며; 시간적 및 에이전트 수준의 일관성은 간과되며; 그리고 자아 조건화에 대한 통제 가능성은 고려되지 않습니다. 또한 현재 데이터셋은 실제 세계 배치를 위해 필요한 다양성을 충분히 커버하지 못하고 있습니다. 이러한 격차를 해결하기 위해 우리는 첫 번째로 생성 주행 세계 모델을 위한 종합적인 벤치마크인 DrivingGen을 제시합니다. DrivingGen은 다양한 평가 데이터셋과 새로운 메트릭 스위트를 결합하며, 이는 시각적 실재성, 트레젝토리 가능성, 시간적 일관성 및 통제 가능성을 공동으로 평가합니다. 14개의 최신 모델을 벤치마킹한 결과 명확한 절충점이 드러났습니다 일반적인 모델은 더 잘 보이나 물리를 위반하고, 주행에 특화된 모델들은 움직임을 실제적으로 포착하지만 시각적 품질에서 뒤처집니다. DrivingGen은 신뢰할 수 있고 통제 가능하며 배포 가능한 주행 세계 모델을 육성하기 위한 통합 평가 프레임워크를 제공하여 확장 가능한 시뮬레이션, 계획 및 데이터 기반 의사결정을 가능하게 합니다.

paper AI 요약
드럼 반주 생성을 위한 세밀한 리듬 제어[DARC

드럼 반주 생성을 위한 세밀한 리듬 제어[DARC

최근에는 높은 품질의 음악적으로 일관된 보조 악기 생성이 이루어졌지만, 시간 변동 특성에 대한 세밀한 제어가 부족하다. 이 연구에서는 사용자가 리듬 프롬프트를 기록하면, 그것이 드럼으로 렌더링되는 Tap2Drum 작업을 집중적으로 다룬다. 우리의 모델 DARC는 음악적 맥락과 리듬 프롬프트를 입력으로 받아, 음악적 일관성과 리듬 프롬프트에 대한 충실도를 평가한다.

paper AI 요약
등록 슬롯과 대조적 정렬로 개선된 객체 중심 확산 학습

등록 슬롯과 대조적 정렬로 개선된 객체 중심 확산 학습

슬롯 어텐션(SA)과 사전 훈련된 확산 모델은 최근 객체 중심 학습(OCL)에 대한 잠재력을 보여주었지만, 슬롯 얽힘 및 객체 슬롯과 이미지 내용 간의 약한 정합성 문제를 겪고 있습니다. 저희는 Contrastive Object-centric Diffusion Alignment(CODA), 즉 간단한 확장 방법을 제안합니다. 이 방법은 (i) 잔여 어텐션을 흡수하고 객체 슬롯 사이의 간섭을 줄이기 위해 등록 슬롯을 사용하고, (ii) 슬롯-이미지 대응을 명시적으로 유도하기 위해 대조적 정합성 손실을 적용합니다. 결과적인 학습 목표는 슬롯과 입력 사이의 상호 정보(MI)를 최대화하는 실용적인 대체 방식으로 작동하여 슬롯 표현의 질을 강화합니다. 합성(MOVi-C/E) 및 실제 데이터셋(VOC, COCO) 모두에서 CODA는 객체 발견(예 COCO에서 +6.1% FG-ARI 증가), 속성 예측, 그리고 구성적 이미지 생성을 강력한 베이스라인보다 향상시킵니다. 등록 슬롯은 무리 없이 추가되므로 CODA는 효율적이며 확장 가능합니다. 이러한 결과는 복잡하고 실제 상황에서 견고한 OCL을 위한 효과적인 프레임워크로서 CODA의 잠재적 응용 가능성에 대한 증거를 제공합니다.

paper AI 요약
디지털 트윈 AI  대형 언어 모델에서 세계 모델까지의 기회와 과제

디지털 트윈 AI 대형 언어 모델에서 세계 모델까지의 기회와 과제

디지털 트윈은 물리적 시스템의 정확한 디지털 표현으로, 실제 세계와 양방향 연결을 유지하며 모니터링, 예측, 최적화 및 의사결정 지원을 가능하게 합니다. 이 기술은 의료, 도시 계획, 제조 등 다양한 분야에서 활용되고 있으며, 인공지능과의 통합으로 더욱 발전하고 있습니다. 디지털 트윈은 이제 단순한 모니터링 도구를 넘어 학습하고 예측하며 물리적 세계에 대한 행동을 취하는 지능형 에이전트로 진화하고 있습니다.

paper AI 요약
디지털 트윈 기반 통신 효율적인 연방 이상 감지 시스템 для 산업 IoT

디지털 트윈 기반 통신 효율적인 연방 이상 감지 시스템 для 산업 IoT

본 논문에서는 산업 인터넷_of_things(IIoT)에서 이상 감지에 대한 혼합 디지털 트윈 기반 연방 학습 프레임워크를 제안합니다. 제안된 방법은 시뮬레이션 데이터와 실제 데이터를 활용하여 강력한 전역 이상 감지 모델을 공동으로 훈련시키는 것을 목표로 하며, 이 과정에서 데이터 프라이버시를 보호하고 모델의 견고성을 높이는 동시에 통신 오버헤드를 최소화합니다.

paper AI 요약
디지털 피부과의 혁신 지도

디지털 피부과의 혁신 지도

인공지능의 피부과 분야 도입은 의료 접근성의 민주화를 약속하지만, 모델의 신뢰성이 이러한 모델을 구동하는 데이터의 품질과 포괄성에 따라 달라집니다. 공개적으로 이용 가능한 피부과 이미지의 빠른 증가에도 불구하고, 이 분야는 새로운 데이터셋이 임상적 범위를 확장시키는지 아니면 이미 알려진 내용을 단순히 재현하는지를 측정하기 위한 양적 성과 지표를 갖추고 있지 않습니다. 본 연구에서는 전체 데이터 기반에 대한 첫 번째 포괄적인 심사 프레임워크로 피부지도(SkinMap)를 제시합니다. 저희는 공개적으로 이용 가능한 피부과 데이터셋을 단일 쿼리 가능한 의미론적 아틀라스로 통합하여 피부 질환 이미지 110만 개 이상에 대한 정보적 신규성, 데이터셋 중복, 인구통계학 및 진단 간의 표현 격차를 정량화합니다. 데이터셋 크기의 지수적인 성장에도 불구하고 시간 경과에 따른 정보적 신규성은 어느 정도 정체 상태입니다 공선종양 같은 일부 클러스터는 밀집되어 있지만, 소수 피부 유형과 많은 희귀 질환은 여전히 다루어지지 않습니다. 저희는 더불어 커버리지 간의 구조적 격차를 식별합니다 피츠파트릭 V-VI 피부색을 가진 이미지는 5.8%에 불과하며, 소아 환자는 3.0%에 그치며 많은 희귀 질환과 형태 조합은 여전히 저밀도로 표현됩니다. 피부지도는 검증되지 않은 영역을 측정하고 임상적 공간의 미표현 지역으로 전략적인 데이터 수집을 유도하는 인프라를 제공합니다.

paper AI 요약
디코딩  의학적 질의응답에서 내용과 전달 분리하기

디코딩 의학적 질의응답에서 내용과 전달 분리하기

대형 언어 모델(LLMs)은 강력한 의학적 지식을 보유하고 사실적으로 정확한 답변을 생성할 수 있습니다. 그러나 기존의 모델들은 종종 개별 환자의 상황을 고려하지 못해 임상적으로는 맞지만 환자들의 요구와 잘 맞지 않는 답변을 제공하는 경향이 있습니다. 본 연구에서는 DeCode라는 훈련이 필요 없고 모델에 무관한 프레임워크를 소개합니다. 이 프레임워크는 기존 LLMs을 임상 환경에서 상황에 맞는 답변을 생성하도록 조정합니다. 우리는 OpenAI HealthBench, 즉 LLM 응답의 임상적 관련성과 유효성을 평가하기 위해 설계된 포괄적이면서도 어려운 벤치마크를 사용하여 DeCode를 평가했습니다. DeCode는 이전 최고 기록인 28.4%에서 49.8%로 성능을 향상시켰으며, 이는 상대적으로 75%의 개선입니다. 실험 결과는 LLMs의 임상적 질문에 대한 답변 품질을 개선하는 데 DeCode가 효과적임을 시사합니다.

paper AI 요약
레언캣  벤치마크로 본 카테고리 이론의 정식화

레언캣 벤치마크로 본 카테고리 이론의 정식화

이 논문에서는 대규모 언어 모델(LLM)과 에이전트 훈련을 활용한 형식적 정리 증명의 최근 발전을 다룹니다. 특히, 카테고리 이론 문제를 포함한 벤치마크 **LeanCat**을 제안하며, 현존하는 자동 증명기에 대한 평가 결과를 제공합니다. LeanCat은 카테고리 이론의 다양한 주제에 걸쳐 100개의 정리를 포함하며, 각 문제는 난이도 분류를 통해 Easy, Medium, High로 구분됩니다.

paper AI 요약
레이더 강수 예측, 실시간 학습으로 업그레이드!

레이더 강수 예측, 실시간 학습으로 업그레이드!

딥러닝의 급속한 발전으로 인해 데이터 주도형 기상 예측 방법이 특히 레이더 에코 외삽법(REE)을 통해 고해상도 강수 당일예보에 큰 관심을 받고 있습니다. 본 논문에서는 테스트 시점 학습(TTT)을 통합한 REE-TTT 모델을 제안합니다. 이 모델은 실시간 레이더 데이터를 기반으로 동적으로 특징 표현을 조정함으로써 다양한 기상 상황에 유연하게 대응할 수 있습니다.

paper AI 요약
로봇 팔과 눈의 완벽한 조화  선택 정책으로 실현

로봇 팔과 눈의 완벽한 조화 선택 정책으로 실현

인간형 로봇이 수행할 수 있는 복잡한 작업에 대해, 이 논문은 전체 몸통 조정과 적응적인 움직임을 통합하는 방법론을 제시한다. 특히, 학습 과정에서 다중 모드 행동을 포착하고 효율적으로 제어하기 위한 새로운 정책인 Choice Policy를 소개하며, 이는 신경망의 단일 순방향 패스로 빠른 추론을 가능하게 한다.

paper AI 요약
로직스-STEM  실패Driven 후속훈련과 문서지식 강화를 통한 LLM 추론 지원

로직스-STEM 실패Driven 후속훈련과 문서지식 강화를 통한 LLM 추론 지원

이 보고서에서는 추론 모델을 훈련시키는 데 필요한 데이터-알고리즘 공통 설계 엔진에 대해 이론적이고 공학적인 관점에서 다룹니다. 특히, 기존의 SFT-RL 파이프라인을 분포 일치 문제로 정식화하고 실패 중심 후 훈련 프레임워크를 설계하여 모델의 추론 능력을 개선하는 방법을 제안합니다.

paper AI 요약
루미나르크  일반 시각 생성 모델을 위한 훈련 없이 확률적으로 인증된 워터마rk 방법

루미나르크 일반 시각 생성 모델을 위한 훈련 없이 확률적으로 인증된 워터마rk 방법

컴퓨터 비전 분야의 디지털 콘텐츠 보호를 위해 워터마킹 기술이 오랫동안 사용되어 왔습니다. 그러나 AI 생성 미디어의 부상으로 인해 워터마킹의 중요성이 더욱 증가했습니다. Luminark는 신뢰할 수 있는 통계적 검출을 제공하고 다양한 이미지 변환에 대해 견고한 새로운 워터마킹 접근 방식입니다.

paper AI 요약
리소스 제약된 소매 판매 예측을 위한 LSTM 신경망 최적화  모델 압축 연구

리소스 제약된 소매 판매 예측을 위한 LSTM 신경망 최적화 모델 압축 연구

이 논문은 LSTM 압축을 통해 소매 판매 예측의 정확도를 향상시키는 방법을 연구했습니다. 특히, 128개 숨겨진 유닛에서 64개로 축소한 LSTM-64 모델이 가장 높은 성능을 보였으며, 이 모델은 기존보다 73% 더 작고 정확도는 47% 향상되었습니다. 이러한 결과는 소매업체가 제약된 컴퓨팅 자원에서도 효과적인 예측을 수행할 수 있게 해줍니다.

paper AI 요약

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키