게시글

모든 게시글 목록입니다. 최신순으로 정렬되어 있습니다.

총 301개의 게시글
총 7페이지
MACA  신뢰할 수 있는 대형 언어 모델을 효율적인 검색기로 추출하는 프레임워크

MACA 신뢰할 수 있는 대형 언어 모델을 효율적인 검색기로 추출하는 프레임워크

현대 기업 검색 시스템은 정확성과 지연 시간 사이의 균형을 유지하면서 해외 거래 수수료 환불 이나 최근 통장 상태 와 같은 부분적으로 명시된 사용자 질의를 처리해야 합니다. 이러한 질의는 주제, 하위 주제, 의도 또는 엔티티에 대한 중요한 세부 사항을 생략하는 경향이 있어 여러 후보 답변이 가능하게 됩니다. 이 논문에서는 메타데이터에 민감한 검색기인 MACA를 제안하며, 이를 통해 LLM 호출 없이 정확성과 지연 시간 간의 균형을 맞춥니다.

paper AI 요약
MentalGame  Predicting Personality-Job Fitness for Software Developers Using Multi-Genre Games and Machine Learning Approaches

MentalGame Predicting Personality-Job Fitness for Software Developers Using Multi-Genre Games and Machine Learning Approaches

인성 평가는 현대의 다양한 의사결정 과정에서 중요한 역할을 합니다. 인성을 평가하는 질문지에는 자기보고 편향, 피로, 문항 오해 등의 문제가 있습니다. 게임은 이러한 문제를 해결하기 위한 대안으로 떠오르고 있으며, 여러 연구에서 게임 내 행동과 성격 특성 간의 관계를 분석하고 있습니다. 이 논문에서는 소프트웨어 개발자와 관련된 특정 직업에 맞는 MBTI와 행동 특성을 결합한 새로운 게임 기반 평가 프레임워크를 제안합니다.

paper AI 요약
MergeRec  Model Merging for Data-Isolated Cross-Domain Sequential Recommendation

MergeRec Model Merging for Data-Isolated Cross-Domain Sequential Recommendation

현대의 추천 시스템은 도메인별 데이터를 기반으로 학습되지만, 여러 도메인 간에 일반화하는 데 어려움을 겪는다. 도메인 간 순차적 추천은 이러한 문제점을 해결하기 위한 유망한 연구 방향으로 부상했지만, 기존 접근법들은 도메인 간 중복 사용자나 항목의존성 또는 프라이버시 제약을 무시하는 비현실적인 가정과 같은 근본적인 한계를 가지고 있다. 본 논문에서는 새로운 문제 설정인 데이터 고립된 도메인 간 순차적 추천 하에서 모델 합병에 기반한 새 프레임워크, MergeRec을 제안한다. 이 설정에서는 원시 사용자 상호작용 데이터가 도메인 간 공유되지 않는다. MergeRec은 세 가지 주요 구성 요소로 이루어져 있다 (1) 합병 초기화, (2) 가상 사용자 데이터 생성, (3) 공동 합병 최적화. 먼저, 우리는 트레이닝 없는 합병 기법을 통해 합병 모델을 초기화한다. 그다음으로 각 도메인에서 항목별로 가상 시퀀스를 만들어 실제 사용자 상호작용에 의존하지 않고 의미 있는 훈련 샘플을 생성한다. 마지막으로, 우리는 추천 손실과 디스티ல레이션 손실을 결합한 공동 목표를 통해 도메인별 합병 가중치를 최적화한다. 이 두 가지 손실은 각각 합병 모델이 관련 항목을 식별하도록 유도하고, 조정된 소스 모델에서 협업 필터링 신호를 전달한다. 광범위한 실험 결과 MergeRec은 원래 모델들의 강점을 유지하면서 새로운 도메인에 대한 일반화 능력을 크게 향상시킨다. 기존의 모델 합병 방법들과 비교했을 때, MergeRec은 평균적으로 Recall@10에서 최대 17.21%까지 개선되는 우수한 성능을 일관되게 보여주어, 모델 합병이 대규모 추천 시스템 구축에 효과적인 접근법임을 입증한다. 소스 코드는 https //github.com/DIALLab-SKKU/MergeRec에서 이용 가능하다.

paper AI 요약
MORE  음성 인식의 다목적 적대적 공격

MORE 음성 인식의 다목적 적대적 공격

오토메이티드 스피치 인식(ASR) 모델은 가상 어시스턴트, 실시간 자막 생성, 임상 기록 작성 등 다양한 분야에서 중요한 역할을 하고 있습니다. 그러나 이러한 시스템들은 적대적 공격에 취약하며, 이로 인해 인식 정확도나 추론 효율성이 크게 저하될 수 있습니다. 본 논문에서는 대표적인 ASR 모델인 Whisper 가족의 안정성을 평가하기 위해 새로운 공격 방법 **MORE**를 제안합니다. **MORE**는 정확성과 효율성을 동시에 해치는 다목적 공격 방법으로, 이전 연구들이 주로 정확도에만 초점을 맞춘 것과 달리, 더 종합적인 모델 취약점 평가를 가능하게 합니다.

paper AI 요약
MSACL  리아푸노프 증명을 활용한 지수 안정화 제어를 위한 다단계 행위자-비평가 학습

MSACL 리아푸노프 증명을 활용한 지수 안정화 제어를 위한 다단계 행위자-비평가 학습

모델이 없는 강화학습(RL)에서 증명 가능한 안정성을 달성하는 것은 여전히 도전적인 과제이며, 특히 탐험과 엄격한 안전 사이의 균형을 맞추는 것이 어렵습니다. 본 논문은 지수안정성 이론과 최대엔트로피 RL을 다단계 라이아푸노프 증명서 학습을 통해 통합하는 MSACL 프레임워크를 소개합니다. 복잡한 보상 공학에 의존하는 방법들과는 달리, MSACL은 오프-폴시 다단계 데이터를 활용하여 이론적 안정성 조건을 만족시키는 라이아푸노프 증명서를 학습합니다. 지수안정성 레이블(ESL)과 $λ$ 가중치 집합 메커니즘을 도입함으로써, 프레임워크는 다단계 학습에서 편차와 분산의 균형을 효과적으로 조절합니다. 안정성을 고려한 이점 함수를 통해 정책 최적화가 유도되며, 이를 통해 학습된 정책이 빠른 라이아푸노프 감소를 촉진하도록 합니다. MSACL은 안정화 및 비선형 추적 작업을 포함한 여섯 가지 벤치마크에서 평가되었으며, 최신의 라이아푸노프 기반 RL 알고리즘보다 우수함을 입증하였습니다. MSACL은 간단한 보상하에서도 지수안정성과 빠른 수렴성을 달성하며, 불확실성에 대한 강건성과 미지의 궤도에서의 일반화를 나타냅니다. 민감도 분석을 통해 다양한 시스템에서 다단계 휴리존 $n=20$이 견고한 기본값으로 설정되었습니다. 라이아푸노프 이론과 오프-폴시 액터-크리틱 프레임워크를 연결함으로써, MSACL은 검증 가능한 안전 학습 기반 제어의 기반이 됩니다. 소스 코드와 벤치마크 환경은 공개될 예정입니다.

paper AI 요약
Multi-modal cross-domain mixed fusion model with dual disentanglement for fault diagnosis under unseen working conditions

Multi-modal cross-domain mixed fusion model with dual disentanglement for fault diagnosis under unseen working conditions

(이 논문은 고도로 자동화되고 복잡한 현대 기계의 장애 진단을 위해 다중 모달 데이터와 도메인 일반화를 통합하는 새로운 접근법을 제안한다. 이 방법론은 다양한 작업 조건에서 수집된 센서 신호를 결합하여, 미리 보지 못했던 조건에서도 효과적인 장애 진단을 가능하게 한다.)

paper AI 요약
OmniNeuro  다모달 HCI 프레임워크로 설명 가능한 BCI 피드백 생성

OmniNeuro 다모달 HCI 프레임워크로 설명 가능한 BCI 피드백 생성

뇌-컴퓨터 인터페이스(BCI)의 임상적 채택을 저해하는 주요 장벽은 디코딩 정확도보다 인간-컴퓨터 상호작용(HCI)의 부재입니다. OmniNeuro는 이 문제를 해결하기 위해 기존의 투명하지 않은 오라클 시스템에서 피드백 파트너로 진화시킵니다. 이를 통해 사용자는 시스템이 어떤 상태인지 이해하고, 더 나은 신경가소성과 학습을 촉진할 수 있습니다.

paper AI 요약
PackKV  LLM 인식 손실 압축을 통한 KV 캐시 메모리 절약

PackKV LLM 인식 손실 압축을 통한 KV 캐시 메모리 절약

트랜스포머 기반 대형 언어 모델(LLMs)은 광범위한 실제 응용 분야에서 놀라운 잠재력을 보여주고 있습니다. 그러나 키-밸류(KV) 캐시의 큰 메모리 요구 사항으로 인해 긴 문맥 추론이 여전히 중요한 도전 과제입니다. KV 캐시는 시퀀스 길이와 배치 크기가 증가함에 따라 몇 GB까지 확장될 수 있습니다. 본 논문에서는 긴 문맥 생성을 위한 최적화된 일반적이고 효율적인 KV 캐시 관리 프레임워크인 textbf{PackKV}를 제시합니다. PackKV는 KV 캐시 데이터의 특성에 맞게 조정된 손실 압축 기법을 도입하며, 압축 알고리즘과 시스템 아키텍처 간의 세밀한 공학 설계를 특징으로 합니다. 우리의 접근 방법은 KV 캐시가 동적으로 성장하는 성격을 유지하면서 높은 연산 효율성을 보존합니다. 실험 결과는, 현존하는 양자화 방법과 같은 정확도 하락을 감안할 때 PackKV가 평균적으로 K 캐시에 대해 textbf{153.2} %의 메모리 감소율을, V 캐시에 대해서는 textbf{179.6} %를 달성함을 보여줍니다. 또한 PackKV는 분해압축 오버헤드를 효과적으로 제거하고 행렬-벡터 곱 연산을 가속화하여 매우 높은 실행 통과율을 제공합니다. 구체적으로, A100 및 RTX Pro 6000 GPU에서 cuBLAS 행렬-벡터 곱 커널에 비해 K는 평균 textbf{75.7} %, V는 textbf{171.7} %의 통과율 향상을 이루며, 이는 더 적은 GPU 메모리 대역폭을 필요로 합니다. 코드는 https //github.com/BoJiang03/PackKV에서 이용 가능합니다.

paper AI 요약
PyBangla at BLP-2025 태스크 2  반복적 자가 수정과 다언어 에이전트를 활용한 벵골어에서 파이썬 코드 생성 강화

PyBangla at BLP-2025 태스크 2 반복적 자가 수정과 다언어 에이전트를 활용한 벵골어에서 파이썬 코드 생성 강화

이 문서는 다양한 스케일에서의 bang 과 그 변형된 버전인 bangsl 및 bangwd 에 대한 내용을 포함하고 있습니다. 각각의 항목은 500부터 시작하여 3000까지 여러 스케일로 나뉘어 있으며, 이는 특정 조건 또는 상황에서의 성능 또는 반응을 나타내는 것 같습니다.

paper AI 요약
No Image

Python의 CWE 예측을 위한 LLM과 SAST 도구의 적응적 계층 평가

본 연구는 대형 언어 모델(LLMs)이 생성한 코드에서 취약점을 감지하는 데 있어 정적 분석 도구(SAST)와 LLMs의 성능을 비교하고, 이를 기반으로 반복적인 피드백 루프를 설계하기 위한 벤치마크인 **ALPHA**를 제시합니다. 이 연구는 취약점 탐지를 위해 사용되는 도구 선택에 대한 실질적인 근거를 제공하며, Python 함수 수준에서 CWE 분류의 정확성을 평가합니다.

paper AI 요약
QSLM  성능과 메모리를 고려한 계층적 탐색 전략을 갖춘 양자화 프레임워크

QSLM 성능과 메모리를 고려한 계층적 탐색 전략을 갖춘 양자화 프레임워크

대형 언어 모델(LLMs)과 스파이크 구동 언어 모델(SLMs)의 성능을 개선하고, 이를 임베디드 시스템에 효과적으로 구현하기 위한 양자화 기법에 대해 논한다. 본 연구에서는 SLMs의 메모리 및 에너지 효율성을 높이기 위해 자동화된 양자화 프레임워크인 QSLM을 제안하며, 이를 통해 SLMs의 성능과 메모리 요구사항을 충족시키는 효과적인 양자화 설정을 제공한다.

paper AI 요약
R-디베이터  논쟁 메모리를 통한 검색 강화된 토론 생성

R-디베이터 논쟁 메모리를 통한 검색 강화된 토론 생성

R-Debater는 논쟁적 기억을 기반으로 한 다중 턴 토론을 생성하기 위한 에이전시 프레임워크를 제안합니다. 수사학 및 기억 연구에 근거한 이 시스템은 토론을 전략 일관성을 유지하고, 상대방의 주장을 대응하며, 증거로 주장을 뒷받침하기 위해 이전 주장들을 회상하고 적응하는 과정으로 간주합니다. 구체적으로 R-Debater는 사례와 유사한 증거를 검색하고 이전 토론을 움직일 수 있는 토론 지식 베이스를 역할 기반 에이전트와 통합하여 회화의 일관성을 유지하는 발언을 구성합니다. 표준化的的ORCHID辩论被用来进行评估,构建了包含1000个检索语料和涵盖七个领域的32个保留辩论集。评估了两个任务:下一个发言生成,通过InspireScore(主观性、逻辑性和事实性)来评估;以及对抗性的多回合模拟,由Debatrix(论点、来源、语言和总体)进行评判。与强大的基础大模型相比,R-Debater在单轮和多轮评分中都取得了更高的分数。通过20位有经验的辩论者的人类评估进一步证实了其一致性和证据使用情况,表明结合检索基础和结构化规划可以产生更忠实、立场对齐且跨回合连贯的辩论。 注意:根据规则要求,上述翻译为自然韩语,但由于技术限制,在此以中文展示了翻译内容。

paper AI 요약
RAG에서의 노이즈 필터링 본질적 어려움 해결

RAG에서의 노이즈 필터링 본질적 어려움 해결

대형 언어 모델(LLMs)은 다양한 작업에서 놀라운 성능을 보여주지만, 사실적 정보 부족으로 인해 환영(hallucinations)에 시달리고 있으며, 새로운 지식을 통합하기 위해서는 추가적인 세부 조정(fine-tuning)이 필요하다. 이로 인해 LLMs를 외부 검색기와 결합하는 것이 성능 개선에 기여하지만, 실제 문서에서 얻은 정보가 항상 사용할 수 있는 것은 아니며, 때때로 잡음 정보를 포함하고 있어 성능 저하의 원인이 된다. 본 논문에서는 이러한 문제를 해결하기 위한 새로운 세부 조정 방법을 제안한다.

paper AI 요약
Refined 프롬프트 추적  모델 행동을 이용한 대화 조정 감지

Refined 프롬프트 추적 모델 행동을 이용한 대화 조정 감지

이 논문은 언어 모델의 미세조정 과정에서 원본 프롬프트와 리피너가 재작성한 프롬프트를 구분하는 문제, 즉 Refinement Provenance Inference (RPI)에 대해 다룹니다. 이를 위해 RePro라는 로짓 기반 프레임워크를 제안하며, 이는 그림과 같은 과정을 통해 빠른 선형 분류기를 사용해 추론 모델에서 원본 및 리피너 재작성된 프롬프트의 출처를 판별합니다.

paper AI 요약
RefSR-Adv  참조 기반 이미지 초해상도 모델의 적대적 공격

RefSR-Adv 참조 기반 이미지 초해상도 모델의 적대적 공격

단일 이미지 초해상화(SISR)는 다양한 아키텍처를 통해 저해상도 입력에서 고해상도 세부 사항을 복원하는 데 사용됩니다. 그러나 SISR은 제한된 정보로 인해 실제적이지 않은 아트팩이나 텍스처 환상을 합성하게 됩니다. 이를 극복하기 위해, Reference-based Super-Resolution (RefSR)에서는 외부 고주파수 텍스처 라이브러리인 고해상도 참조 이미지를 도입하여 유사한 텍스처를 전송하는 방식을 사용합니다. 이 논문은 이러한 RefSR 시스템의 보안 취약성을 체계적으로 탐색하고, 참조 이미지에 약간의 변화를 주어 출력을 저하시키는 새로운 적대적 공격인 RefSR-Adv를 제안합니다.

paper AI 요약
RelayGR  장기 시퀀스 생성 추천의 확장을 위한 다단계 중계 경주 추론

RelayGR 장기 시퀀스 생성 추천의 확장을 위한 다단계 중계 경주 추론

현대 산업용 추천 시스템은 하루에 수십억 건의 요청을 처리하며, 이는 검색, 사전 가공 및 세부 정렬 단계를 포함한다. 사용자 참여는 지연 시간에 매우 민감하므로 전체 파이프라인은 몇 백 밀리초 내에 완료되어야 한다. 세부 정렬 단계가 병목 현상을 일으키며, 고용량 모델로 수백 개의 후보 항목을 점수화하는 데 99번째 백분위 수(P99)에서 몇십 밀리초만 주어진다. 생성적 추천(GR) 모델은 긴 시퀀스를 처리하고 더 큰 용량에 잘 확장되지만, 온라인 서비스에서는 시퀀스 길이 증가로 인한 추론 지연 시간 증가로 인해 제약을 받는다. 본 논문에서는 GR의 입력 구조적 특징을 활용하여 장기 사용자 행동 접두사에 대한 사전 추론과 중간 상태 캐싱 및 재사용을 통해 이 문제를 해결하는 RelayGR 시스템을 제안한다.

paper AI 요약
RMAAT  별구이상 기억압축과 재생을 통한 효율적인 긴 문맥 트랜스포머

RMAAT 별구이상 기억압축과 재생을 통한 효율적인 긴 문맥 트랜스포머

Transformer 아키텍처는 자연어 처리에서 중요한 역할을 하지만, 자기 주의 메커니즘이 긴 시퀀스를 처리하는 데 복잡도 문제를 일으킵니다. 이 논문에서는 이러한 문제를 해결하기 위해 신경-글리아 원리를 활용한 재귀적 기억 증강 아스트로모픽 트랜스포머(RMAAT) 모델을 제안합니다. RMAAT는 아스트로사이트의 기능에서 영감을 받아 긴 시퀀스 처리와 계산 효율성을 향상시킵니다.

paper AI 요약
RovoDev 코드 검토자  아틀라시안에서의 대규모 온라인 LLM 기반 코드 검토 자동화 평가

RovoDev 코드 검토자 아틀라시안에서의 대규모 온라인 LLM 기반 코드 검토 자동화 평가

코드 리뷰는 현대 소프트웨어 엔지니어링의 핵심이며, 품질 보장을 위해 중요합니다. 그러나 프로젝트가 복잡해짐에 따라 수동 코드 리뷰는 시간과 자원을 많이 필요로 하게 되며, 이는 개발 과정에서 병목 현상을 일으킬 수 있습니다. 대형 언어 모델(Large Language Models)을 사용하여 코드 리뷰의 일부를 자동화함으로써 이러한 문제를 해결할 수 있습니다. RovoDev 코드 리뷰어는 데이터 보안, 실용적인 가이드라인 제공, 새로운 프로젝트에 대한 컨텍스트 인식 능력 등 다양한 기능을 갖춘 자동화 도구입니다.

paper AI 요약
RTL 최적화 평가를 위한 새로운 벤치마크

RTL 최적화 평가를 위한 새로운 벤치마크

최근에는 대형 언어 모델(LLM)이 반도체 회로 설계의 유연한 디자인에 있어 흥미로운 연구 방향으로 부상하고 있습니다. 특히, 많은 최근 작업들은 직접적으로 레지스터-트랜스퍼 레벨(RTL) 코드 형태로 반도체 회로 설계를 생성하기 위한 맞춤형 LLM을 개발하고 있습니다. 그러나 RTL 코드 최적화에 대한 기존 벤치마크는RTL 코드의 정확성에만 초점을 맞추고 있어, 전력, 성능, 면적(PPA) 측면에서의 실제 회로 설계 품질을 평가하지 않습니다. 이 문제를 해결하기 위해 새로운 벤치마크인 RTL-OPT를 제안합니다.RTL-OPT는 실용적인 최적화 패턴을 제공하며, 다양한 합성 설정에 대해 효과적으로 작동하도록 설계되었습니다.

paper AI 요약
Scale-Adaptive Power Flow Analysis with Local Topology Slicing and Multi-Task Graph Learning

Scale-Adaptive Power Flow Analysis with Local Topology Slicing and Multi-Task Graph Learning

이 논문은 중국의 스마트 그리드 국책 과학기술 중점 프로젝트(2025ZD0804900)와 중국 국가자연과학기금(U22B6007)의 지원을 받았습니다. *(대응 저자 Guan Lin)* Li Yang, Guan Lin, Cai Zihan 및 Lin Zhi는 중국 남중국기술대학교 전력공학부에 소속되어 있으며 이메일은 각각 10706719873@qq.com; lguan@scut.edu.cn; epc_zihan@mail.scut.edu.cn; 2660910069@qq.com입니다. Huang Jia는 중국 남부 전력그리드 회사의 CSG 에너지 개발 연구소에 소속되어 있습니다. Chen Li는 중국 남부 전력그리드 회사의 전력연구원에 소속되어 있습니다.

paper AI 요약
ScienceDB AI  대규모 과학 데이터 공유 서비스를 위한 LLM 기반 에이전트 추천 시스템

ScienceDB AI 대규모 과학 데이터 공유 서비스를 위한 LLM 기반 에이전트 추천 시스템

과학기술용 AI(Science4AI)의 급속한 성장은 과학 데이터셋의 중요성을 부각시켰고, 그 결과 많은 국가적 수준의 과학 데이터 센터와 공유 플랫폼이 설립되었습니다. 그러나 이러한 발전에도 불구하고, 과학 연구를 위한 데이터셋의 효율적인 공유와 활용을 촉진하는 것은 여전히 어려운 문제입니다. 과학 데이터셋은 복잡한 도메인 특화된 지식과 맥락을 포함하고 있어, 기존의 협업 필터링 기반 추천 시스템이 적합하지 않습니다. 대형 언어 모델(LLMs)의 최근 발전은 깊은 의미 이해와 개인화된 추천이 가능한 대화형 에이전트 구축에 대한 전례 없는 기회를 제공합니다. 이에 따라 우리는 과학데이터뱅크(ScienceDB), 세계 최대 규모의 과학 데이터 공유 플랫폼 중 하나에서 개발한 새로운 LLM 기반 에이전트 추천 시스템인 ScienceDB AI를 소개합니다. ScienceDB AI는 자연어 대화와 깊은 추론을 활용하여 연구자의 과학적 의도와 변화하는 요구사항에 맞춘 데이터셋을 정확하게 추천합니다. 이 시스템은 다음과 같은 혁신들을 도입하고 있습니다 복잡한 쿼리에서 구조화된 실험 요소를 추출하는 Scientific Intention Perceptor, 다중 회차 대화를 효과적으로 관리하는 Structured Memory Compressor, 신뢰성 있는 검색 강화 생성(Trustworthy RAG) 프레임워크입니다. Trustworthy RAG는 두 단계의 검색 메커니즘을 사용하고 Citable Scientific Task Record(CSTR) 식별자를 통해 인용 가능한 데이터셋 참조를 제공하여 추천의 신뢰성과 재현성을 향상시킵니다. 과학적 연구에 활용되는 1,000만 개 이상의 실제 데이터셋을 사용한 광범위한 오프라인 및 온라인 실험을 통해 ScienceDB AI는 중대한 효과를 입증했습니다. 우리의 지식으로는, ScienceDB AI가 대규모 과학적 데이터셋 공유 서비스에 특화된 첫 번째 LLM 기반 대화형 추천 시스템입니다. 이 플랫폼은 다음 링크에서 공개적으로 이용 가능합니다 https //ai.scidb.cn/en.

paper AI 요약
SMOTE 생성 샘플의 이론적 수렴성

SMOTE 생성 샘플의 이론적 수렴성

불균형 데이터 세트는 한 클래스(소수 클래스)가 다른 클래스들(다수 클래스)에 비해 크게 소수로 나타나는 기계 학습 및 통계적 분석에서의 주요 도전 과제입니다. 이 불균형은 예측 모델이 소수 클래스에 대해 성능이 저하되는 편향된 결과를 초래하며, 이러한 소수 클래스는 고장 감지, 의료 진단, 네트워크 보안 또는 컴퓨터 비전과 같은 중요한 경우들을 나타낼 수 있습니다. 이를 완화하기 위해 다양한 데이터 증강 기법들이 개발되었습니다. 이 논문에서는 Synthetic Minority Over-sampling Technique (SMOTE)이라는 가장 널리 사용되는 증강 방법에 대해 이론적 분석을 제공합니다. 특히, SMOTE가 생성하는 합성 샘플들이 원래 데이터 분포로 수렴하는 과정을 이론적으로 입증하고자 합니다. 우리의 주요 기여는 다음과 같습니다 1. 확률 수렴 합성 랜덤 변수 $`Z`$가 표본 크기 $`n`$이 무한대로 접근할 때 원래 랜덤 변수 $`X`$로 확률적으로 수렴한다는 것을 증명합니다. 2. 최근접 이웃 순위 $`k`$ $`k`$의 값이 합성 샘플의 수렴 속도에 미치는 영향을 분석하고, 더 낮은 값을 사용하면 더 빠른 수렴을 얻을 수 있다는 것을 보여줍니다. 3. 경험적 검증 균일, 가우시안 및 지수 분포를 사용한 시뮬레이션 연구를 통해 이론 결과를 확인합니다. 이 논문의 결과는 SMOTE 알고리즘에서 $`k = 1`$을 사용하는 것이 원래 분포로 더 빨리 수렴하도록 하는 등 실제 응용에 대한 중요한 통찰력을 제공합니다. 이러한 통찰력은 실무자들이 SMOTE를 사용할 때 적절한 매개변수를 선택하고 증강된 데이터를 기반으로 훈련하는 모델의 성능을 개선하는 데 도움이 될 것입니다. ###

paper AI 요약
SwinIFS  Landmark Guided Swin Transformer For Identity Preserving Face Super Resolution

SwinIFS Landmark Guided Swin Transformer For Identity Preserving Face Super Resolution

본 논문은 얼굴 초해상화(Face Super-Resolution, FSR)를 위해 랜드마크 지도와 Swin Transformer를 통합한 새로운 접근 방법을 제안한다. 이 접근 방식은 고해상도(HR) 이미지의 구조적 일관성과 개별적인 특징을 유지하면서 저해상도(LR) 입력에서 얼굴 이미지를 복원하는 데 초점을 맞추고 있다. 특히, 본 논문은 랜드마크 지도를 통해 얼굴 구조를 안내하고 Swin Transformer의 장거리 종속성 모델링 능력을 활용하여 극단적인 확대 비율에서도 일관된 결과를 얻을 수 있는 방법론을 제시한다. ###

paper AI 요약
SymSeqBench  규칙 기반 상징적 시퀀스 및 데이터셋 생성과 분석을 위한 통합 프레임워크

SymSeqBench 규칙 기반 상징적 시퀀스 및 데이터셋 생성과 분석을 위한 통합 프레임워크

(이 논문은 상징적 시퀀스 처리를 위한 통합적인 프레임워크 `SymSeqBench`를 제안하며, 이는 심리언어학 실험 설계부터 뉴로모픽 아키텍처 평가까지 다양한 분야에서 인간, 동물 및 인공 지능을 분석하는 데 사용할 수 있는 도구입니다. 논문은 형식 언어 이론의 개념을 활용하여 시퀀스 복잡성을 체계적으로 탐사하고, 실질적인 이론적 통찰과 실험적 접근법을 제공합니다.)

paper AI 요약
SynRAG  이질적인 SIEM 시스템용 실행 가능한 쿼리 생성 대형 언어 모델 프레임워크

SynRAG 이질적인 SIEM 시스템용 실행 가능한 쿼리 생성 대형 언어 모델 프레임워크

보안 정보 및 이벤트 관리(SIEM) 시스템은 대규모 기업들이 매일 수백만 개의 로그와 이벤트를 수집하고 분석하여 IT 인프라스트럭처를 모니터링하는 데 필수적입니다. 보안 운영 센터(SOC) 분석가는 이러한 방대한 데이터를 모니터링하고 분석하여 잠재적인 위협을 식별하고 기업 자산을 보호하기 위한 예방 조치를 취해야 합니다. 하지만 Palo Alto Networks Qradar, Google SecOps, Splunk, Microsoft Sentinel 및 Elastic Stack과 같은 SIEM 플랫폼들 간의 다양성은 상당한 도전 과제를 제기합니다. 이러한 시스템들은 속성, 아키텍처, 쿼리 언어에서 차이점이 있어 분석가들이 광범위한 훈련을 받지 않으면 여러 플랫폼을 효과적으로 모니터링하기 어렵고 기업은 인력을 확대해야 하는 상황입니다. 이 문제를 해결하기 위해 우리는 플랫폼에 무관한 사양에서 다중 SIEM 플랫폼용 위협 탐지 또는 사건 조사 쿼리를 자동으로 생성하는 통합 프레임워크인 SynRAG을 도입합니다. SynRAG은 분석가가 작성한 단일 고수준 사양으로 특정 플랫폼에 맞는 쿼리를 생성할 수 있습니다. SynRAG 없이 분석가는 시스템 간에 크게 차이가 나는 쿼리 언어 때문에 각 SIEM 플랫폼별로 별도의 쿼리를 수작업으로 작성해야 합니다. 이 프레임워크는 다양한 SIEM 환경에서 위협 탐지와 사건 조사를 원활하게 진행할 수 있도록 하여 전문적인 훈련과 수동 쿼리 번역에 대한 필요성을 줄입니다. 우리는 Qradar 및 SecOps를 대표적인 SIEM 시스템으로 사용하여 GPT, Llama, DeepSeek, Gemma, Claude와 같은 최첨단 언어 모델들과 SynRAG을 비교 평가하였습니다. 우리의 결과는 SynRAG이 위협 탐지와 사건 조사에 있어 다양한 SIEM 환경에서 최첨단 기본 모델보다 훨씬 더 좋은 쿼리를 생성한다는 것을 보여줍니다.

paper AI 요약
T3C  일관성 보장과 함께 테스트 시점 텐서 압축

T3C 일관성 보장과 함께 테스트 시점 텐서 압축

이 논문에서는 T3C라는 예산 조건에 따른 학습-한번/시험 시간 압축 프레임워크를 제안합니다. T3C는 탄력적인 텐서화와 계층별 혼합 정밀도 양자화를 결합하고, 경량화된 정책을 사용하여 구조화된 예산 토큰을 층별 순위/비트 할당으로 매핑합니다. 이 프레임워크는 단일 체크포인트에서 일관되고 하드웨어에 맞춘 정확도-지연-크기 교환 관계를 제공하며, 양자화, 가위내기, 저순위 기준선보다 낮은 꼬리 위험을 줍니다.

paper AI 요약
Tubular Riemannian Laplace Approximations for Bayesian Neural Networks

Tubular Riemannian Laplace Approximations for Bayesian Neural Networks

라플라스 근사법은 신경망에서 약한 베이지안 추론 방법 중 가장 단순하고 실용적인 방법들 중 하나입니다. 그러나 그의 유구다 공간 표현식은 현대의 심층 모델을 특징짓는 높은 비등방성, 곡률 있는 손실 표면 및 큰 대칭 군에 어려움을 겪고 있습니다. 최근 연구에서는 이러한 구조에 적응하기 위해 리만과 기하학적인 가우스 근사를 제안하였습니다. 이러한 아이디어를 바탕으로 우리는 관형 리만 라플라스(TRL) 근사법을 소개합니다. TRL은 함수적 대칭성에 의해 유도되는 낮은 손실 계곡을 따라 확률적 튜브를 명시적으로 모델링하며, 피셔/เกา스-뉴턴 메트릭을 사용하여 사전 주도 탄젠셜 불확실성을 데이터 주도 횡단면 불확실성으로 분리합니다. 우리는 TRL을 암시적인 곡률 추정치를 활용하여 고차원 매개변수 공간에서 작동하는 확장 가능한 재매개변수화된 가우스 근사법으로 해석합니다. 우리의 실증적 평가에 따르면 ResNet-18(CIFAR-10 및 CIFAR-100)에서는 TRL이 우수한 교정을 달성하며, 딥 앙상블즈와 비교하여 ECE 측면에서 동일하거나 더 높은 신뢰성을 보여주면서 학습 비용의 분수(1/5)만 필요로 합니다. TRL은 단일 모델 효율과 앙상블 수준의 신뢰성 간의 격차를 효과적으로 연결합니다.

paper AI 요약
UltraEval-오디오  오디오 기초 모델의 종합적인 평가를 위한 통일된 프레임워크

UltraEval-오디오 오디오 기초 모델의 종합적인 평가를 위한 통일된 프레임워크

오디오 기반 모델의 폭발적인 발전과 함께, 오디오 모델을 객관적이고 체계적으로 평가하기 위한 통합 평가 프레임워크인 **UltraEval-Audio**를 제안합니다. 이 프레임워크는 데이터 로딩부터 추론 파라미터 조정까지 다양한 과정을 분리하여 연구자들이 실험의 재현성을 높이고, 빠르게 적응하고 확장할 수 있도록 설계되었습니다.

paper AI 요약
VEAT이 텍스트-비디오 생성기 소라의 암시적 연관성을 측정하고 편향 완화에서의 과제를 드러냄

VEAT이 텍스트-비디오 생성기 소라의 암시적 연관성을 측정하고 편향 완화에서의 과제를 드러냄

텍스트-투-비디오(T2V) 생성기인 소라와 같은 시스템은 생성된 콘텐츠가 사회적 편견을 반영하는지에 대한 우려를 제기한다. 우리는 단어와 이미지에서 비디오로 임베딩 연관 검사를 확장하기 위해 비디오 임베딩 연관 검사(VEAT)와 싱글-카테고리 VEAT(SC-VEAT)를 도입한다. 이 방법들을 널리 사용되는 베이스라인, 특히 암묵적 연관 검사(IAT) 시나리오와 OASIS 이미지 카테고리로부터의 관계 방향과 크기를 재현함으로써 검증한다. 그런 다음 17개 직업과 7개 수상 분야에서 인종(아프리카 계 미국인 대 유럽계 미국인)과 성별(여성 대 남성)이 가치(기분 좋은 것 대 불쾌한 것)와 연관되는 정도를 측정한다. 소라 비디오는 유럽계 미국인과 여성들이 더 기분 좋게 인식된다(d>0.8). 효과 크기는 실제 세계의 인구 분포와 상관관계가 있다 직업에서 남성과 백인이 차지하는 비율(r=0.93, r=0.83) 및 수상자들 중 남성과 흑인 비율이 아닌 사람들의 비율(r=0.88, r=0.99). 명시적인 디비어스 프롬프트를 적용하면 효과 크기의 크기가 일반적으로 줄지만 역효과를 초래할 수도 있다 두 개의 흑인 관련 직업(청소원, 우편 서비스)은 디비어싱 이후 더 강하게 흑인 연관성이 증가한다. 이 결과들은 쉽게 접근 가능한 T2V 생성기가 철저히 평가되지 않고 책임감 있게 배치되지 않는 경우 표현적 피해를 실제로 확대할 수 있음을 보여준다.

paper AI 요약
VLA-RAIL  VLA 모델과 로봇을 위한 실시간 비동기 추론 링커

VLA-RAIL VLA 모델과 로봇을 위한 실시간 비동기 추론 링커

비전-언어-행동(VLA) 모델은 로봇이 자연 언어 명령을 이해하고, 공간-시각적 의미를 추출하며, 열린 세계 조작 작업에 적합한 행동을 생성할 수 있게 합니다. 그러나 VLA 모델의 배포는 다양한 하드웨어 구성과 소프트웨어 인터페이스로 인해 한정되어 있습니다. 본 논문에서는 이러한 문제를 해결하기 위해 실시간 비동기 추론 프레임워크인 VLA-RAIL을 제안합니다.

paper AI 요약
Wittgenstein s Family Resemblance Clustering Algorithm

Wittgenstein s Family Resemblance Clustering Algorithm

이 논문은 분석 철학에서 루트비히 비트겐슈타인의 가족 닮음 개념을 기반으로 한 새로운 접근법을 제시합니다. 이 연구는 비트겐슈타인의 가족 닮음 원리를 기계 학습용 클러스터링 알고리즘에 적용하여 데이터 포인트 간의 유사성을 그래프로 표현하고, 이를 통해 연결된 그룹으로서 클러스터를 형성합니다. 이 알고리즘은 WFR (Wittgenstein’s Family Resemblance) 클러스터링 알고리즘이며, 다양한 토이 벤치마크 데이터셋에서 복잡하고 비선형적인 클러스터 구조를 효과적으로 포착할 수 있음을 실험적으로 입증합니다.

paper AI 요약
가장 유용한 파트너 선발의 새로운 길

가장 유용한 파트너 선발의 새로운 길

많은 현대 AI 및 ML 문제는 공유되지만 비대칭적인, 계산적으로 집약적인 과정을 통해 파트너의 기여를 평가하고 동시에 가장 유익한 후보자를 선별하는 것을 필요로 합니다. 이러한 문제들은 새로운 프레임워크인 순차적 지원 네트워크 학습(SSNL) 하에서 통합될 수 있습니다. 이 목표는 모든 참가자에게 가장 유익한 파트너 집합을 시도를 통해 선택하는 것입니다, 즉, 최고의 성능 기여를 나타내는 방향 그래프를 학습하는 것입니다. 우리는 단일 평가가 구조적인 중첩성으로 인해 여러 밴딧에 대한 고유한 피드백을 제공하는 새로운 순수 탐색 모델인 반복적으로 겹치는 다중(다중 팔) 밴딧(SOMMAB)이 희박한 후보 목록에서 지원 네트워크를 효율적으로 학습할 수 있음을 보여줍니다. 우리는 SOMMAB용 일반화된 GapE 알고리즘을 개발하고, 이는 다중 밴딧 최고 팔 식별에 있어 가장 잘 알려진 상수보다 지수 계수에서 크게 향상된 새로운 지수 오류 경계를 제공합니다. 이러한 경계는 중첩도와 선형적으로 비례하여, 공유 평가로부터 발생하는 샘플 복잡성의 큰 이점을 드러냅니다. 응용 프로그램 측면에서 본 연구는 다중 작업 학습(MTL), 보조 작업 학습(ATL), 연방 학습(FL) 및 다중 에이전트 시스템(MAS)과 같은 여러 학습 문제에서 희박한 후보자로부터 지원 네트워크를 식별하는 순차적 학습 도구의 이론적인 기초와 개선된 성능 보장을 제공합니다.

paper AI 요약
강화학습의 적대적 인스턴스 생성과 로브스트 트레이닝

강화학습의 적대적 인스턴스 생성과 로브스트 트레이닝

본 논문에서는 다목적 조합 최적화 문제(MOCOP)를 해결하는 강화학습 기반의 신경망 모델에 대한 강인성을 향상시키는 새로운 접근법을 제안한다. 이를 위해 선호도 기반 적대적 공격(PAA) 방법과 동적인 선호도 증강 방어(DPD) 방법을 소개한다. PAA는 특정 선호도에 맞춘 어려운 인스턴스를 생성하여 신경망 모델의 성능을 저하시키며, DPD는 적대적 공격으로부터 신경망 모델을 보호하고 그 강인성을 향상시킨다. 이러한 방법들은 다목적 트래블링 세일즈맨 문제(MOTSP), 다목적 용량 제약 차량 경로 문제(MOCVRP), 그리고 다목적 배낭 문제(MOKP)에서 우수한 성능을 보여준다.

paper AI 요약
게임 디자인의 혁명, 모터  자동화된 게임 메커닉스

게임 디자인의 혁명, 모터 자동화된 게임 메커닉스

본 논문은 게임 메커니즘의 절차적 생성을 위한 새로운 접근 방식을 제안합니다. 이를 위해 <span class= smallcaps >Mortar</span>이라는 시스템을 소개하며, 이 시스템은 대형 언어 모델(LLM)과 품질 다양성(QD) 알고리즘을 사용하여 다양한 게임 메커니즘을 진화시킵니다. <span class= smallcaps >Mortar</span>은 진화된 메커니즘이 전체 게임의 질에 기여하는지를 평가함으로써, 메커니즘의 가치를 판단합니다.

paper AI 요약
결합 임베딩 예측 세계 모델을 통한 물리적 계획 성공 요인은 무엇일까?

결합 임베딩 예측 세계 모델을 통한 물리적 계획 성공 요인은 무엇일까?

본 논문은 제어 및 탐색 계획 작업을 위한 임베딩 공간에서 동적 모델을 효율적으로 학습하는 방법에 대해 연구합니다. 주요 기여는 액션 조건부 결합 예측 월드 모델(JEPA-WM)의 핵심 구성 요소들에 대한 분석이며, 이를 통해 DINO-WM과 V-JEPA-2-AC을 능가하는 최적의 JEPA-WM을 제안합니다.

paper AI 요약
계층적 계획과 다목적 선호도 정렬을 통한 효율적인 생성 슬래트 추천 HIgr

계층적 계획과 다목적 선호도 정렬을 통한 효율적인 생성 슬래트 추천 HIgr

본 논문은 계층적 생성 슬레이트 추천 프레임워크인 HiGR을 제안한다. HiGR은 대규모 온라인 서비스에서 사용자 경험의 핵심 요소로 작용하는 슬레이트 추천 문제를 해결하기 위해 설계되었다. 기존 방법론이 효율적이지만 항목 수준 목표만 최적화하고 전체 리스트 품질을 무시하는 반면, HiGR은 생성 모델과 대조 학습을 통한 계층적 구조화된 아이디를 통해 슬레이트의 글로벌 구조와 세부 항목 선택 사이에서 효율적인 추론을 가능하게 한다.

paper AI 요약
고급 정규화로 부드러운 제어  에너지 관리의 새로운 패러다임

고급 정규화로 부드러운 제어 에너지 관리의 새로운 패러다임

강화학습은 복잡한 의사결정 작업에서 뛰어난 성과를 보여왔지만, 실제 시스템에 적용할 때 급격하고 무작위적인 제어 행동이 즉각적인 보상 최적화와 함께 큰 운영 비용을 초래하는 문제점이 나타났다. 이 논문은 이런 현상을 해결하기 위해 3차 도함수 패널티를 도입하여, 제어 벤치마크에서 1차와 2차 도함수 패널티를 비교하고, HVAC 시스템에 적용해 장비 수명과 에너지 효율성을 측정한다. ###

paper AI 요약
공격 벡터 엔지니어링과 가법 제조에서의 이상 감지

공격 벡터 엔지니어링과 가법 제조에서의 이상 감지

추가 제조(AM)는 항공우주, 자동차, 의료 등 중요 산업 분야에 신속하게 통합되고 있습니다. 하지만 이 사이버-물리적 융합은 특히 컴퓨터 지원 설계(CAD)와 기계 실행 레이어 간의 인터페이스에서 새로운 공격 표면을 소개합니다. 본 연구에서는 광범위하게 사용되는 용융 침착 모델링(FDM) 시스템인 크리얼러티의 플래그십 모델 K1 Max와 엔더 3에 대한 정교한 사이버공격을 조사하였습니다. 우리의 위협 모델은 대항자들이 사용자 인터페이스로부터 프린터 펌웨어까지 G코드 파일을 전송하는 과정에서 가로채고 조작하는 다층적 Man-in-the-Middle(MitM) 침입입니다. 이 MitM 침입 체인은 몇 가지 비밀리에 이루어지는 파괴 시나리오를 가능하게 합니다. 이러한 공격들은 기존의 슬라이서 소프트웨어나 런타임 인터페이스로는 감지할 수 없으며, 구조적으로 결함이 있지만 외부적으로 신뢰할 수 있는 프린팅 부품을 생성합니다. 이러한 비밀리에 이루어지는 위협에 대응하기 위해, 우리는 생생한 프린팅 동안 생성되는 구조화된 머신 로그를 분석하는 무감독 침입 탐지 시스템(IDS)을 제안하였습니다. 우리의 방어 메커니즘은 변형 BERT로 이루어진 동결된 Transformer 기반 인코더를 사용하여 시스템 행동의 의미 표현을 추출하고, 이어서 대조적으로 학습된 투영 머리가 이상 감도 임베딩을 배우도록 합니다. 이후에는 클러스터링 기반 접근 방식과 자기 주의 자동 인코더를 사용하여 분류합니다. 실험 결과는 우리의 접근법이 무해한 실행과 침해된 실행 사이에서 효과적으로 구분한다는 것을 보여줍니다.

paper AI 요약
공격적인 압축이 LLM 가중치 유출을 가능하게 한다

공격적인 압축이 LLM 가중치 유출을 가능하게 한다

AI 모델을 훈련시키는 비용이 급증하면서, 특히 고급 AI 시스템은 국가 안보 자산으로 인식되고 있습니다. 이에 따라 모델 가중치를 해킹에서 보호하려는 관심이 증가하고 있으며, 특히 가중치 유출 공격이 주요 문제로 부각되었습니다. 본 논문에서는 큰 언어 모델(Large Language Model, LLM)의 압축 기술을 이용해 가중치 유출 공격의 가능성과 방어 방법에 대해 분석하였습니다.

paper AI 요약
구조-상태 결합 학습으로 네트워크 진화 히스토리 추론

구조-상태 결합 학습으로 네트워크 진화 히스토리 추론

네트워크의 진화 역사로부터 한 개의 최종 스냅샷과 제한된 시간 주석을 추론하는 것은 기본적이면서도 도전적인 과제이다. 현재 접근 방식은 대부분 위상만에 의존하는데, 이는 종종 부족하고 잡음을 포함한 단서를 제공한다. 본 논문은 특정 동적 과정 하에서 수렴된 노드 상태인 네트워크 정상 상태 동역학을 추가적인 널리 접근 가능한 관찰로 활용하여 네트워크 진화 역사 추론에 사용한다. 우리는 CS$^2$를 제안하며, 이는 구조-상태 결합을 명시적으로 모델링하여 위상이 정상 상태를 어떻게 조절하는지와 두 신호가 엣지 판별을 어떻게 공동으로 향상시키는지를 포착한다. 여섯 개의 실제 시간 네트워크에서 여러 동적 과정 하에 평가한 실험 결과 CS$^2$는 강력한 베이스라인을 일관되게 능가하며, 평균 4.0%의 엣지 순위 판별 정확도 향상과 평균 7.7%의 전역 순서 일관성(Spearman-$ρ$) 향상을 보여준다. CS$^2$는 또한 클러스터 형성, 차수 이질성, 허브 성장과 같은 거시적 진화 경로를 더욱 신뢰성 있게 복원한다. 게다가, 정상 상태만을 사용하는 변형은 신뢰할 수 있는 위상이 제한적인 상황에서도 경쟁력을 유지하며, 정상 상태가 진화 추론을 위한 독립된 신호임을 강조한다.

paper AI 요약
그래프 신경망의 저장소 기반 학습 가속화

그래프 신경망의 저장소 기반 학습 가속화

그래프 신경망(GNN)의 학습은 대규모 그래프를 처리하는 데 있어서 주요한 도전 과제를 안고 있다. 이 논문에서는 GNN 학습에서 데이터 준비 단계가 전체 과정에서 큰 병목 현상을 일으키는 문제점을 파악하고, 이를 해결하기 위한 새로운 프레임워크 **AGNES**을 제안한다. AGNES는 블록 단위의 저장 장치 I/O 처리와 하이퍼 배치 기반 처리를 통해 효율적으로 데이터 준비 과정을 수행하며, 특히 대규모 그래프 학습에서 성능 향상에 크게 기여한다.

paper AI 요약
그래프 포인터 네트워크와 분산의 결합을 통한 다양한 TSP 경로 생성

그래프 포인터 네트워크와 분산의 결합을 통한 다양한 TSP 경로 생성

이 논문에서는 다각적 여행 상인 문제(D-TSP)를 해결하기 위한 새로운 프레임워크를 제안합니다. 이 작업은 고성능 해답을 찾으면서 동시에 해답의 다양성을 최대화하는 것을 목표로 합니다. 우리의 접근 방식은 전통적인 알고리즘과 신경망 기반 방법을 결합한 것입니다. 실험 결과는 40개 도시에 대해 몇 시간 동안 훈련하면, 우리의 모델이 현재까지 알려진 최고의 성능을 보여줍니다.

paper AI 요약

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키