KOINEU Logo
No Image

_chatGPT의 추천에서 다양성, 신선함 및 인기 편향 탐색

ChatGPT는 다양한 분야에서 능력을 보여주는 다재다능한 도구로 부상하고 있다. 이러한 성공에 따라 추천 시스템(RS) 커뮤니티에서는 주로 정확도에 초점을 맞추고 ChatGPT의 추천 시나리오 내 적용을 조사하기 시작했다. ChatGPT가 RS에 통합되면서 많은 관심을 받았지만, 다양한 차원에서의 성능에 대한 포괄적인 분석은 아직 충분히 이루어지지 않았다. 특히 다각도의 다양성과 새로운 추천 제공 능력, 인기도 편향 가능성 등이 철저하게 검토되지 않은 상태이다. 이러한 모델의 사용이 계속 확대됨에 따라 이러한 측면을 이해하는 것은 사용자 만족도를 높이고 장기적인 개인화를 달성하는 데 중요하다. 본 연구는 ChatGPT-3.5와 ChatGPT-4가 제공하는 추천을 분석하여 다양성, 신규성 및 인기도 편향 측면에서 ChatGPT의 능력을 평가한다. 세 가지 다른 데이터셋에서 이 모델들을 평가하고 상위 N개 추천과 냉기 시작 시나리오에서의 성능을 분석한다. 결과는 ChatGPT-4가 전통적인 추천자들과 맞먹거나 그 이상으로, 추천에서 신규성과 다양성을 균형 있게 유지할 수 있음을 보여준다. 또한 냉기 시작 시나리오에서는 ChatGPT 모델들이 정확도와 신규성 측면에서 우수한 성능을 나타내어 새 사용자에게 특히 유익하다는 것을 나타낸다. 이 연구는 ChatGPT의 추천에 대한 강점과 한계를 강조하고, 정확도 중심 지표를 넘어 이러한 모델들이 제공할 수 있는 추천 능력을 재해석한다.

paper AI 요약
3D 다중 객체 장면에서의 2D 시스템 비디오와 언어 정합성 및 멀티정보 도함수 없는 제어

3D 다중 객체 장면에서의 2D 시스템 비디오와 언어 정합성 및 멀티정보 도함수 없는 제어

본 논문은 시각-언어 모델(VLM)이 2차원 이미지를 기반으로 학습되었음에도 불구하고, 3차원 장면을 분석하는 방법론을 제안합니다. 이는 특정 객체의 위치와 특징을 정확하게 파악하기 위해 필요한 최적의 시점 순서를 예측하고, 이를 통해 VLM이 더 정확한 결과를 반환할 수 있도록 합니다.

paper AI 요약
AdaGReS  토큰 예산에 적응하는 중복 고려 스코어링을 통한 선욕적 문맥 선택

AdaGReS 토큰 예산에 적응하는 중복 고려 스코어링을 통한 선욕적 문맥 선택

RAG(Retrieval-Augmented Generation)는 대형 언어 모델(LLM)이 외부 지식을 통합하고, 지식 집약적인 작업 성능을 향상시키는 주요 기술로 발전했습니다. 그러나 RAG 시스템은 검색된 결과의 다양성과 관련성을 균형 있게 유지하는 데 어려움을 겪습니다. 본 논문에서는 이러한 문제를 해결하기 위해 새로운 맥락 점수화 및 선택 메커니즘을 제안하고 이를 구현합니다.

paper AI 요약
AI 강화된 양자점 해밀토니안 튜닝을 통한 마이저나 모드 형성

AI 강화된 양자점 해밀토니안 튜닝을 통한 마이저나 모드 형성

신경망 기반 모델을 제안합니다. 이 모델은 양자점 시뮬레이터에서 작동하는 다양한 상황들을 학습하고, 운송 측정에 근거해 이러한 장치를 자동으로 튜닝하여 구조 내에서 마이저나 모드를 얻을 수 있도록 합니다. 이 모델은 가상의 데이터 형태인 전도도 지도를 사용하여 비감독 방식으로 학습되며, 이를 위해 마이저나 제로 모드의 주요 특성을 포함하는 물리학적 손실 함수가 적용됩니다. 적절한 학습을 통해 딥 비전-트랜스포머 네트워크는 해밀토니안 매개변수와 전도도 지도 구조 간의 관계를 효과적으로 기억하고 이를 사용하여 양자점 사슬에 대한 매개변수 업데이트를 제안하여 시스템을 위상학적 위상으로 이끌 수 있습니다. 매개변수 공간에서 넓은 범위의 초기 불일치 상태에서도 단 한 번의 업데이트 단계만으로 비자명한 제로 모드를 생성할 수 있습니다. 또한, 각 단계마다 업데이트된 전도도 지도를 획득하는 반복적인 튜닝 프로시저를 활성화함으로써 이 방법은 매개변수 공간의 훨씬 더 큰 영역을 다룰 수 있음을 보여줍니다.

paper AI 요약
AI 기반 다중 클러스터 환경의 클라우드 리소스 최적화

AI 기반 다중 클러스터 환경의 클라우드 리소스 최적화

현대의 클라우드 네이티브 시스템은 확장성, 견고성 및 지리적 분산을 지원하기 위해 다중 클러스터 배포에 점점 더 의존하고 있습니다. 그러나 기존의 리소스 관리 접근 방식은 여전히 대응형이고 클러스터 중심적이어서 동적인 워크로드 하에서 시스템 전체의 행동을 최적화하는 능력이 제한됩니다. 이러한 한계는 분산 환경에 걸쳐서 효율적인 리소스 활용, 지연된 적응 및 증가된 운영 부담으로 이어집니다. 본 논문은 다중 클러스터 클라우드 시스템에서 적응형 리소스 최적화를 위한 AI 기반 프레임워크를 제시합니다. 제안된 접근 방식은 예측 학습, 정책 인식 결정 및 지속적인 피드백을 통합하여 클러스터 간에 능동적이고 조율된 리소스 관리를 가능하게 합니다. 이 프레임워크는 클러스터 간 텔리미트리와 역사적 실행 패턴을 분석하여 성능, 비용 및 신뢰성 목표를 균형 있게 맞추기 위해 리소스 할당을 동적으로 조정합니다. 프로토타입 구현은 전통적인 대응형 접근 방식에 비해 개선된 리소스 효율성, 워크로드 변동 시 더 빠른 안정화 및 성능 변화의 감소를 보여줍니다. 결과는 확장적이고 견고한 클라우드 플랫폼을 위한 핵심 요인으로서 지능형 자가 적응 인프라 관리의 효과성을 강조합니다.

paper AI 요약
AI 라이브러리의 숨은 손길, 오픈소스 프로젝트와 커뮤니티를 형성하다

AI 라이브러리의 숨은 손길, 오픈소스 프로젝트와 커뮤니티를 형성하다

이 논문은 오픈 소스 소프트웨어(OSS) 프로젝트에서 인공지능(AI) 라이브러리의 채택과 그 영향을 조사한다. 특히, Java와 Python 기반 OSS에서 AI 라이브러리의 사용 범위를 분석하고 이를 통해 개발 활동, 협업, 그리고 소프트웨어 복잡성과 유지보수에 미치는 영향을 평가한다. 본 연구는 157,700개의 가능 저장소에 대한 대규모 분석을 수행하여 AI 라이브러리 채택의 범위와 그 결과를 제공하며, 이는 소프트웨어 엔지니어링과 OSS 커뮤니티에 중요한 통찰력을 제공한다.

paper AI 요약
AI 사회의 독성 채택 검사  Chirper.ai를 통한 해악 분석

AI 사회의 독성 채택 검사 Chirper.ai를 통한 해악 분석

사회 봇이 온라인 플랫폼에서 정보 확산, 참여 동태, 공론에 큰 영향을 미쳐 왔지만, 대형 언어 모델(LLMs)은 이전 세대보다 훨씬 복잡하고 자연스러운 상호작용을 가능하게 하는 새로운 사회 봇을 구현했습니다. LLM 기반 에이전트의 행동은 오프라인에서 시뮬레이션된 사회 환경을 통해 검증되었으며, 이는 인간과 유사한 네트워크 구조와 집단 현상에 대한 연구를 가능하게 했습니다. 그러나 이러한 에이전트들은 독해나 해로운 콘텐츠 생성의 위험성을 내포하고 있습니다. 본 논문에서는 Chirper.ai라는 AI 기반 소셜 네트워크 플랫폼을 통해 LLM 에이전트들의 독해 유발 메커니즘에 대한 대규모 실험적 평가를 수행합니다.

paper AI 요약
AI 에이전트 시스템  아키텍처, 응용 프로그램 및 평가

AI 에이전트 시스템 아키텍처, 응용 프로그램 및 평가

인공지능(AI) 에이전트는 기초 모델과 실행 루프를 결합하여, 정보 수집, 상태 유지, 도구 선택 및 제약 조건 하에서의 다단계 작업을 수행합니다. 이러한 AI 에이전트는 현대 디지털 작업 환경에서 분산된 지식과 도구 중재 작업, 그리고 최종 결과에 대한 성공 정의를 처리할 수 있습니다. 이 논문은 에이전트 아키텍처와 학습 전략을 중심으로 이러한 시스템의 현재 격차 및 개선 방향을 조사합니다.

paper AI 요약
AMAP 에이전시 계획 기술 보고서

AMAP 에이전시 계획 기술 보고서

최근 대형 언어 모델(LLMs)은 도구 호출을 통합하여 복잡한 작업 추론 능력을 향상시켰습니다. 이 논문에서는 실시간 공간-시간 상황에서의 추론 작업에 초점을 맞춘 STAgent를 제안합니다. STAgent는 강화학습, 고급 데이터 구성 및 계층적 학습 방법을 통합한 종합적인 파이프라인을 구현하여 복잡한 현실 세계 문제 해결 능력을 향상시킵니다.

paper AI 요약
Application of deep learning techniques in non-contrast computed tomography pulmonary angiogram for pulmonary embolism diagnosis

Application of deep learning techniques in non-contrast computed tomography pulmonary angiogram for pulmonary embolism diagnosis

폐색전은 생명을 위협하는 질병으로, 조기에 검출하고 치료하면 사망률이 크게 줄어듭니다. 최근 많은 연구들이 대조매개체 컴퓨터단층촬영 폐 혈관angiography를 활용하여 폐색전의 진단에 딥러닝을 사용하고 있지만, 대조매개체는 폐색전과 만성신부전이 있는 환자들에게 급성 신장 손상을 일으킬 가능성이 있으며, 대조매개체가 작동하는 데 시간이 소요되어 급성 폐색전을 가진 환자는 골든 테리트리를 놓칠 수 있습니다. 본 연구는 대조매개체를 사용하지 않고 CT 영상에서 폐색전을 자동으로 분류하기 위해 3차원 컨볼루션 신경망 모델을 활용한 딥러닝 기법을 이용하는 것을 목표로 합니다. 이번 연구에서 사용된 딥러닝 모델은 대조매개체를 사용하지 않은 컴퓨터단층촬영 영상의 폐색전 분류에 대해 85% 정확도와 0.84 AUC를 보여주어, 이 모델이 폐색전 진단에서의 적용 가능성을 확인하였습니다.

paper AI 요약
ARIES  실시간 역학 감시 및 발생 모니터링을 위한 확장형 다중 에이전트 조정 프레임워크

ARIES 실시간 역학 감시 및 발생 모니터링을 위한 확장형 다중 에이전트 조정 프레임워크

세계 건강 감시는 현재 지식 격차라는 도전에 직면해 있습니다. 일반적인 목적으로 사용되는 인공지능이 확산되었지만, 만성적 환영 현상과 전문 데이터 시ilos를 탐색하는 능력 부족으로 인해 여전히 고스테이크 역학 분야에는 적합하지 않습니다. 본 논문은 ARIES(Agentic Retrieval Intelligence for Epidemiological Surveillance)라는 특화된 자율적 다중 에이전트 프레임워크를 소개합니다. 이 프레임워크는 정적인 질병별 대시보드에서 벗어나 동적인 지능 생태계로 나아가도록 설계되었습니다. 계층형 명령 구조 위에 작성된 ARIES는 GPTs를 활용해 WHO(World Health Organization), CDC(Center for Disease Control and Prevention) 및 피어 리뷰 연구 논문을 자동으로 조회할 수 있는 확장 가능한 서브 에이전트 스와rm을 조정합니다. 감시 데이터의 추출과 논리적 종합을 자동화함으로써 ARIES는 신흥 위협과 신호 발산을 실시간에 가깝게 식별하는 특화된 사고를 제공합니다. 이 모듈형 아키텍처는 특정 작업을 수행하는 에이전트 스와rm이 일반적인 모델보다 우수하다는 것을 입증하며, 다음 세대의 발생 대응 및 글로벌 건강 지능에 강력하고 확장 가능한 솔루션을 제공합니다.

paper AI 요약
AutoFed  개인화 프롬프트를 활용한 수동 없는 연방 교통 예측

AutoFed 개인화 프롬프트를 활용한 수동 없는 연방 교통 예측

정확한 교통 예측은 라이드해링, 도시 도로 계획, 차량 페리 관리 등 지능형 교통 시스템에 필수적입니다. 하지만 교통 데이터 주변의 중요한 프라이버시 문제로 인해 대부분의 기존 방법은 로컬 트레이닝에 의존하여 데이터 실로와 제한적인 지식 공유가 발생합니다. 연방 학습(FL)은 개인정보 보호 협업 훈련을 통해 효율적인 해결책을 제공하지만, 표준 FL은 클라이언트 간의 독립적이지 않고 동일하게 분포되지 않은(non-IID) 문제에 어려움을 겪습니다. 이挑战组合中包含了韩文和中文,最后的部分没有完全翻译成韩文。以下是完整的韩文翻译: 정확한 교통 예측은 라이드해링, 도시 도로 계획, 차량 페리 관리 등 지능형 교통 시스템에 필수적입니다. 하지만 교통 데이터 주변의 중요한 프라이버시 문제로 인해 대부분의 기존 방법은 로컬 트레이닝에 의존하여 데이터 실로와 제한적인 지식 공유가 발생합니다. 연방 학습(FL)은 개인정보 보호 협업 훈련을 통해 효율적인 해결책을 제공하지만, 표준 FL은 클라이언트 간의 독립적이지 않고 동일하게 분포되지 않은(non-IID) 문제에 어려움을 겪습니다. 이 어려움은 개인화 연방 학습(PFL)이 유망한 패러다임으로 등장하는 원인이 되었습니다. 그럼에도 불구하고 현재의 PFL 프레임워크는 교통 예측 작업에 대한 전문적인 그래프 특징 공학, 데이터 처리 및 네트워크 아키텍처 설계가 필요합니다. 많은 이전 연구들의 주목할 만한 제한점 중 하나는 실세계 시나리오에서 자주 사용 불가능한 데이터셋 간의 하이퍼파라미터 최적화에 의존하는 것입니다. 이를 해결하기 위해 AutoFed라는 새로운 PFL 프레임워크를 제안합니다. 이는 개인화된 예측자에게 교차 클라이언트 지식을 활용하면서도 로컬 특이성을 유지하도록 하여 자동 조정을 통해 인공적인 하이퍼파라미터 튜닝의 필요성을 제거합니다. 프롬프트 학습에서 영감을 받아, AutoFed는 클라이언트 맞춤형 어댑터를 사용하여 로컬 데이터를 축소된 글로벌 공유 프롬프트 행렬에 응축하는 연방 표현자를 도입하였습니다. 이 프롬프트는 개인화 예측자에게 조건을 제공합니다. 실제 데이터셋에서의 광범위한 실험은 AutoFed가 다양한 시나리오에서 일관되게 우수한 성능을 달성한다는 것을 보여주었습니다. 본 논문의 코드는 https //github.com/RS2002/AutoFed 에서 제공됩니다.

paper AI 요약
BERT-JEPA  언어 불변 의미를 위한 CLS 임베딩 재구조화

BERT-JEPA 언어 불변 의미를 위한 CLS 임베딩 재구조화

BERT와 그 후속 모델들은 NLP 작업을 위해 풍부한 임베딩을 생성하는데 사용된다. 하지만 이러한 임베딩은 언어의 진정한 표현을 포착하지 못한다. 이 연구는 BERT를 새로운 학습 아키텍처인 Joint-Embedding Predictive Architectures (JEPA)를 통해 훈련하여, 문장과 정보의 진정한 의미만을 나타내도록 가르치려고 한다. 이를 위해 BERT-JEPA (BEPA)라는 새로운 학습 패러다임을 제시하며, 이는 [CLS ] 임베딩 공간을 재구조화하고 다언어 작업에서 성능을 향상시키며, PCA 표현을 더 포괄적인 형태로 변화시킨다는 결과를 보여준다.

paper AI 요약
Can Small Training Runs Reliably Guide Data Curation? Rethinking Proxy-Model Practice

Can Small Training Runs Reliably Guide Data Curation? Rethinking Proxy-Model Practice

고품질 데이터는 현대 AI 개발의 주요 드라이버로 부상하였습니다. 프런티어 AI 모델을 훈련시키기 위한 데이터 레시피를 구성하는 것은 필수적인 결정 과정이지만, 이에 대한 이론적 지침이나 인간의 직관은 거의 없습니다. 따라서 실무자들은 실제 모델 훈련을 통해 데이터 품질을 평가해야 합니다. 본 논문에서는 작은 프록시 모델 을 사용하여 대규모 모델 훈련에 필요한 계산 부담을 크게 줄이는 방법과 이를 통한 실용적인 개발 워크플로우를 제안합니다.

paper AI 요약
Causify DataFlow  A Framework For High-performance Machine Learning Stream Computing

Causify DataFlow A Framework For High-performance Machine Learning Stream Computing

시간 시리즈 기계 학습에서 직면하는 다양한 도전 과제와 이를 해결하기 위한 DataFlow의 접근 방식을 다룹니다. 특히 프로토타입과 생산 사이의 차이, 모델 실행 빈도 조정, 비정상성 시간 시리즈 처리, 미래 정보 사용에 따른 비인과적 버그, 정확한 역사적 시뮬레이션 구현, 디버깅, 성능 최적화, 매개변수 분석 등 다양한 주제를 다룹니다.

paper AI 요약
CaveAgent  LLM을 상태형 런타임 오퍼레이터로 변환하기

CaveAgent LLM을 상태형 런타임 오퍼레이터로 변환하기

이 논문에서는 대형 언어 모델(LLM)을 기반으로 하는 새로운 시스템인 CaveAgent를 제시합니다. 이 시스템은 LLM의 강력한 코드 생성 능력을 활용하여, 프로세스 중심의 함수 호출 패러다임에서 객체 지향 상태 관리로 이동하는 것을 목표로 합니다. 이를 통해 기존 문제점들을 해결하고, 복잡한 논리적 의존성을 효율적으로 처리하며, 다중 에이전트 간의 정확한 협업을 가능하게 합니다.

paper AI 요약
Clinical Knowledge Graph Construction and Evaluation with Multi-LLMs via Retrieval-Augmented Generation

Clinical Knowledge Graph Construction and Evaluation with Multi-LLMs via Retrieval-Augmented Generation

의학적 서술문에서 정확하고 임상적으로 관련성이 있는 지식 그래프(KGs)를 구축하는 것은 생물의학 정보학에서 근본적인 도전 과제입니다. 임상 KG는 설명 가능한 AI, 의사결정 지원, 그리고 환자의 장기적 모델링을 가능하게 하지만, 전통적인 접근법은 여전히 제약되어 있습니다. 이 논문에서는 free-text에서 직접 KG를 구축하고 평가하는 최초의 end-to-end 프레임워크를 소개합니다. 우리의 파이프라인은 지속적인 정교화와 자기 감독 평가를 지원하여, 높은 정확도의 구성과 시간에 따른 동적 그래프 개선을 가능하게 합니다.

paper AI 요약
CNC-TP  상위 관련 속성 기반 분류 명목개념

CNC-TP 상위 관련 속성 기반 분류 명목개념

데이터베이스에서의 지식 발견(KDD)은 컴퓨터 응용 프로그램의 다양한 분야에서 매일 생성되는 방대한 양의 데이터를 활용하는 것을 목표로 합니다. KDD는 데이터 선택, 전처리, 변환, 데이터 마이닝, 시각화 등 일련의 구조적인 과정을 통해 데이터셋으로부터 숨겨진 의미 있는 지식을 추출합니다. 핵심 데이터 마이닝 기법 중 하나인 분류는 레이블된 데이터로 훈련된 분류기를 사용하여 새로운 인스턴스의 클래스를 예측하는 것을 포함합니다. 문헌에서 제안된 여러 접근 방법에는 의사결정 나무 추출, 베이지안 분류기, 가장 가까운 이웃 검색, 신경망, 서포트 벡터 머신, 그리고 형식적 개념분석(FCA) 등이 있습니다. FCA는 해석 가능한 학습을 위한 효과적인 접근 방법으로 인정받고 있으며, 개념 격자라는 수학적 구조를 기반으로 합니다. 이 구조는 형식적 개념의 생성과 그들 사이의 숨겨진 관계를 발견하는 데 도움이 됩니다. 본 논문에서는 FCA 기반 분류기의 최신 동향을 검토합니다. 이름형 데이터에서 폐쇄 연산자 계산 방법을 다양한 방식으로 탐구하고, 가장 관련성이 높은 개념에 초점을 맞춘 부분 개념 격자의 구성 방법에 대한 새로운 접근법을 소개합니다. 제안된 방법의 효율성을 입증하기 위해 실험 결과를 제공합니다.

paper AI 요약
CoCo-Fed  메모리와 통신 효율적인 무선 엣지 연방 학습을 위한 통합 프레임워크

CoCo-Fed 메모리와 통신 효율적인 무선 엣지 연방 학습을 위한 통합 프레임워크

이 논문에서는 O-RAN 환경에서의 연방 학습(Federated Learning)을 최적화하기 위해 CoCo-Fed라는 새로운 압축 및 조합 기반 연방 학습 프레임워크를 제안한다. 이 프레임워크는 분산된 gNB들이 중앙 CPU의 관리 하에 대규모 모델을 공동으로 학습하도록 설계되었다. CoCo-Fed는 gNB에서 메모리를 효율적으로 사용하고, 백홀 링크를 통해 전송되는 데이터 양을 최소화하는 이중 단계 압축 메커니즘을 도입한다.

paper AI 요약
COMPASS  기업별 정책 일치성 평가 프레임워크

COMPASS 기업별 정책 일치성 평가 프레임워크

대형 언어 모델(LLMs)은 의료, 금융 및 공공 부문 등 다양한 분야에서 광범위하게 채택되고 있습니다. 이러한 환경에서는 조직 정책과의 일치가 필수적입니다 LLM 어시스턴트는 회사 규정, 규제 요구사항 및 안전에 중요한 제약 조건을 따르아야 합니다. 예를 들어 의료 챗봇은 건강 정보를 제공할 수 있지만 진단이나 용량 조언을 제공해서는 안 됩니다. 이러한 제약 조건을 준수하지 않으면 오정보, 규제 위반, 명성 손상 및 사용자 피해가 발생할 수 있습니다. 이러한 필요성은 보편적인 안전과 조직별 정책 일치 사이의 근본적인 차이를 강조합니다. 독소성, 폭력, 혐오 발언 등 보편적 안전 문제는 대부분 문맥에 무관하고 많은 배포 환경에서 적용됩니다. 반면 조직별 정책은 도메인 및 조직마다 세밀한 제약 조건을 정의하며 (예 투자 조언 거절, 진단 피하거나 경쟁사 참조 금지) 이와 같은 차이를 이해하는 것이 중요합니다. ###

paper AI 요약
Cost-Efficient Cross-Lingual Retrieval-Augmented Generation for Low-Resource Languages  A Case Study in Bengali Agricultural Advisory

Cost-Efficient Cross-Lingual Retrieval-Augmented Generation for Low-Resource Languages A Case Study in Bengali Agricultural Advisory

이 논문은 농업 지식에 대한 접근성을 개선하기 위해 벵골어 사용자를 위한 비용 효율적인 번역 중심의 검색 강화 생성(RAG) 프레임워크를 제안합니다. 이 시스템은 번역 -> 검색 -> 번역의 샌드위치 아키텍처 를 채택하고, 4비트 양자화 오픈 소스 언어 모델을 활용하여 소비자가 구할 수 있는 하드웨어에서 정확한 답변을 생성합니다.

paper AI 요약
DA-DPO  비용 효율적인 난이도 인식 선호 최적화로 MLLM 환영 줄이기

DA-DPO 비용 효율적인 난이도 인식 선호 최적화로 MLLM 환영 줄이기

> 직접 선호도 최적화(DPO)는 다중모드 대형 언어 모델(MLLMs)에서 환영현상(hallucinations)을 완화하는 데 큰 잠재력을 보여주고 있다. 하지만 기존의 다중모드 DPO 접근법은 선호도 데이터의 난이도 불균형으로 인해 과적합하기 쉽다. 우리의 분석에 따르면, MLLMs는 쉽게 구분할 수 있는 선호도 쌍을 지나치게 강조하므로 미세한 환영현상 억제와 전체 성능 저하가 발생한다. 이 문제를 해결하기 위해 우리는 학습 과정을 균형 있게 하는 효과적인 프레임워크인 난이도 인식 직접 선호도 최적화(DA-DPO)를 제안한다. DA-DPO는 두 가지 주요 구성 요소로 이루어져 있다 (1)*난이도 추정*은 보완적인 생성과 대조 목표를 가진 사전 훈련된 시각-언어 모델을 활용하여 추가 학습 없이 견고한 난이도 점수를 생산한다; 그리고 (2) *난이도 인식 학습*은 추정 난이도에 기반해 선호 쌍을 재가중하며, 쉽게 구분할 수 있는 샘플의 가중치를 줄이고 더 어려운 샘플에 중점을 두어 과적합을 완화한다. 이 프레임워크는 새로운 데이터나 추가적인 미세 조정 단계 없이 도전적인 예제를 우선시함으로써 선호도 최적화를 더욱 효과적으로 수행할 수 있게 한다. 광범위한 실험은 DA-DPO가 다중모드 선호도 최적화를 지속적으로 개선하고 환영현상에 대한 강건성을 향상시키며 표준 벤치마크에서 더 나은 일반화 성능을 제공하면서 계산 효율성을 유지한다는 것을 보여준다. 프로젝트 페이지는 [`https //artanic30.github.io/project_pages/DA-DPO`](https //artanic30.github.io/project_pages/DA-DPO/)에 있습니다.

paper AI 요약
DatBench  차별적이고 신뢰성 있으며 효율적인 VLM 평가

DatBench 차별적이고 신뢰성 있으며 효율적인 VLM 평가

실증적 평가는 기초 모델 연구 진전의 주요 나침반 역할을 합니다. 최신 비전-언어 모델(VLM) 훈련에 중점을 둔 많은 연구가 있음에도 불구하고, 이들의 평가 방법론은 아직 초기 단계입니다. 그 성숙을 돕기 위해 우리는 평가에서 충족해야 하는 세 가지 요구 사항을 제안합니다 (1) 모달리티와 응용 분야에 대한 충실성, (2) 다양한 품질의 모델 간 차별 가능성, 그리고 (3) 계산 효율성. 이 관점에서 우리는 충실성과 차별 가능성을 위반하고 모델 능력을 왜곡하는 중요한 실패 모드를 파악합니다 (i) 선택식 질문 형식은 추측을 장려하고 하류 사용 사례를 잘 반영하지 않으며, 모델이 개선됨에 따라 일찍 포화상태에 이릅니다; (ii) 이미지 없이도 답변 가능한 문제들로 구성된 평가의 70%까지 해당하며; (iii) 잘못 표시되거나 애매한 샘플은 일부 데이터셋에서 최대 42%를 차지합니다. 효율성 측면에서는, 가장 첨단의 모델을 평가하는 계산 부담이 금지불능 수준으로 올라갔습니다 일부 보고서에 따르면 개발용 컴퓨팅 자원의 거의 20%가 단순히 평가를 위해 사용되고 있습니다. 기존 벤치마크를 버리는 대신, 우리는 변환 및 필터링을 통해 충실도와 차별 가능성을 최대한 높이는 방법으로 이를 정제합니다. 선택식 질문을 생성적 작업으로 바꾸는 것이 모델의 능력을 최대 35%까지 급격히 낮추는 것을 발견했습니다. 또한, 무작정 해결 가능한 문제와 잘못 표시된 샘플들을 필터링하면 차별 가능성을 향상시키면서 동시에 계산 비용을 줄일 수 있습니다. 우리는 DatBench-Full이라는 33개의 데이터셋으로 구성된 청소된 평가 패키지와, 원래 데이터셋의 차별 가능성과 거의 일치하면서 평균적으로 13배(최대 50배) 속도 향상을 달성하는 차별적 하위 집합인 DatBench를 공개합니다. 우리의 연구는 VLM이 계속 확장됨에 따라 동시에 엄격하고 지속 가능한 평가 관행을 추구하는 길을 제시합니다.

paper AI 요약
DeepInv  A Novel Self-supervised Learning Approach for Fast and Accurate Diffusion Inversion

DeepInv A Novel Self-supervised Learning Approach for Fast and Accurate Diffusion Inversion

확산 역전은 확산 모델에서 이미지의 노이즈를 복원하는 작업으로, 이는 제어 가능한 확산 이미지 편집에 필수적입니다. 현재로서는 사용 가능한 감독 신호 부재로 인해 확산 역전은 여전히 난제인 상태입니다. 따라서 대부분의 기존 방법은 성능이나 효율성을 희생하면서 근사기반 해법을 사용하고 있습니다. 이러한 문제점들을 해결하기 위해 본 논문에서는 새로운 자기 감독 확산 역전 접근법, 즉 딥 인버전(DeepInv)을 제안합니다. 진정한 노이즈 주석을 요구하지 않으며, 대신 실제 이미지로부터 수동 개입 없이 고品質 가짜 노이즈를 생성하기 위해 자기 감독 목적 및 데이터 증강 전략을 도입했습니다. 이러한 두 가지 혁신적인 설계를 기반으로 DeepInv는 파라미터화된 역전 솔버를 훈련하기 위한 반복적이고 다중 규모의 훈련 체제가 구비되어 있어, 빠르고 정확한 이미지에서 노이즈로의 매핑을 달성할 수 있습니다. 우리의 지식에 따르면 이는 단계별 역전 노이즈를 예측하는 학습 가능한 솔버를 제시한 최초의 시도입니다. 광범위한 실험 결과 DeepInv가 비교 대상 방법보다 훨씬 더 우수한 성능과 추론 속도(+40.435% SSIM 보다 EasyInv, COCO 데이터셋에서 ReNoise 보다 +9887.5% 빠름)를 달성할 수 있음을 보여주고 있습니다. 또한 우리의 학습 가능한 솔버에 대한 세심한 설계는 연구 커뮤니티에도 통찰력을 제공합니다. 코드와 모델 파라미터는 https //github.com/potato-kitty/DeepInv 에서 공개될 예정입니다.

paper AI 요약
DRL과 베이지안 최적화를 활용한 URLLC 산업 IoT 네트워크의 링크 적응 및 장치 스케줄링 방법

DRL과 베이지안 최적화를 활용한 URLLC 산업 IoT 네트워크의 링크 적응 및 장치 스케줄링 방법

[^1] 제3장의 일부 내용, 즉 OLLA 지원 실행 단계는 2024년 4월에 아랍 에미리트 두바이에서 열린 IEEE 무선 통신 네트워킹 컨퍼런스(WCNC)에서 발표되었다. [^2] P. Zheng과 A. Schmeink의 연구는 독일 BMFTR의 Souverän. Digital. Vernetzt. 프로그램에 의해 지원받았으며, 6G-ANNA 공동 프로젝트(프로젝트 식별 번호 16KISK097)에 참여하였다. [^3] W. Gao, P. Wu 및 Y. Hu는 중국 후난대학교 전자 정보 학과 소속이며 (이메일 `wei.gao|peng.wu|yulin.hu`@whu.edu.cn). `$^*$`Y. Hu가 대응 저자다. [^4] P. Zheng 및 A. Schmeink은 독일 아헨 라인-베스트페펜대학교 INDA 의장실 소속이다 (이메일 `zheng|schmeink`@inda.rwth-aachen.de).

paper AI 요약
DynaFix  실행 수준 동적 정보로 주도되는 반복적 자동 프로그램 수정

DynaFix 실행 수준 동적 정보로 주도되는 반복적 자동 프로그램 수정

소프트웨어 시스템은 현대 사회의 거의 모든 중요한 분야에서 핵심적인 역할을 합니다. 이들 시스템이 복잡해질수록 버그가 늘어나게 되며, 이를 해결하기 위한 프로그램 수정 기술이 필요하게 됩니다. 최근에는 LLM(Large Language Model) 기반의 자동 패치 생성 방법이 연구되고 있으나, 이러한 접근법들은 정적 코드 정보에 크게 의존하여 동적인 실행 정보를 충분히 활용하지 못합니다. 본 논문에서는 DynaFix라는 새로운 방법론을 제시하며, 이는 비침습적인 바이트코드 악기화 기술인 ByteTrace를 이용해 프로그램의 실행 중 발생하는 동적 정보를 수집하고 이를 반복적인 수정 과정에 활용합니다.

paper AI 요약
EgoGrasp  제1인칭 동영상에서의 세계공간 손-물체 상호작용 추정

EgoGrasp 제1인칭 동영상에서의 세계공간 손-물체 상호작용 추정

이 논문에서는 제1인칭 시점의 동영상에서 손과 물체 간 상호작용을 3D 세계 좌표계에 재구성하는 방법을 제안한다. EgoGrasp는 다단계 감지–생성–최적화 프레임워크를 사용하여 현대 감지 시스템에서 얻은 정확한 3D 정보를 활용하면서, 시간과 공간적으로 일관된 결과를 보장하기 위해 생성적인 동작 사전을 도입한다. EgoGrasp는 다음과 같은 세 단계로 작동한다 (1) 전처리 제1인칭 동영상에서 정확한 카메라 궤적과 밀도가 높은 기하학적 정보를 복원하여 일관된 세계 좌표계를 설정하고, 초기 3D 손 자세와 물체의 6자유도 자세를 추출 및 정렬한다. (2) 동작 확산 두 단계로 구성된 분리된 확산 모델을 사용하여 연속적인 손과 물체의 동작을 생성한다. 첫 번째 단계는 SMPL-X 전체 신체 자세에 의해 안내되는 시간적으로 안정적인 손 궤적을 생성하며, 두 번째 단계에서는 CAD 모델 없이 자연스러운 동작을 포착하고 세계 좌표에서의 이동을 줄인다. (3) 테스트 시 최적화 SMPL-X 매개변수를 최적화하여 공간 정확성, 시간 부드러움 및 발-지면 접촉 일관성을 개선한다. ###

paper AI 요약
ElecTwit  다중 에이전트 사회 시스템 내에서 설득 연구를 위한 프레임워크

ElecTwit 다중 에이전트 사회 시스템 내에서 설득 연구를 위한 프레임워크

본 논문에서는 대형 언어 모델(LLMs)이 다중 에이전트 시스템에서 어떻게 활용되는지 살펴보고, 특히 사회적 상호작용과 설득 전략에 집중합니다. 이 연구는 ElecTwit라는 정치 선거를 모방한 시나리오를 통해 LLMs의 설득 능력을 평가하며, 이를 통해 실제 세계에서 에이전트들이 어떻게 행동할지 더 정확하게 이해하려고 합니다.

paper AI 요약
F2IDiff  실 세계 이미지 초해상도 강화를 위한 특징에서 이미지로의 확산 기반 모델

F2IDiff 실 세계 이미지 초해상도 강화를 위한 특징에서 이미지로의 확산 기반 모델

생성형 인공지능의 도입으로 단일 이미지 초해상도(SISR) 품질이 크게 개선되었으며, 텍스트-투-이미지 확산(T2IDiff) 기반 모델에서 학습한 강력한 사전 지식은 고해상도(HR)와 저해상도(LR) 이미지 사이의 간격을 줄일 수 있습니다. 그러나 플래그십 스마트폰 카메라는 생성형 모델을 채택하는 데 느리게 반응하고 있으며, 강력한 생성은 불필요한 환영현상을 초래할 수 있기 때문입니다. 학계에서 볼 수 있는 크게 훼손된 LR 이미지는 강력한 생성이 필요하며, HR과의 큰 간격 때문에 환영현상도 어느 정도 용인됩니다. 반면에 소비자 사진에서는 LR 이미지가 상당히 높은 정확성을 가지고 있으며, 따라서 최소한의 환영현상 없는 생성만 요구됩니다. 우리는 SISR에서 생성이 FM의 조건부 기능의 엄격성과 풍부함에 의해 제어된다고 가정합니다. 첫째, 텍스트 특징은 고수준의 특징으로 이미지의 미세한 텍스처를 설명하는 데 자주 부적절할 수 있습니다. 또한 스마트폰 LR 이미지는 최소 12MP 이상이지만 T2IDiff FM 기반 SISR 네트워크는 훨씬 작은 이미지(<1MP)에 대해 추론하도록 설계되었습니다. 그 결과 SISR 추론은 종종 텍스트 특징으로 정확하게 설명하기 어려운 작은 패치에서 이루어져야 합니다. 이러한 단점을 해결하기 위해 우리는 하위 수준의 조건부 기능을 가진 FM, 특히 DINOv2 특성을 사용한 이미지 확산(Feature-to-Image Diffusion) 기반 모델(FM)이라고 명명하는 SISR 네트워크를 도입합니다. 하위 수준의 특징은 엄격한 조건부를 제공하면서 동시에 작은 패치도 충분히 설명할 수 있습니다.

paper AI 요약
Falcon-H1R  하이브리드 모델을 이용한 효율적인 테스트 시 확장성 개선

Falcon-H1R 하이브리드 모델을 이용한 효율적인 테스트 시 확장성 개선

대규모 언어 모델(LLMs)은 복잡한 추론 작업을 수행하는 데 있어 큰 성과를 거두었으며, 이는 훈련 및 추론 시 확장성을 통해 달성되었습니다. 훈련 확장을 통해 LLMs는 더 복잡한 문제 해결 능력을 갖추게 되지만, 이를 위해 필요한 계산 자원이 증가하고 고급 데이터가 제한적일 수 있습니다. 이러한 문제를 해결하기 위해 시험 시간 확장(TTS)이라는 새로운 방법론이 도입되었으며, 이는 추가적인 추론 시 계산 자원을 할당하여 잠재적인 추론 능력을 향상시킵니다. Falcon-H1R은 TTS 방법론을 활용해 추론 효율성을 높이는 7B 모델입니다. ###

paper AI 요약
Gemini-3-Pro를 넘어  대규모 LLM 라우팅 및 집약 재검토

Gemini-3-Pro를 넘어 대규모 LLM 라우팅 및 집약 재검토

이 논문에서는 대형 언어 모델(LLM)들의 협업을 통해 인공일반지능(AGI)으로의 새로운 접근 방법을 제안한다. 특히, 개별적으로 약한 오픈소스 LLM들이 협력하여_gemini-3-pro_와 같은 주요 폐쇄형 모델들을 능가할 수 있음을 보여준다. 이를 위해 **JiSi**라는 새로운 프레임워크를 제안하며, 이는 라우팅과 집약(aggregation)의 통합을 통해 LLM들의 협업을 최적화한다.

paper AI 요약
HFedMoE  자원인지형 이질적인 연방학습과 전문가 혼합 모델

HFedMoE 자원인지형 이질적인 연방학습과 전문가 혼합 모델

연방 학습(FL)은 데이터 프라이버시를 해치지 않고도 대형 언어 모델(LLM)의 미세 조정을 가능하게 하지만, LLM의 커다란 크기는 리소스 제약이 있는 클라이언트, 예를 들어 휴대폰 기기에서는 온-디바이스 트레이닝이 실질적으로 불가능하게 합니다. 따라서, Mixture-of-Experts(MoE) 모델은 모델 학습 중 일부 레이어만 활성화하여 계산 부담을 줄이는 효율적인 방법으로 등장했습니다. 그러나 MoE를 FL 미세 조정에 통합하는 것은 여전히 세 가지 주요 과제를 안고 있습니다 i) 각 전문가의 로컬 미세 조정 성능에 대한 영향을 측정할 수 있는 신뢰성 있는 지표 부재로 인해 적절한 전문가 선택이 어렵습니다, ii) 다양한 입력 샘플에서 동적으로 활성화되는 전문가들이 리소스 제약 기기에서 계산 부담을 초래하기 때문에 클라이언트 간 이질적인 컴퓨팅 자원은 MoE 기반 LLM 미세 조정을 심각하게 방해합니다, iii) 클라이언트별로 다른 전문가 하위 집합과 라우팅 선호도는 맞춤형 업데이트와 일관되지 않은 게이팅 네트워크를 통해 전역 집약을 방해합니다. 이러한 과제를 해결하기 위해, 우리는 HFedMoE라는 이질적인 MoE 기반 FL 미세 조정 프레임워크를 제안합니다. 특정 클라이언트의 컴퓨팅 예산에 맞게 일부 전문가를 선택적으로 활성화하여 계산 효율성을 높이는 것입니다. 구체적으로, HFedMoE는 각 전문가의 미세 조정 성능 기여도를 바탕으로 중요도를 식별하고 정보 병목 관점에서 적응적 전문가 하위 집합을 선택합니다. 또한 중요한 요소에 가중치를 부여하여 활성화된 미세 조정 전문가와 게이팅 파라미터를 집약하기 위한 스팽서리 인식 모델 집약 전략도 설계되었습니다. 광범위한 실험 결과는 HFedMoE가 훈련 정확도와 수렴 속도 측면에서 최신 벤치마크를 능가함을 보여줍니다.

paper AI 요약
HOG과 딥 피처 통합을 통한 히스토พา토로지 이미지 분류 강화 및 견고한 노이즈 성능

HOG과 딥 피처 통합을 통한 히스토พา토로지 이미지 분류 강화 및 견고한 노이즈 성능

디지털 병리학은 현대 의료 실무에서 중요한 기술로 발전하여, 복잡한 조직 이미지를 분석하는 데 필요한 자동화 방법을 개발하게 되었습니다. 특히 머신러닝과 인공지능의 발달 덕분에 복잡한 병리학적 이미지에서 의미 있는 패턴을 추출할 수 있게 되었으며, 이를 통해 정확하고 효율적인 진단이 가능해졌습니다. ###

paper AI 요약
IoT 보안 해킹  LLM들이 정적 분석 도구를 능가할 수 있을까?

IoT 보안 해킹 LLM들이 정적 분석 도구를 능가할 수 있을까?

스마트 홈 IoT 애플리케이션의 급속한 채택은 가정 자동화를 혁신적으로 변화시켰지만, 이에 따른 규칙 상호작용 위협(RIT)을 해결하기 위한 도전 과제가 발생했습니다. 기존 접근 방식은 정밀도는 높으나 대규모 코드베이스에서의 확장성과 적응력이 부족합니다. 본 논문에서는 대형 언어 모델(LLMs)이 IoT 자동화 시스템에 대한 보안 분석을 개선하는 데 얼마나 효과적인지 평가했습니다.

paper AI 요약
JMedEthicBench  일본 의료 대형 언어 모델의 안전성 평가를 위한 다중 대화 벤치마크

JMedEthicBench 일본 의료 대형 언어 모델의 안전성 평가를 위한 다중 대화 벤치마크

이 논문은 JMedEthicBench라는 일본 의료 환경을 위한 다중 대화 안전성 평가 벤치마크를 소개합니다. 이 벤치마크는 67개의 구체적인 임상 시나리오를 포함한 일본 의학협회(JMA) 지침을 바탕으로 하며, 오토메이티드 적대적 공격 전략을 사용하여 모델 안전성의 경계를 탐색합니다. 이 평가 틀은 단일 대화에서 벗어나 복잡한 다중 대화 상황을 고려하며, 이를 통해 의료 AI 모델이 실제 환경에서도 안전하게 작동할 수 있는지 확인합니다.

paper AI 요약
K-EXAONE 기술 보고서

K-EXAONE 기술 보고서

이 기술 보고서는 LG AI Research에서 개발한 대규모 다국어 언어 모델 K-EXAONE을 소개합니다. K-EXAONE은 총 236B의 파라미터를 갖춘 Experts 혼합 구조 위에 구축되어 있으며, 추론 과정에서는 23B의 파라미터가 활성화됩니다. 이 모델은 256K 토큰 컨텍스트 윈도우를 지원하며 한국어, 영어, 스페인어, 독일어, 일본어, 베트남어 등 여섯 가지 언어를 다룹니다. 우리는 K-EXAONE을 종합적인 벤치마크 스위트에 대한 평가에서 논리적 추론 능력, 에이전시 능력, 일반적인 능력, 한국어 전문성 및 다국어 기능을 평가합니다. 이러한 평가를 통해 K-EXAONE은 유사한 크기의 공개 가중치 모델과 비교할 수 있는 성능을 보여줍니다. K-EXAONE은 더 나은 삶을 위한 AI 발전을 목표로 하며, 다양한 산업 및 연구 애플리케이션에 활용될 수 있는 강력한 소유권 AI 기반 모델로서의 위치를 차지하고 있습니다.

paper AI 요약
KGCE  교육용 다중 플랫폼 에이전트 평가를 위한 지식강화 이중 그래프 평가자

KGCE 교육용 다중 플랫폼 에이전트 평가를 위한 지식강화 이중 그래프 평가자

다목적 대형 언어 모델(MLMs)이 자율 에이전트에 빠르게 채택되면서 교육 환경에서의 플랫폼 간 작업 수행 능력이 큰 주목을 받고 있다. 그러나 기존 벤치마크 프레임워크는 특히 학교 전용 소프트웨어(XiaoYa 지능형 어시스턴트, HuaShi XiaZi 등)를 다룰 때 플랫폼 간 작업 지원에서 눈에 띄는 부족함을 보이고 있으며, 이로 인해 에이전트의 효율성이 크게 저하되는 경우가 많다. 또한 현재 평가 방법은 목표 지향성이나 트래젝토리 일치와 같은 거친 메트릭스에 의존하여 복잡한 작업에서 에이전트의 자세한 수행과 효율성을 포착하는 데 어려움을 겪고 있다. 이러한 문제를 해결하기 위해 우리는 다목적 언어 모델을 사용한 교육용 플랫폼 간 에이전트 벤치마킹에 대한 지식 강화 이중 그래프 평가기(KGCE)라는 새로운 벤치마크 플랫폼을 제안한다. KGCE는 지식 기반 향상과 이중 그래프 평가 프레임워크를 통합한다. 우리는 윈도우, 안드로이드 및 플랫폼 간 협업 작업을 포함하는 104개의 교육 관련 작업으로 구성된 데이터셋을 구축하였다. KGCE는 작업을 여러 서브 목표로 분해하고 그 완료 상태를 검증하는 이중 그래프 평가 프레임워크를 도입하여 세밀한 평가 메트릭을 제공한다. 기존 에이전트의 학교 전용 소프트웨어 작업 수행에 대한 실행 병목 현상을 극복하기 위해 학교 전용 소프트웨어에 특화된 지식 기반을 포함하는 강화된 에이전트 시스템을 개발하였다. 코드는 https //github.com/Kinginlife/KGCE에서 확인할 수 있다.

paper AI 요약
No Image

Language as Mathematical Structure Examining Semantic Field Theory Against Language Games

대규모 언어 모델(LLMs)이 순수한 수학적 연산을 통해 인간과 비슷한 언어 성능을 달성함으로써, 의미의 주요 이론에 근본적인 도전을 제기하고 있습니다. 사회 구조주의 입장은 언어가 형식적 구조로 축소될 수 없다고 주장하지만, 변환자 구조는 사회적 기반이 없이 체계적인 의미 관계를 발견합니다. 이 논문에서는 이러한 발전을 예측한 작가의 사상에 대해 분석하고, 언어가 내재된 수학적 구조를 가질 수 있다는 주장을 제기합니다.

paper AI 요약
LinMU  선형화로 다중 모달 이해 단순화

LinMU 선형화로 다중 모달 이해 단순화

> 최근의 비전-언어 모델(VLMs)은 인상적인 성능을 보여주지만, 자기 주의력(self-attention)의 이차적 복잡도로 인해 엣지 장치에서의 배포가 제한되며, 고해상도 이미지와 긴 컨텍스트 비디오에 대한 이해를 수행하는 데 큰 비용이 발생한다. 이러한 문제를 해결하기 위해 우리는 LinMU(Linear-complexity Multimodal Understanding)을 소개한다. 이 모델은 자기 주의력 기반 VLMs의 성능을 유지하면서 모든 자기 주의력 층을 M-MATE 블록으로 대체하여 선형 복잡도를 달성한다. M-MATE 블록은 전역 컨텍스트를 포착하기 위한 양방향 상태 공간 모델(Flex-MA 분기)과 인접한 상관관계를 처리하는 로컬 Swin 주의력(Local-Swin 분기)을 결합한 이중 분기 모듈이다. 기존 VLM을 LinMU 아키텍처로 변환하기 위해, 우리는 세 단계의 지식 추출(distillation) 프레임워크를 제안한다 (i) 양 분기를 자기 주의력 가중치로 초기화하고 Flex-MA 분기만 학습, (ii) Local-Swin 분기를 해동하여 두 분기를 함께 조정, (iii) 나머지 블록을 LoRA 어댑터를 사용해 조정하면서 동결된 VLM 교사의 은닉 상태와 토큰 수준 로짓에 대해 회귀한다. MMMU, TextVQA, LongVideoBench, Video-MME 등의 벤치마크에서 LinMU는 교사 모델과 유사한 성능을 보이면서 Time-To-First-Token(TTFT)을 최대 2.7배 줄이고 분단위 비디오의 토큰 처리 속도를 최대 9.0배 개선한다. ###

paper AI 요약
LION-DG  깊은 그래디언트 프로토콜을 활용한 계층 정보 초기화를 통한 가속 신경망 학습

LION-DG 깊은 그래디언트 프로토콜을 활용한 계층 정보 초기화를 통한 가속 신경망 학습

깊은 신경망에서 보조 분류기((auxiliary classifiers))는 중간 레이어에서 추가적인 그래디언트 신호를 제공함으로써 학습을 가속화하고 그래디언트 흐름을 개선하는데 효과적이다. 그러나 보조 분류기를 어떻게 초기화해야 하는지는 여전히 연구되지 않은 문제다. 본 논문에서는 LION-DG(Layer-Informed Initialization with Deep Gradient protocols)를 제안하며, 이는 보조 분류기를 0으로 초기화하고 백본 레이어에 대해 표준적인 초기화 방법을 사용하는 전략이다. 실험 결과 LION-DG는 더 빠른 학습 속도와 최고의 정확성을 달성하며, 특히 DenseNet-DS에서 8.3%의 속도 향상을 보였다. ###

paper AI 요약
LLM 기반 자동차 시스템의 안전성 및 보안 설계

LLM 기반 자동차 시스템의 안전성 및 보안 설계

이 논문은 자동차 산업의 혁신에서 가장 중요하게 여겨지는 기능적 안전성과 사이버 보안을 유지하면서 고급 차량 기능의 신속한 프로토타입, 검증 및 배포에 중점을 둔다. 특히 복잡해지고 있는 소프트웨어 정의 차량(SDV)에서 이러한 중요성이 더욱 부각된다. 대규모 언어 모델(LLMs)은 자연어 요구사항에서 구조를 추출하고 초기 행동 모델을 생성하여 이 과정을 가속화할 수 있는 새로운 기회를 제공한다. 그러나 LLMs가 무분별하게 사용될 경우, 정확성과 안전한 동작, 타이밍 결정론, 보안 포지셔닝에 대한 보장이 부족하다는 문제점이 있다. 따라서 이러한 간극을 메우기 위해 기능적 안전성 및 보안 분석을 지원하기 위한 이벤트 체인(Event Chain) 기반의 LLM 가이드 워크플로를 제안한다. 이 방법은 자동차 시스템에서 안전 메커니즘과 타이밍 요구사항을 구성하는 인과적, 시간적, 데이터 흐름 관계를 구조화된 표현으로 제공하며, LLM의 출력을 제약하고 안전하지 않거나 검증되지 않은 동작이 생성되는 것을 방지한다. 또한 이 프레임워크 내에서는 LLM이 전문적인 도메인 지식이 필요한 작업들을 자동화하는 데 도움을 주며, 텍스트 요구사항에서 후보 안전 메커니즘을 도출하거나 기능적 의도와 차량 신호 사양(VSS)을 정렬하고 잠재적인 위험 또는 비안전 상호작용을 식별한다. 뿐만 아니라 검색 강화 생성(RAG)은 LLM의 추론 범위를 인정된 VSS 카탈로그, 안전 매뉴얼 및 아키텍처 설명과 같은 신뢰할 수 있는 데이터 소스로 제한하여 환영 신호나 평가되지 않은 데이터 경로를 줄인다. 이를 통해 자동으로 생성된 모델은 안전 및 사이버 보안 심사에 필요한 권위있는 출처와의 추적 가능성을 유지한다. 이벤트 체인 모델과 LLM 간의 시너지는 기능적 안전성(예 시간 예산 위반, 인과 체인 파괴, 누락된 안전 반응) 및 사이버 보안(예 무단 신호 경로, 일관되지 않은 신뢰 경계 또는 예상치 못한 제어 영향력)에 대한 자동 사전 분석을 가능하게 한다. 코드가 타겟 플랫폼으로 배포되기 전에 ISO 26262 파트 6(소프트웨어 아키텍처 제약 조건) 및 ISO 21434(안전한 신호 및 인터페이스 처리)와 일치하는 일관성 검사를 수행한다. 결과적으로 LLM 생성 아티팩트는 더 신뢰할 수 있으며, 기존 안전 공학 워크플로에 직접 통합될 수 있다. 이러한 제안된 파이프라인은 자동차 코드의 안전 및 보안 분석 절차를 자동화하려는 시도로서 초기 디자인 단계에서의 노력 감소와 동시에 현대적인 안전 및 사이버 보안 요구사항을 충족하는 엄격함을 유지한다. 이를 증명하기 위해 우리는 물리적 테스트벤치와 시뮬레이션 플랫폼 기반의 ADAS 시나리오에 이 워크플로를 적용한다.

paper AI 요약
LLM 에이전트를 활용한 조합적 효율적 프론티어  투자 포트폴리오 최적화

LLM 에이전트를 활용한 조합적 효율적 프론티어 투자 포트폴리오 최적화

이 논문은 실생활 상황에 적합한 다목적 조합 최적화 문제를 해결하기 위해 언어 모델 에이전트 프레임워크를 개발하고 검증한다. 이 프레임워크는 기존의 벤치마크 연구와 달리, 실제 문제의 복잡성을 반영하며, 특히 NP-난해 문제에 효과적이다. 또한, 생성된 알고리즘 포트폴리오는 다양한 투자 포트폴리오 최적화 문제에서 우수한 성능을 보여준다.

paper AI 요약

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키