KOINEU Logo
멀티모달 단일 롤아웃 학습 효율성 향상: MSSR (Multimodal Stabilized Single‑Rollout) 소개

멀티모달 단일 롤아웃 학습 효율성 향상: MSSR (Multimodal Stabilized Single‑Rollout) 소개

1. 연구 배경 및 동기 - RLVR 은 인간 피드백 대신 자동 검증 가능한 정답 신호를 사용해 LLM/MLLM을 정렬한다는 점에서 비용‑효율적인 학습 방법으로 주목받고 있다. - 멀티모달 환경에서는 시각‑언어 인코더 가 무거워, 다중 롤아웃 (그룹 기반) 방식이 연산량을 급증시킨다. - 기존 텍스트‑전용 단일 롤아웃 연구(

멀티모달 도구 사용 벤치마크 M3

멀티모달 도구 사용 벤치마크 M3

M 3‑Bench는 현재 멀티모달 대형 언어 모델(MLLM)이 실제 업무 환경에서 도구를 활용하는 능력을 정량화하고 진단하기 위한 중요한 시도이다. 기존 벤치마크들은 주로 단일 이미지‑텍스트 질문응답이나 단일 단계 도구 호출에 초점을 맞추어 왔으며, 복합적인 워크플로우에서 발생하는 “도구 간 의존성”이나 “중간 결과의 지속성” 같은 문제를 충분히 반영하지 못했다. 본 논문은 이러한 한계를 극복하기 위해 모델 컨텍스트 프로토콜(MCP)이라는 프레

멀티모달 오토인코더의 리프시츠 특성 분석과 주의 기반 융합 안정화 기법

멀티모달 오토인코더의 리프시츠 특성 분석과 주의 기반 융합 안정화 기법

본 논문은 멀티모달 자동인코더(Multimodal Autoencoders, MAE)의 학습 안정성을 리프시츠 연속성(Lipschitz continuity) 관점에서 체계적으로 탐구한다는 점에서 의미가 크다. 먼저 저자들은 ‘융합(aggregation)’ 단계에서 발생할 수 있는 급격한 출력 변동을 수학적으로 제한하기 위해 각 융합 방법에 대한 리프시츠 상수를 명시적으로 도출한다. 이 과정에서 사용된 주요 수학적 도구는 삼각 부등식, 행렬 노름의

No Image

메시지 검사 기반 상태공간 축소: 보안 프로토콜 모델 검증의 새로운 패러다임

1. 연구 배경 및 동기 - 상태공간 폭발 은 일반 목적 모델 체킹뿐 아니라 보안 프로토콜 검증에서도 가장 큰 장애물이다. 특히 Dolev‑Yao 공격자는 모든 가능한 메시지 조합을 고려해야 하므로 탐색 트리가 급격히 커진다. - 기존 연구들은 대칭 감소 , 부분 순서 감소 , 프리컴퓨테이션 등을 활용했지만, 프로토콜 특유의 논리적 오류를 사전에 차단하는 메커니즘은 부족했다. 2. 핵심 아이디어 – M

모나딕 컨텍스트 엔지니어링: 대형 언어 모델 에이전트 설계의 새로운 패러다임

모나딕 컨텍스트 엔지니어링: 대형 언어 모델 에이전트 설계의 새로운 패러다임

본 논문이 제시하는 Monadic Context Engineering(MCE)은 함수형 프로그래밍의 핵심 개념을 AI 에이전트 설계에 직접 적용함으로써, 기존의 명령형, 절차적 접근법이 안고 있던 구조적 결함을 근본적으로 해소한다는 점에서 큰 의의를 가진다. 먼저 Functor와 Applicative Functor는 컨텍스트 내부의 값들을 변형하거나 결합하는 기본 연산을 제공한다. 이를 에이전트 워크플로우에 매핑하면, 개별 행동(step)들을

모델 컨텍스트 프로토콜(MCP) 기반 의료 AI — MCP‑AI: 임상 추론의 혁신적 설계와 실제 적용

모델 컨텍스트 프로토콜(MCP) 기반 의료 AI — MCP‑AI: 임상 추론의 혁신적 설계와 실제 적용

1. 연구의 배경 및 필요성 - 현존 문제 : 전통적인 CDSS는 규칙 기반이라 유연성이 부족하고, 최신 LLM은 뛰어난 언어 생성 능력에도 불구하고 상태 지속성·설명 가능성·규제 적합성 이 결여됨. - 임상 현장의 복잡성 : 정신건강·만성질환·희귀질환 등에서는 시간에 따라 변하는 다중 모달 데이터와 다학제 협업이 필수이며, 기존 도구는 이러한 연속적 맥락을 유지하지 못한다. 2. 핵심 아이디어 및 기여

No Image

모듈식 무작위 불린 네트워크(MRBN): 유전조절망의 실제 구조를 반영한 새로운 동역학 모델

1. 연구 배경 및 필요성 - RBN의 한계 : 전통적인 RBN은 노드 간 연결이 완전히 무작위이며, 실제 생물학적 시스템이 보여주는 모듈화·계층화 를 반영하지 못한다. - 모듈성의 생물학적 의미 : 모듈은 진화적 유연성을 제공하고, 기능적 변화가 다른 부분에 미치는 파급 효과를 억제한다. 따라서 GRN을 이해하려면 모듈 구조를 모델에 포함시켜야 한다. 2. MRBN 모델 정의 요소 기호 의미 ---

모바일 GUI 에이전트 평가를 위한 MobiBench: 모듈형 다경로 오프라인 벤치마크

모바일 GUI 에이전트 평가를 위한 MobiBench: 모듈형 다경로 오프라인 벤치마크

MobiBench는 모바일 GUI 에이전트 평가에 있어 두 가지 주요한 문제점을 해결하려고 합니다. 첫 번째로, 기존의 오프라인 벤치마크는 정적이고 단일 경로의 데이터셋을 사용하여 다양한 행동 패턴을 제대로 평가하지 못하는 한계를 가지고 있습니다. 두 번째로, 온라인 라이브 벤치마크는 동적인 환경에서 이루어져 확장성과 재현성이 낮은 문제점이 있습니다. MobiBench는 이러한 문제점을 해결하기 위해 모듈형 다경로 오프라인 벤치마킹 프레임워크를

모션 블러 한 장으로 과거·현재·미래를 그려낸다: 대규모 비디오 디퓨전 모델 기반 이미지·비디오 복원

모션 블러 한 장으로 과거·현재·미래를 그려낸다: 대규모 비디오 디퓨전 모델 기반 이미지·비디오 복원

1. 연구 배경 및 동기 - 모션 블러의 이중성 : 전통적으로 사진 품질 저하 요인으로 간주되었지만, 노출 동안의 시간‑공간 정보를 내포하고 있어 장면 동역학을 추론할 수 있는 귀중한 신호이다. - 기존 접근법의 한계 : 손수 만든 블러 커널 사전, 제한된 데이터셋(수만~수십만 쌍) 기반의 딥러닝 모델, 그리고 “현재” 프레임 복원에만 초점을 맞춘 점이 주요 제약으로 작용한다. 2. 핵심 아이디어 - 조건부

목재 단면 중심부 자동 검출 딥러닝 모델 비교 연구

목재 단면 중심부 자동 검출 딥러닝 모델 비교 연구

본 논문은 목재 단면 이미지에서 중심부(pith)를 자동으로 검출하기 위한 최신 딥러닝 모델들의 성능을 체계적으로 비교한다는 점에서 의미가 크다. 먼저 데이터 구축 단계에서 582장의 라벨링된 이미지에 동적 증강(회전, 스케일 변환, 색상 변형 등)을 적용한 것은 모델의 일반화 능력을 크게 향상시킬 수 있는 전략이다. 특히, 증강 과정에서 라벨 마스크와 원본 이미지 간 텐서 차원을 일치시키는 작업이 필요했으며, 이는 종종 “tensor mism

무선주파수 라디언스필드 기반 사전학습으로 실내 위치추정 일반화 혁신

무선주파수 라디언스필드 기반 사전학습으로 실내 위치추정 일반화 혁신

본 논문은 실내 위치추정 분야에서 가장 시급한 문제 중 하나인 “교차 장면 일반화”에 초점을 맞추고 있다. 기존 딥러닝 기반 위치추정 모델은 특정 환경에서 수집된 라벨링 데이터에 크게 의존한다. 따라서 새로운 건물이나 배치가 바뀐 환경에 적용하려면 다시 라벨링된 데이터를 수집하고 재학습해야 하는 비효율성이 존재한다. 이러한 한계를 극복하기 위해 저자들은 두 가지 핵심 아이디어를 도입한다. 첫째, 방대한 비라벨링 RF 데이터를 활용한 자체지도 사

No Image

무작위 스케줄링으로 풀어낸 무선·광회선 네트워크의 안정성: 저복잡도 분산 알고리즘

1. 연구 배경 및 문제 정의 - 무선 네트워크 모델 : n개의 단일 홉 큐가 간섭 그래프 (G=(V,E)) 로 연결돼 동시에 전송이 불가능한 노드 쌍이 존재한다. 각 큐는 Bernoulli 도착 과정을 갖고, 전송은 단위 속도로 진행한다. - 버퍼드 회선 교환 네트워크 모델 : 용량이 정수인 링크들로 구성된 그래프 위에 n개의 경로가 정의되고, 각 경로에 도착하는 플로우는 지수분포(평균 1)의 서비스 시간을 요구한다. 경로별

물리 제약을 고려한 고속 역설계 Dflow SUR의 차별화 전략

물리 제약을 고려한 고속 역설계 Dflow SUR의 차별화 전략

본 논문은 생성적 역설계(generative inverse design) 분야에서 물리적 제약을 효율적으로 반영하는 새로운 방법론을 제시한다. 기존의 에너지 기반 모델은 손실 함수(Loss)를 최소화하는 과정에서 흐름 매칭(flow matching)이라는 추론 단계와 물리 손실 최적화 단계가 서로 얽혀 비동기적인 최적화 현상이 발생한다. 즉, 흐름 매칭이 충분히 수렴하기 전에 물리 손실이 업데이트되면서 전체 최적화가 지연되고, 결과적으로 설계

물리학에서 결정론과 비결정론의 표상적 대립과 모델 불변성 기반 구조 실재론

물리학에서 결정론과 비결정론의 표상적 대립과 모델 불변성 기반 구조 실재론

이 논문은 물리학의 근본적인 논쟁인 ‘결정론 vs. 비결정론’이 실제 세계의 본질적 속성을 놓고 벌어지는 것이 아니라, 과학자들이 선택하는 수학적 표상 방식에 따른 차이라는 점을 강조한다. 저자는 먼저 동역학 시스템이 동일한 물리 현상을 두 가지 서로 다른 수학적 언어—완전 결정론적 방정식과 확률적 마코프 과정—로 기술할 수 있음을 보여준다. 이러한 이중 표현은 단순히 수학적 편의성의 문제가 아니라, 실제 물리 이론들(예: 양자역학의 파동함수와

No Image

바람·제트가 만든 ⁵⁶Ni: 감마선 폭발 중심 엔진을 가늠하는 초신성 핵합성 연구

1. 연구 배경 및 목표 - GRB‑SN 연관성 : 관측적으로 GRB와 Ic형 초신성의 연관이 확립됐지만, 중심 엔진(블랙홀·디스크)과 초신성 폭발 메커니즘 사이의 정량적 연결 고리는 부족했다. - 핵심 질문 : 바람/제트가 별 내부에 전달하는 에너지·질량 흐름이 초신성의 물리량(폭발에너지, ⁵⁶Ni 질량, 잔류 질량 등)을 어떻게 결정하는가? 2. 이론적 프레임워크 변수 정의 물리적 의미 ----

바빌로니아 기하학 문제판에 숨겨진 “√2는 무리수” 증명: 고대 수학의 새로운 재발견

바빌로니아 기하학 문제판에 숨겨진 “√2는 무리수” 증명: 고대 수학의 새로운 재발견

1. 연구 배경 및 목적 - 그리스와 바빌로니아 수학 비교 : 전통적으로 √2의 무리수 증명은 기원전 5세기경 피타고라스 학파에 귀속된다. 반면 바빌로니아는 YBC 7289와 같은 판에서 √2의 3자리 성수(1;24,51)와 그 역수를 기록했지만, 무리수 개념 자체를 가졌다고는 보지 않았다. - 연구 질문 : BM 15285와 같은 기하학 문제판에 무리수 증명이 내포되어 있는가? 만약 그렇다면, 바빌로니아 수학자들이 무리수 개

반사적 신뢰도 기반 효율적 추론 프레임워크

반사적 신뢰도 기반 효율적 추론 프레임워크

본 논문은 대형 언어 모델(LLM)의 추론 효율성을 개선하기 위한 새로운 패러다임을 제시한다. 기존의 체인‑오브‑생각(Chain‑of‑Thought, CoT) 기법은 모델이 단계별로 사고 과정을 서술하도록 유도함으로써 복잡한 문제 해결 능력을 크게 향상시켰다. 그러나 CoT만으로는 답안의 정확성을 보장하기 어려워, 여러 개의 추론 경로를 동시에 생성하고 다수결 원칙에 따라 최종 답을 선택하는 자기‑일관성(Self‑Consistency) 기법이

방사선 기초 모델 Pillar0 대규모 CT MRI 사전학습과 RATE 라벨링 프레임워크를 통한 임상 성능 혁신

방사선 기초 모델 Pillar0 대규모 CT MRI 사전학습과 RATE 라벨링 프레임워크를 통한 임상 성능 혁신

본 논문은 방사선 분야에서 기초 모델의 실용성을 크게 한 단계 끌어올린 연구로 평가할 수 있다. 첫째, 데이터 규모와 다양성에서 눈에 띈다. 복부·골반, 흉부, 두경부 CT와 유방 MRI를 포함한 4가지 영상 모달리티를 총 155,292건 이상 확보했으며, 이는 기존 의료 이미지 모델이 주로 제한된 장기나 단일 모달리티에 머물렀던 점을 크게 뛰어넘는다. 특히 CT와 MRI를 동시에 다루면서도 3D 볼륨 정보를 온전히 보존하는 학습 파이프라인을

범용 고충실도 시뮬레이션 플랫폼 TongSIM

범용 고충실도 시뮬레이션 플랫폼 TongSIM

TongSIM은 현재 구현형 AI 연구에서 가장 시급히 요구되는 ‘범용성’과 ‘고충실도’를 동시에 만족시키는 시뮬레이션 프레임워크로 평가할 수 있다. 첫째, 실내 시나리오가 100여 개에 달한다는 점은 기존 연구에서 흔히 사용되는 몇 개 안 되는 방형 환경(예: AI2‑THOR, Habitat)과 비교해 데이터 다양성 측면에서 큰 장점을 제공한다. 다양한 방 구조, 가구 배치, 조명 조건 등을 자동 생성하거나 사용자가 직접 편집할 수 있어, 에

범위 분할 엔트로피 기반 알고리즘의 보편 최적성 증명

범위 분할 엔트로피 기반 알고리즘의 보편 최적성 증명

이 논문은 최근에 제안된 TimSort‑영감 알고리즘들의 이론적 한계를 명확히 규정함으로써 알고리즘 설계와 분석 분야에 중요한 기여를 한다. 먼저 저자들은 “범위 분할 엔트로피”(Range Partition Entropy)라는 새로운 복잡도 측정 지표를 도입한다. 기존의 정렬 알고리즘에서는 입력의 “정렬도”를 측정하기 위해 인버전 수나 런(run) 수와 같은 지표를 사용했지만, 여기서는 점 집합이 어떻게 공간적으로 분할되는가에 초점을 맞추어 H

법률 LLM 성능을 끌어올리는 ‘문서 구조 재배치 + 역할 기반 프롬프트’ 혁신 전략

법률 LLM 성능을 끌어올리는 ‘문서 구조 재배치 + 역할 기반 프롬프트’ 혁신 전략

1. 연구 배경 및 동기 - 도메인 격차 : LLM은 일반 웹 텍스트에 기반해 사전학습되었으나, 법률은 전문 용어·긴 문서·복합 논리 구조를 갖는다. 기존 도메인‑특화 LLM을 만들려면 막대한 비용과 데이터가 필요함. - 인‑컨텍스트 학습(ICL) : 재학습 없이 프롬프트 설계만으로 모델을 특정 작업에 맞추는 접근이 최근 주목받고 있다. 하지만 법률 텍스트에 대한 구조적·의미적 보강이 얼마나 효과적인지는 충분히 검증되지 않았다.

No Image

베이지안 네트워크 구조 학습을 위한 R 패키지 bnlearn 완전 정복

1. 연구 배경 및 필요성 - 베이지안 네트워크의 활용 확대 : OLAP 성능 향상, 의료 서비스 분석, 유전자 발현 연구 등 고차원 데이터가 등장하면서 BN이 중요한 분석 도구로 자리 잡았다. - 구조 학습의 난제 : 차원 수가 커질수록 가능한 DAG(Directed Acyclic Graph)의 수가 기하급수적으로 늘어나며, 효율적인 탐색·검정 방법이 요구된다. 기존 논문에서 제안된 Grow‑Shrink, IAMB, MMPC

베이지안 사전 가이드 최적화로 강화된 그룹 상대 정책 최적화

베이지안 사전 가이드 최적화로 강화된 그룹 상대 정책 최적화

그룹 상대 정책 최적화(GRPO)는 사후 학습(post‑training) 방식으로 대규모 시각 생성 모델을 미세 조정할 때, 정책 업데이트를 그룹 단위로 수행하고 보상 모델이 제공하는 신호에 비례해 샘플을 재가중하는 경량화된 접근법이다. 이 구조는 계산 효율성과 구현 단순성에서 큰 장점을 제공하지만, 근본적인 한계는 텍스트‑시각 대응이 ‘다대다’ 관계라는 점에 있다. 예를 들어 “해변에서 노을”이라는 프롬프트는 파도, 모래, 하늘 색채 등 다양

No Image

벡터 공간의 계산적 정의: 재작성 시스템으로 보는 선형 대수의 새로운 시각

1. 연구 배경 및 동기 - 전통적인 대수 구조는 집합 + 연산 + 공리 로 정의한다. - 일부 분야(예: 프로그래밍 언어 의미론)에서는 알고리즘 자체 를 모델 검증 기준으로 삼고 싶다. - 벡터 공간은 선형 대수의 핵심이면서, 양자·확률 프로그래밍에서 벡터(상태)와 스칼라(확률·진폭) 가 동시에 등장한다. 따라서 재작성 기반 정의가 자연스럽다. 2. 핵심 아이디어 1. 두 정렬 언어 L

변형 망베 기반 글로벌 컨텍스트 학습을 통한 3D 손 자세 추정

변형 망베 기반 글로벌 컨텍스트 학습을 통한 3D 손 자세 추정

본 논문은 3D 손 자세 추정 분야에서 장기간 해결되지 못한 ‘심각한 가림(occlusion)’ 문제에 주목한다. 기존 연구들은 주로 ResNet 계열의 CNN을 특징 추출기로 사용했는데, 이러한 구조는 지역적인 패턴 인식에는 강점이 있으나 이미지 전체에 퍼진 전역적 관계—예를 들어 손가락 사이, 양손 간, 혹은 손과 주변 물체 사이의 구조적 연관성—를 포착하는 데 한계가 있다. 특히 두 손이 겹쳐 보이는 상황에서는 관절이 완전히 가려져 있어

변형 트랜스포머 정책을 위한 일반화된 정책 그래디언트 이론

변형 트랜스포머 정책을 위한 일반화된 정책 그래디언트 이론

이 논문은 변형 트랜스포머 기반 정책을 위한 일반화된 정책 그래디언트(GPG) 이론을 제시하며, 이는 현존하는 정책 그래디언트 방법론의 확장입니다. GPG 이론은 표준 정책 그래디언트와 GRPO를 특수한 경우로 포함함으로써, 기존 접근법들의 일반화된 형태를 제공합니다. 이러한 이론적 확장은 특히 대형 언어 모델(LLM) 훈련에서 중요한 의미를 지닙니다. LLMs의 복잡성과 규모는 기존의 정책 그래디언트 방법론을 적용하는 데 있어 제약이 되곤 합

병렬 토큰 생성 위한 강화학습 기반 마스크 확산 언어 모델 가속기 dUltra

병렬 토큰 생성 위한 강화학습 기반 마스크 확산 언어 모델 가속기 dUltra

본 논문은 마스크 확산 언어 모델(MDLM)의 근본적인 병렬 디코딩 한계를 극복하고자 하는 시도이다. 기존 MDLM은 마스크를 점진적으로 해제하면서 토큰을 생성하는데, 한 번의 순전파당 해제 가능한 토큰 수가 제한적이어서 실제 적용 시 AR 모델과 큰 차이를 보이지 않는다. 특히 dParallel·d3LLM과 같은 증류 기반 가속기는 사전 학습된 “베이스 모델”이 만든 토큰 시퀀스를 그대로 따라가도록 MDLM을 미세조정한다. 이 방식은 학습 단

No Image

분산 그룹웨어 환경에서 체크리스트 vs. 애드혹 코드 리뷰: 결함 탐지 효율성 비교 실증 연구

1. 연구 배경 및 목적 - 소프트웨어 검사 는 결함을 조기에 발견해 비용을 절감하고 품질을 확보하는 핵심 활동이다. - 기존 연구는 주로 종이 기반 혹은 단일 장소 에서 진행된 실험에 국한돼 있었으며, 분산 협업 환경 에서의 검증은 부족했다. - 본 논문은 “ 분산 그룹웨어 환경 에서 애드혹과 체크리스트 기반 코드 리뷰가 실제로 차이를 보이는가?”라는 질문에 답하고자 한다. 2. 실험 설계

분산 정책을 이용한 선형 이차 확률 미분 게임에서 α‑포텐셜 접근법으로 균형 학습하기

분산 정책을 이용한 선형 이차 확률 미분 게임에서 α‑포텐셜 접근법으로 균형 학습하기

1. 연구 배경 및 의의 - 멀티에이전트 강화학습(MARL)과 확률 미분 게임 - 연속시간·연속상태·연속액션을 갖는 동적 게임은 자율주행, 신경과학, 생태계, 최적 거래 등 다양한 분야에서 핵심 모델로 활용된다. - 기존 MARL 이론은 주로 이산·유한 상태·액션 공간에 국한돼 있어, 연속시간 확률 미분 게임에 대한 수렴 보장은 거의 없다. - 스케일러빌리티와 분산 정책 - N이 커질수록 공동 전략공

No Image

불리언 네트워크 파라미터 추정: 생물학적 시스템을 위한 ‘Polynome’ 웹 서비스

1. 연구 배경 및 필요성 - 불리언 모델의 장점 : 정량적 파라미터가 부족한 경우에도 0/1 상태만으로 유전자 발현·대사·신호 전달 등을 직관적으로 표현 가능. - 연속 모델과의 차이 : 연속 미분방정식 모델은 파라미터 추정 기법이 풍부하지만, 불리언 모델은 “파라미터” 개념이 부재해 데이터 기반 모델링이 어려웠음. - 본 연구의 기여 : 불리언 모델에 대한 이산형 파라미터 추정 개념을 도입하고, 이를 자동화

불확실성 시대 인간 AI 공생 지능과 조직 회복력

불확실성 시대 인간 AI 공생 지능과 조직 회복력

본 논문은 VUCA(Volatility, Uncertainty, Complexity, Ambiguity) 시대에 조직이 직면하는 ‘모호성’이라는 현상을 기존의 불확실성 혹은 위험 관리와 구별하여 독립적인 연구 대상으로 제시한다는 점에서 학술적 의의가 크다. 전통적인 AI 시스템은 데이터 기반 예측과 최적화에 초점을 맞추어 설계되기 때문에, 입력 데이터가 불완전하거나 신호가 약할 때 ‘조기 해석적 폐쇄(early interpretive closu

비밀 LLM 배포를 위한 암호화 텐서 포맷 CryptoTensors

비밀 LLM 배포를 위한 암호화 텐서 포맷 CryptoTensors

본 논문이 다루는 핵심 문제는 대규모 언어 모델(LLM)의 가중치를 민감한 도메인 데이터에 맞춰 파인튜닝하거나 사적으로 커스터마이징한 뒤, 이를 안전하게 배포·운용하는 방법이 부족하다는 점이다. 현재 LLM 배포에 널리 사용되는 포맷인 PyTorch .pt, TensorFlow .ckpt, 그리고 최근 각광받는 Safetensors는 저장 효율성과 빠른 로딩을 목표로 설계되었지만, 기밀성 보장을 위한 암호화 메커니즘이나 접근 제어 정책을 내장하

No Image

비베이즈 입자 필터: 베이즈 정리를 우회한 직접 샘플링 기법

1. 연구 배경 및 동기 - 전통적 입자 필터 는 베이즈 정리 → 사전(predictive) → 사후(posterior) 단계 → 다수 입자 필요 → MCMC 등 역방향 샘플링으로 비용 폭증. - 특히 고차원·비선형 시스템에서 입자 소멸(particle degeneracy) 문제가 심각해진다. - 저자들은 “베이즈 없이도 pdf를 직접 샘플링할 수 있다” 는 가설을 세우고, 이를 구현하기 위한 수학적 프레임워크를 제

비정상 환경을 위한 예측 기반 오프라인 강화학습 프레임워크

비정상 환경을 위한 예측 기반 오프라인 강화학습 프레임워크

오프라인 강화학습(Offline RL)은 사전에 수집된 로그 데이터를 활용해 정책을 학습하는 접근법으로, 로봇 제어, 의료, 금융 등 실제 시스템에 직접적인 탐색이 위험하거나 비용이 큰 분야에서 큰 기대를 받고 있다. 하지만 대부분의 기존 연구는 환경이 시간에 따라 변하지 않는(stationary) 가정을 전제로 설계되었으며, 테스트 단계에서도 인위적인 노이즈나 작은 변동만을 고려한다. 현실 세계에서는 센서 결함, 네트워크 지연, 운영 정책 변

No Image

비트 플레인 조합 최적화를 통한 효율적인 디지털 이미지 워터마킹

1. 연구 배경 및 동기 - 워터마킹의 필요성 : 디지털 이미지의 무단 복제·변조 방지를 위한 인증·소유권 증명 수단으로서 워터마킹은 필수적이다. - 비트 플레인 방식의 한계 : 기존 LSB(최하위 비트) 삽입은 시각적 왜곡이 거의 없지만, 압축·노이즈·필터링 등에 취약하다. 반대로 MSB(최상위 비트) 삽입은 강인하지만 이미지 품질이 크게 저하된다. 2. 주요 기여 구분 기존 연구 본 논문의 차별점

No Image

빛과 물질이 얽힌 순간: 초유체 원자 구름을 이용한 디케 양자 상전이 실현

1. 연구 배경 및 의의 - 양자 상전이와 디케 모델 : 디케 모델은 모든 원자가 동일한 강도로 서로 연결된 무한 조정(spin) 시스템으로, 충분한 원자‑광 결합이 이루어지면 초복사(super‑radiant) 위상으로 전이한다는 예측이 30년 전부터 제시돼 왔다. 그러나 실제 원자‑광 결합이 충분히 강해지기 어려워 실험적 구현이 도전 과제로 남아 있었다. - 장거리 상호작용 구현 : 기존 양자 가스 실험은 주로 짧은 거리(접

사회과학 컴퓨팅을 활용한 노화 연구의 확장

사회과학 컴퓨팅을 활용한 노화 연구의 확장

이 논문은 계산 사회과학(CSS) 도구들이 어떻게 노화 연구 분야에서의 전통적인 질적 방법과 융합되어 새로운 가능성을 열고 있는지에 대해 깊이 있게 탐색하고 있습니다. 특히, 기계 학습(ML)과 자연어 처리(NLP)를 활용한 대규모 데이터 관리와 텍스트 분석은 질적 연구에서 얻어진 깊이 있고 맥락적인 정보를 시스템적으로 정리하고 패턴을 식별하는 데 중요한 역할을 합니다. 이로 인해, 기존의 워크플로우는 더욱 효율화되고 확장성이 향상되며, 다중

사회복지를 최우선으로 하는 인센티브 설계 비용 효율성 및 협력 빈도

사회복지를 최우선으로 하는 인센티브 설계 비용 효율성 및 협력 빈도

이 논문은 진화 게임 이론(evolutionary game theory)이라는 전통적인 프레임워크를 현대 다중 에이전트 시스템에 적용함으로써, 기존 연구에서 간과된 ‘사회복지’라는 궁극적 목표를 정량적으로 탐구한다는 점에서 학문적 의의가 크다. 먼저 저자들은 두 가지 전형적인 인센티브 설계 패러다임을 비교한다. 하나는 ‘비용 효율성’에 초점을 맞추어, 최소한의 보상으로 목표 협력 수준을 달성하려는 접근이며, 다른 하나는 ‘협력 빈도’ 자체를 최

새로운 최소 초대칭 SO(10) GUT(NMSGUT): 스펙트럼·RG 흐름·페르미온 질량 적합의 전면 분석

새로운 최소 초대칭 SO(10) GUT(NMSGUT): 스펙트럼·RG 흐름·페르미온 질량 적합의 전면 분석

1. 연구 배경 및 동기 - SO(10)과 seesaw : SO(10) 대통일은 좌‑우 대칭과 B‑L을 자연스럽게 포함해 타입 I·II seesaw 메커니즘을 구현한다. 기존 최소 초대칭 GUT(MSGUT)는 210 ⊕ 10 ⊕ 126 ⊕ (overline{126}) 힉스만을 사용했으나, 실제 페르미온 질량·혼합 데이터를 만족시키지 못한다는 “no‑go” 결과가 있었다. - 120-plet 도입 : 120표현은 반대칭 Yuka

생성‑평가 일관성으로 보는 LLM 정렬·평가 혁신: AlignEval 벤치마크

생성‑평가 일관성으로 보는 LLM 정렬·평가 혁신: AlignEval 벤치마크

1. 연구 배경 및 동기 - 정렬 평가의 비용 문제 : 인간 어노테이터를 통한 대규모 평가가 비용·시간 면에서 비효율적이며, 특히 개방형 응답에서는 주관성이 크게 작용한다. - LLM‑as‑Judge 패러다임 : 최근 LLM 자체를 심판으로 활용하는 자동 평가가 활발히 연구되고 있지만, 이때 LLM이 실제로 “정확히” 인간 선호를 반영하는지에 대한 검증이 필요했다. - 생성‑평가 일관성(GE‑consistency) 가설

생성형 AI가 금융 애널리스트 보고서에 미치는 생산성·정확도 양면 효과

생성형 AI가 금융 애널리스트 보고서에 미치는 생산성·정확도 양면 효과

FactSet이 2023년에 공개한 AI 기반 분석 플랫폼은 기존 데이터베이스에 대규모 언어 모델을 결합해 자동 요약, 인사이트 도출, 시나리오 분석 등을 제공한다는 점에서 금융 애널리스트들의 작업 흐름을 근본적으로 바꾸는 ‘자연실험’으로 활용될 수 있다. 연구진은 AI 도입 전후 동일한 애널리스트 집단을 추적하면서 보고서의 정량적 특성을 다각도로 측정했다. 정보 출처 수가 40 % 늘어난 것은 AI가 방대한 비정형 데이터(뉴스, 소셜 미디어,

생성형 검색에서 공정한 기여도 평가를 위한 MAXSHAPLEY 알고리즘

생성형 검색에서 공정한 기여도 평가를 위한 MAXSHAPLEY 알고리즘

본 논문은 생성형 검색(Generative Search)이라는 새로운 패러다임이 기존 검색 생태계를 뒤흔들고 있다는 점을 출발점으로 삼는다. LLM 기반 검색 엔진은 사용자가 질문을 입력하면 내부적으로 대규모 문서 집합을 검색하고, 그 결과를 바탕으로 자연어 답변을 생성한다. 이 과정에서 각 문서가 최종 답변에 미치는 영향은 매우 복합적이며, 기존의 클릭률이나 페이지 뷰와 같은 단순 지표로는 충분히 측정할 수 없다. 따라서 “누가 얼마만큼 기여

석탄가스 없이 재생에너지로 전력 시스템 완성

석탄가스 없이 재생에너지로 전력 시스템 완성

본 논문은 화석 가스가 2050년 이후 재생에너지 발전의 변동성을 조절하는 데 필요한 것으로 제시되는 상황을 분석하고, 이를 대체할 수 있는 방법론과 모델을 제안합니다. 연구진은 태양광과 풍력 발전을 균형 있게 유지하기 위해 수력 축전지 저장 시스템을 활용하면 화석 가스에 대한 의존성을 완전히 해소하면서도 비용 증가 없이 전력을 공급할 수 있음을 발견했습니다. 기존의 장기 전력 계획은 저장 주기를 제약하거나 충전 상태를 추적하지 못하는 시간 집

No Image

섬 지역 무기상관측소 없이 PV 발전량 예측하기: 인공신경망(ANN) 기반 일·시간 일사량 전이 학습

1. 연구 배경 및 필요성 - 관측소 부족 : 코르시카는 50 km 간격으로 3곳만 관측소가 있어, 특히 섬 외곽·산악 지역의 일사량 데이터가 거의 없다. - 재생에너지 정책 : 섬 지역 전력 자립과 화석연료 절감 목표에 따라 정확한 PV 발전량 예측이 필수적이다. 2. 방법론 단계 내용 ------ ------ 데이터 전처리 연간·일일 주기성을 제거하기 위해 외부 태양복사량(외계

No Image

세페우스 A 별 형성 구역의 전력원에서 방출되는 X‑레이: 새로운 3개의 점원천과 그 의미

1. 연구 배경 및 목표 - 세페우스 A 는 거리 ≈ 700 pc, 복잡한 고밀도 구름과 다수의 라디오·서브밀리미터 소천을 포함하는 활발한 별 형성 구역이다. - 기존 X‑레이 관측(Pravdo & Tsuboi 2005)은 5″ 이하 해상도로 “HWX”라는 하나의 불분해된 소천을 보고했으며, 이는 다중 YSO 혹은 강한 항성풍에 의한 복합 방출일 가능성을 제시했다. - 본 논문의 핵심 목표는 Chandra/ACIS (≈1″

소프트 기하학적 편향을 활용한 객체 중심 세계 모델링

소프트 기하학적 편향을 활용한 객체 중심 세계 모델링

본 논문은 물리 기반 시뮬레이션을 학습하는 데 있어 ‘등변성(equivariance)’이라는 수학적 구조를 어떻게 활용할 것인가에 대한 중요한 질문을 제기한다. 전통적인 딥러닝 모델은 입력 변환(예: 회전, 평행 이동)에 대해 출력이 동일하게 변환되는 ‘정확한 등변성’을 강제하면, 물리 법칙이 보존되는 상황에서는 학습 효율과 일반화 성능이 크게 향상된다. 그러나 실제 환경에서는 장애물이나 마찰 등으로 인해 완전한 대칭이 깨지는 경우가 빈번하다.

No Image

소형 금 나노클러스터에서 에틸렌 흡착: 중성·음이온·양이온 Auₙ(₁≤n≤10)의 전자구조와 결합 모드 비교

1. 연구 배경 및 목적 - 에틸렌 은 가장 단순한 알켄으로, 금속 표면에서의 흡착·촉매 반응 메커니즘을 이해하는 모델 시스템이다. - 기존 연구는 주로 평면 금속 표면 (Au(100), Au(111))에 초점을 맞췄으며, 나노클러스터 에서의 흡착 특성은 아직 충분히 탐구되지 않았다. - 금은 벌크 상태에서는 비활성 하지만, 1∼5 nm 규모의 작은 클러스터에서는 뛰어난 촉매활성을 보인다. 따라서 클러스터 크기·

No Image

속도 향상을 통한 단위 시간창 여행 수리공 문제의 근사 해법

1. 연구 배경 및 문제 정의 - TRP 는 전통적인 오리엔티어링·마감 TSP와 달리 각 요청마다 시간창 이 존재한다는 점에서 복잡도가 크게 증가한다. - 기존 연구는 루트된(rooted) 버전 (시작점 고정)이나 전체 시간 제한 (전역 데드라인)만을 다루는 경우가 많았다. - 본 논문은 무루트 상황(시작·종료 자유)과 단위 시간창 (길이 1)이라는 제한을 두고, 속도 증강 이라는 새로운 자원

수직 계층 구조로 토큰 생성 가속화하는 PHOTON 모델

수직 계층 구조로 토큰 생성 가속화하는 PHOTON 모델

트랜스포머 기반 언어 모델은 토큰을 순차적으로 처리하는 “수평 스캔” 구조를 갖는다. 입력 시퀀스가 길어질수록 각 디코딩 스텝에서 과거 토큰들의 키‑밸류(KV) 캐시를 읽고 새롭게 쓰는 작업이 급증한다. 이때 연산량 자체는 비교적 적지만 메모리 접근 비용이 지배적이어서, 특히 긴 컨텍스트를 다루는 상황에서 레이턴시와 처리량이 크게 제한된다. 논문은 이러한 구조적 한계를 “수평 토큰‑바이‑토큰 스캐너”라 명명하고, 이를 근본적으로 바꾸는 새로운

< 분야별 논문 현황 (Total: 4362) >

General Relativity
1
HEP-EX
2
HEP-PH
1
HEP-TH
2
MATH-PH
2
NUCL-EX
4
Quantum Physics
3
Research
3862

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키