KOINEU Logo
길이최적 토크나이저로 토큰 수와 연산 효율 크게 향상

길이최적 토크나이저로 토큰 수와 연산 효율 크게 향상

Length‑MAX 토크나이저는 기존 BPE와 같은 빈도 기반 서브워드 토크나이저가 갖는 근본적인 한계를 극복하려는 시도로, “문자당 평균 토큰 길이”라는 새로운 최적화 목표를 도입한다는 점에서 혁신적이다. 전통적인 BPE는 가장 빈번히 등장하는 문자 쌍을 반복적으로 병합함으로써 어휘를 구성한다. 이 과정은 어휘 크기가 제한될 때 긴 단어를 여러 짧은 토큰으로 분할하게 만들며, 결과적으로 평균 토큰 길이가 짧아져 토큰 수가 증가한다. 반면 Le

깊은 정렬을 통한 대형 언어 모델의 지속 학습 망각 방지

깊은 정렬을 통한 대형 언어 모델의 지속 학습 망각 방지

분석 요약 논문 주제와 목표: 본 논문은 대형 언어 모델(LLM)의 지속 학습 과정에서 발생하는 '망각' 문제를 해결하기 위한 새로운 접근법을 제시합니다. 특히, '깊은 정렬(deep alignment)' 개념을 도입하여 기존 방법들의 한계를 극복하고 효율적인 망각 방지를 달성하려고 합니다. 주요 문제점: - 망각 현상: LLM이 새로운 작업과 도메인에 적응하면서 이전 학습한 지식을 유지해야 하지만, '망각' 현상으

나노포톤닉스 혁신: MOCLIP으로 광학 설계 가속화

나노포톤닉스 혁신: MOCLIP으로 광학 설계 가속화

: 나노광학 분야에서 딥 러닝의 도입은 메타 표면, 광학 결정, 플라스모닉스 등 다양한 영역에서 혁신을 가져왔습니다. 특히, 인공 일반 지능(AGI) 개념의 통합은 데이터 중심 과학 및 물리적 설계 간의 격차를 해소하고 적응형 광학 솔루션을 제공합니다. 이러한 AGI 발전의 핵심에는 기초 모델(FM)이 있으며, 이는 다양한 과학 분야에서 혁신을 이끌고 있습니다. 나노광학에 FM을 적용하는 데 있어 가장 큰 도전 과제는 훈련 데이터의 부족입니다

내시경 이미지 분류와 대형 언어 모델 기반 임상 추론 통합 프레임워크

내시경 이미지 분류와 대형 언어 모델 기반 임상 추론 통합 프레임워크

이 논문은 두 가지 핵심 문제를 동시에 해결하려는 시도로 눈에 띈다. 첫 번째는 내시경 이미지에서 위장 질환을 정확히 분류하는 것이고, 두 번째는 그 결과를 기반으로 임상의가 기대하는 ‘왜 이런 진단이 내려졌는가’에 대한 논리적 설명을 자동으로 생성하는 것이다. 이를 위해 저자들은 MobileCoAtNet이라는 새로운 하이브리드 네트워크를 설계했다. MobileCoAtNet은 경량화된 MobileNet 구조와 최신 CoAtNet의 컨볼루션‑트랜

내재된 안전 정렬 지능을 위한 다중 에이전트 강화학습 임베딩 프레임워크

내재된 안전 정렬 지능을 위한 다중 에이전트 강화학습 임베딩 프레임워크

ESAI(Embedded Safety‑Aligned Intelligence) 프레임워크는 기존의 안전 강화학습 접근법이 갖는 근본적인 한계를 극복하려는 시도로, 정렬(Alignment) 정보를 에이전트의 내부 표현에 직접 내재화한다는 점에서 혁신적이다. 전통적인 방법은 외부 보상 함수를 재설계하거나 학습 후에 안전 필터를 적용하는데, 이는 보상 설계 오류나 필터링 지연으로 인해 에이전트가 이미 위험한 행동을 학습할 위험을 내포한다. ESAI는

No Image

네트워크 코딩을 TCP와 접목한다: 실용 구현과 TCP Reno 적용

1. 연구 배경 및 동기 - TCP와 무선 네트워크의 불일치 : 전통 TCP는 손실을 혼잡의 징후로 오인해 전송률을 불필요하게 감소시킨다. - 네트워크 코딩의 가능성 : 랜덤 선형 코딩은 손실 복구를 효율적으로 수행하고, 중간 노드에서 재코딩이 가능해 멀티패스·멀티캐스트 환경에서도 이득을 제공한다. - 기존 배치 기반 코딩의 한계 : 배치(또는 블록) 코딩은 ACK 지연·패킷 재정렬 문제로 TCP와 충돌한다.

노이즈 기반 아바타 지오메트리 생성과 가우시안 스플래팅 시각화

노이즈 기반 아바타 지오메트리 생성과 가우시안 스플래팅 시각화

1. 연구 배경 및 동기 - 세부 디테일 요구 : 옷 주름·주동 같은 고주파 구조를 재현하려면 점밀한 표면 표현이 필요하지만, 기존의 템플릿 기반·implicit 방식은 해상도·밀도 한계가 있다. - 데이터 부족 : 3D 인간 애니메이션 데이터는 수집 비용이 높아 과적합 위험이 크다. 따라서 데이터 효율적인 모델링이 핵심 과제다. 2. 핵심 기여 번호 내용 의의 ------ ------

노이즈 제거와 위상 분류를 통합한 원자 시뮬레이션 모델

노이즈 제거와 위상 분류를 통합한 원자 시뮬레이션 모델

이 연구는 원자 시뮬레이션에서 발생하는 복잡한 문제를 해결하기 위한 새로운 접근 방식을 제시하고 있습니다. 특히, 이 논문은 기존의 PTM과 CNA와 같은 도구들이 격자의 유형에 제한적이며, 열적 혼란이나 결함이 있는 상황에서 성능이 저하된다는 문제를 해결하기 위해 로그확률 기반 모델을 개발하였습니다. 이 모델은 잡음 제거, 위상 분류, 그리고 순서 매개변수(OPs) 추출이라는 세 가지 주요 과제를 하나의 확률적 프레임워크 내에서 통합하고 있습

논문 편집기에 통합된 다중 에이전트 기반 학술 작성 도우미

논문 편집기에 통합된 다중 에이전트 기반 학술 작성 도우미

PaperDebugger는 기존 LLM 기반 학술 보조 도구가 가진 ‘편집기와의 경계’ 문제를 근본적으로 해결하려는 시도이다. 현재 대부분의 AI 작문 보조는 별도 웹 서비스나 플러그인 형태로 제공되며, 사용자는 텍스트를 복사‑붙여넣기하거나 API 호출을 통해 결과를 받아야 한다. 이 과정에서 문서의 메타데이터(예: 섹션 구조, 라벨, 교차 참조)와 실시간 편집 이력이 손실되며, AI가 제공하는 수정이 실제 LaTeX 소스와 정확히 일치하지 않

No Image

뇌 배양 조직의 네트워크 발달과 폭발적 발화 메커니즘: 시뮬레이션 기반 탐구

1. 연구 배경 및 의의 - 배양 피질 네트워크 는 실험적으로 신경 회로의 발달·가소성·약물 효과 등을 고해상도로 관찰할 수 있는 귀중한 플랫폼이다. 그러나 배양 전체가 주기적으로 폭발적으로 발화하는 ‘버스팅’ 현상은 데이터 해석을 방해하고, 실제 뇌 병리와의 연관성을 밝히는 데 중요한 연구 대상이다. - 본 연구는 신경돌기 성장 모델 을 네트워크 연결 생성에 직접 적용함으로써, 물리적 성장 과정이 전기적 동기화에 미치는 영향

No Image

뇌 신호의 희소 연결성을 모델링한다 – EEG/MEG을 위한 새로운 SCSA 기법

1. 연구 배경 및 필요성 - 볼륨 전도 문제 : EEG/MEG 센서는 두개골 외부에 위치해, 각 센서가 뇌 전체의 신호를 선형적으로 혼합한다. 이 즉시적인 혼합은 전통적인 상관·인과 분석에서 거짓 연결성을 유발한다. - 기존 접근법의 한계 - Imaginary‑part 기반 방법은 실수 성분을 무시하지만, 실제 신호의 복잡한 동시성(coupling)을 충분히 포착하지 못한다. - 소스 로컬라이제이션 + 전

뇌 회로 기반 정책 게이팅 통합 모델 GateMod

뇌 회로 기반 정책 게이팅 통합 모델 GateMod

본 논문은 정책 게이팅이라는 복합 현상을 하나의 통합 이론으로 묶어내려는 시도로, 세 가지 핵심 단계—규범적 프레임워크(GateFrame), 연속시간 동역학(GateFlow), 그리고 신경 회로 구현(GateNet)—를 순차적으로 제시한다. 첫 번째 단계인 GateFrame은 자유 에너지(FE) 최소화라는 원리를 정책 선택에 적용함으로써, “어떤 상황에서 어떤 정책을 활성화할 것인가”라는 질문을 최적화 문제로 전환한다. 이는 베이즈적 인식 이론

뇌파로 조종하는 차세대 지능형 로봇 — NOIR 2.0: 뇌‑로봇 인터페이스의 속도·정확도·샘플 효율성 혁신

뇌파로 조종하는 차세대 지능형 로봇 — NOIR 2.0: 뇌‑로봇 인터페이스의 속도·정확도·샘플 효율성 혁신

1. 연구 배경 및 목표 - BRI의 현주소 : 기존 뇌‑로봇 인터페이스는 높은 디코딩 지연과 다수의 시연 데이터 필요성으로 실시간 협업에 제약이 있었다. - NOIR 1.0 : 2023년 발표된 시스템은 20가지 일상 작업을 수행했지만, 디코딩에 전체 시간의 55‑85 %가 소요되고, 4‑way 분류 정확도가 42 %에 불과했다. - NOIR 2.0 목표 : (i) 디코딩 속도·정확도 향상, (ii) 샘플 효율적인 로봇

No Image

누락된 선호도를 가진 퍼지 제약 문제를 위한 효율적인 선호도 탐색 전략: 알고리즘 설계와 실험적 평가

1. 연구 배경 및 문제 정의 - 퍼지 제약과 소프트 제약 : 전통적인 CSP는 제약을 만족시키는 해만을 찾지만, 퍼지 제약은 각 할당에 0~1 사이의 선호도(또는 비용)를 부여해 최적화 문제로 확장한다. - 불완전성(누락된 선호도) : 실제 시스템에서는 모든 선호도가 사전에 알려지지 않는다. 예를 들어, 다중 에이전트 환경에서 프라이버시 문제, 혹은 사용자에게 아직 질문하지 않은 선호도 등이 해당한다. - 목표 :

No Image

느슨하게 라벨링된 이미지에 “상상된” 키워드 삽입하기: 의미 확장을 위한 PLSA‑vw 접근법

1. 연구 배경 및 문제 정의 - 느슨한 주석(loose annotation) 은 두 가지 근본적인 결함을 가진다. 1. 시각 특징 ↔ 키워드 매핑의 모호성 – 동일한 시각 패턴이 여러 의미를 가질 수 있음. 2. 키워드 누락(incompleteness) – 이미지에 실제로 존재하지만 주석에 포함되지 않은 단어가 다수 존재한다. - 기존 연구는 주로 모호성 감소 에 초점을 맞추었으며, 키워드

다국어 대형 언어 모델의 편향을 가로지르는 탐색: 언어·편향 차원의 교차 분석

다국어 대형 언어 모델의 편향을 가로지르는 탐색: 언어·편향 차원의 교차 분석

1. 연구 배경 및 필요성 - 글로벌 AI 활용 확대 : LLM이 교육, 의료, 법률 등 다양한 분야에 침투하면서 다국어 사용자에게 미치는 영향이 커지고 있다. - 편향 연구의 언어 편중 : 기존 편향 연구는 주로 영어에 국한돼 있어, 비영어권 사용자에게 발생할 수 있는 불공정성을 간과한다. - 명시·암묵적 편향의 차별적 탐지 : 명시적 편향은 표면적인 스테레오타입을, 암묵적 편향은 무의식적 연관성을 반영한다. 두 차

다단계 시각 추론을 통한 GUI 그라운딩 혁신

다단계 시각 추론을 통한 GUI 그라운딩 혁신

GUI 그라운딩은 사용자가 자연어로 제시한 작업 지시를 화면상의 구체적인 UI 요소와 매핑하는 핵심 기술이다. 현재 가장 앞선 멀티모달 대형 언어 모델(MLLM)은 이미지와 텍스트를 동시에 이해하는 능력 덕분에 복잡한 디지털 화면에서도 높은 정확도를 기록하고 있다. 그러나 실제 적용 환경에서는 두드러진 문제점이 드러난다. 첫째, UI 요소가 작거나 색·형태가 유사한 경우 모델이 올바른 영역을 선택하지 못한다. 이는 시각적 특징이 미세하게 차이나

다양한 심장질환 진단을 위한 초고속 CMR 영상 재구성 모델

다양한 심장질환 진단을 위한 초고속 CMR 영상 재구성 모델

이 논문은 심장질환 진단과 이해를 위한 다중모드 심장혈관 자기공명(CMR) 영상의 중요성을 강조하면서, 기존의 장시간 스캔 시간과 의료 환경 간 차이로 인한 임상 채택 제약을 해결하기 위해 초고속 CMR 이미징 재구성 모델인 CardioMM를 소개합니다. 연구팀은 MMCMR-427K라는 대규모 데이터베이스를 구축하여 다양한 스캔 환경과 질환 유형에 대한 포괄적인 정보를 제공하고, 이를 바탕으로 CardioMM을 개발하였습니다. 이 모델은 다양한

다중 송신기 환경에서 무선 신호 강도 지도 재구성을 위한 물리 기반 신경망

다중 송신기 환경에서 무선 신호 강도 지도 재구성을 위한 물리 기반 신경망

본 논문은 무선 환경 매핑(Radio Environment Mapping, REM) 분야에서 가장 난제 중 하나인 “다중 송신기 간섭” 문제를 물리‑정보 신경망(Physics‑Informed Neural Networks, PINN)이라는 최신 딥러닝 프레임워크로 해결하고자 한다. 기존의 REM 모델은 주로 단일 송신기 가정 하에 경로 손실 모델(예: 3GPP, ITU‑R)을 적용하거나 경험적 회귀식을 이용한다. 그러나 실제 무선 환경에서는 여러

다중 스케일 흐름 매칭 기반 포인트 클라우드 생성 프레임워크 – MFM‑Point

다중 스케일 흐름 매칭 기반 포인트 클라우드 생성 프레임워크 – MFM‑Point

1. 연구 배경 및 동기 - 포인트 기반 vs. 표현 기반 : 포인트 기반은 메모리·연산 효율이 뛰어나지만 전역 구조 파악에 약점이 있다. 반면, Voxel/mesh 기반은 전역 정보를 잘 포착하지만 고해상도에서는 비용이 급증한다. - Flow Matching (FM) : 기존 FM은 ODE 기반으로 “속도장”을 학습해 단순 회귀 손실만으로도 확률 변환을 수행한다. 이미지·비디오 분야에서 다중 스케일 FM이 성공을 거두었지만,

다중 에이전트 협업을 위한 메커니즘 기반 인텔리전스와 차별가능 가격 메커니즘

다중 에이전트 협업을 위한 메커니즘 기반 인텔리전스와 차별가능 가격 메커니즘

본 논문이 제기하는 핵심 문제는 두 가지 전통적인 경제학적 딜레마, 즉 하이에키(Hayek)의 정보 문제와 허위키(Hurwicz)의 인센티브 문제를 다중 에이전트 인공지능 분야에 그대로 옮겨 놓은 데 있다. 하이에키의 정보 문제는 각 에이전트가 보유한 사적 지식이 중앙집중식 설계자에게 완전하게 전달되지 않아 최적의 전역 정책을 도출하기 어렵다는 점을 말한다. 반면 허위키의 인센티브 문제는 개별 에이전트가 자신의 이익을 극대화하려 할 때, 그 행

다중과제 상호작용 적대학습 기반 간 종양 영상 통합 분석 네트워크 (MTI‑Net)

다중과제 상호작용 적대학습 기반 간 종양 영상 통합 분석 네트워크 (MTI‑Net)

1. 연구 배경 및 필요성 - 임상적 중요성 : 간암은 전 세계 암 사망 원인 2위이며, 종양의 형태·크기·조영 특성을 동시에 파악하는 것이 진단·치료 계획에 핵심이다. - 기존 한계 : 기존 딥러닝 기반 분할·분류 모델은 주로 정적 영상에 초점을 맞추고, 동적 조영 강화 곡선(시간‑강도 곡선)을 활용하지 못한다. 또한 다중 과제 학습 시 작업 간 상호 의존성을 반영하는 구조가 부족했다. 2. 주요 기여 번

No Image

다중파장 스펙트럼·편광 연구로 밝히는 3C 264 제트의 물리와 구조

1. 연구의 의의와 배경 - 희귀한 광학 편광 데이터 : 현재까지 HST 편광을 받은 외부 은하 제트는 10개에 불과한데, 3C 264는 그 중 하나이며, 라디오와 광학·UV·X‑ray까지 연속적으로 관측된 최초 사례 중 하나다. - 거리·해상도 장점 : z = 0.0217 (94 Mpc) 로 비교적 가까워 0.42 kpc/″의 선형 해상도를 제공, 제트의 세부 구조와 스펙트럼 변화를 고해상도로 탐구 가능하다. 2

다중패턴 강화학습으로 로봇 시각‑언어‑행동 모델을 위한 풍부하고 확장 가능한 데이터 생성

다중패턴 강화학습으로 로봇 시각‑언어‑행동 모델을 위한 풍부하고 확장 가능한 데이터 생성

1. 연구 배경 및 동기 - VLA 모델의 데이터 병목 : 현재 VLA 사전학습 데이터는 인간 텔레오퍼레이션에 크게 의존한다. 인간은 성공을 최우선 목표로 몇 가지 효율적인 전략만을 사용하므로, 행동 다양성이 자연스럽게 제한된다. - 표준 RL의 한계 : RL은 성공 보상만을 최적화하기 때문에 “모드 붕괴”(mode collapse) 현상이 발생한다. 결과적으로 하나의 고성공 패턴만을 학습하고, 다양한 행동을 제공하지 못한다.

No Image

다채로운 채널을 위한 범용 LDPC 코드 설계: 볼록 결합과 안정성 분석

1. 연구 배경 및 동기 - LDPC 코드는 특정 채널에 최적화하면 뛰어난 성능을 보이지만, 다른 채널에서는 성능 저하가 발생한다. - 통신 시스템에서 채널 특성이 자주 변하거나 여러 채널을 동시에 사용해야 하는 경우, 매번 코드를 교체하는 것은 비효율적이다. 따라서 ‘범용(universal)’ 코드를 설계하는 필요성이 대두된다. 2. 핵심 아이디어 - 볼록 결합(convex combinatio

다항 신경망의 신경다양체 차원과 전역 식별성에 관한 완전 정리

다항 신경망의 신경다양체 차원과 전역 식별성에 관한 완전 정리

1. 연구 배경 및 동기 - Neuroalgebraic Geometry 라는 새로운 학문 영역은 다항 활성함수(polynomial activations)를 갖는 신경망을 대수기하학적 관점에서 분석한다. - 다항 활성함수는 고차 상호작용을 명시적으로 모델링하므로, 깊이·폭을 크게 늘리지 않아도 복잡한 관계를 표현할 수 있다. - 이러한 특성 덕분에 PNN은 컴퓨터 비전, 물리 시뮬레이션, 금융 시계열 등 다양한 분야에서

단백질 언어 모델의 빠른 지도학습으로 효율적인 단백질 설계와 혁신적 서열 탐색

단백질 언어 모델의 빠른 지도학습으로 효율적인 단백질 설계와 혁신적 서열 탐색

이 논문은 단백질 언어 모델(PLM)의 실용적 활용을 위해 두 가지 핵심적인 장벽을 동시에 해소하고 있다. 첫 번째는 ‘고품질 라벨 데이터’의 부족이다. 전통적인 지도학습은 대규모 정제된 데이터셋을 전제하지만, 단백질 분야에서는 실험적으로 검증된 서열·구조·기능 정보가 제한적이다. 저자들은 PLM 자체가 생성한 후보 서열을 도메인‑특화 필터(예: 안정성 예측, 활성 부위 보존, 서열 다양성 등)로 사전 정제함으로써, 인간이 직접 라벨링하지 않아

No Image

단백질‑전용 시스템에서 나타나는 강인한 일주기 진동 메커니즘: KaiC 인산화의 리듬을 해부하다

1. 연구 배경 및 질문 - 시스템의 단순성 : 시아노박테리아 Synechococcus elongatus 의 KaiABC 회로는 전사·번역 없이도 일주기 리듬을 만들 수 있다는 점에서 가장 단순한 생물학적 시계 모델이다. - 기존 모델의 한계 : 전이성 전환만을 가정하거나, 복잡한 헥사머‑헥사머 결합을 가정한 모델들이 있었지만, 실험적으로 두 메커니즘을 구분할 기준이 부족했다. - 핵심 질문 : “KaiC 헥사머가 어떻

단일 카메라 기반 도로 표면 정밀 복원 기술

단일 카메라 기반 도로 표면 정밀 복원 기술

본 논문은 자율주행 및 고급 운전자 지원 시스템(ADAS)에서 가장 핵심적인 문제 중 하나인 “근거리 도로 표면의 정밀 복원”을 새로운 관점에서 접근한다. 기존의 단일 카메라 기반 깊이 추정 모델들은 주로 전역적인 깊이 맵을 생성하는 데 초점을 맞추어, 작은 높이 변화나 미세한 요철을 평탄화하는 경향이 있다. 이는 특히 차량 동적 제어 시, 서스펜션 제어, 충격 흡수, 그리고 고속 주행 시 차선 유지 등에 치명적인 영향을 미칠 수 있다.

대규모 언어 모델 없이도 가능한 효율·검증 가능한 다중 홉 질의응답

대규모 언어 모델 없이도 가능한 효율·검증 가능한 다중 홉 질의응답

1. 연구 배경 및 문제 정의 - 다중 홉 QA 는 KG 상에서 여러 관계를 연쇄적으로 탐색해야 하므로 탐색 공간이 급격히 확대된다. - 기존 Plan‑on‑Graph , Think‑on‑Graph 등은 매 홉마다 LLM을 호출해 “생성 → 실행” 루프를 반복하므로 시간·비용 이 비효율적이다. - LLM 자체는 방대한 텍스트 코퍼스로부터 일반화된 언어 능력을 얻지만, 전문 도메인 에서는 환각(hallu

No Image

대기 가스에서 형광광자 절대 방출량의 정밀 측정

1. 연구 배경 및 의의 - UHECR 형광 검출 은 현재 Pierre Auger 및 Telescope Array와 같은 대형 실험의 핵심 기술이며, 대기 중 질소가 입자 샤워에 의해 여기될 때 300–400 nm 파장에서 방출되는 형광광을 측정해 입자의 에너지를 추정한다. - 형광광 수율(Y)은 에너지 재구성에 직접적인 영향을 미치며, 현재 Auger에서는 전체 시스템 불확실성(≈22 %) 중 약 14 %가 Y에 기인한다. 따라서

No Image

대학 행정자를 위한 지능형 법률 자문 시스템 – 규정·법령 관리의 혁신

1. 연구의 의의 및 기여 구분 내용 평가 ------ ------ ------ 문제 정의 대학·연구기관의 법률·규정이 방대하고 지속적으로 변함에 따라 인간 전문가에 의존하는 현재 프로세스의 비효율성을 지적 현장 문제와 직접 연결, 실용적 필요성 명확 시스템 설계 지식 획득 → 인지(추론 엔진) → 인터페이스의 3단계 구조 제시. 프레임, 시맨틱 네트워크, CLIPS 규칙 기반 구현

대형 언어 모델(LLM) 기반 맞춤형 디지털 물리·작업 치료 처방 시스템: 임상 현장에서의 실시간 소프트웨어 생성 및 평가

대형 언어 모델(LLM) 기반 맞춤형 디지털 물리·작업 치료 처방 시스템: 임상 현장에서의 실시간 소프트웨어 생성 및 평가

1. 연구 배경 및 필요성 - 디지털 치료제(DHI)의 한계 : 현재 DHI는 사전 정의된 모듈 라이브러리를 사용해 환자 맞춤형 옵션을 제한적으로만 제공한다. 이는 환자별 세부 목표·제한·환경을 반영하지 못해 치료 순응도와 효과가 저하되는 원인으로 지적된다. - LLM의 잠재력 : 최신 대형 언어 모델은 자연어를 코드로 변환하는 능력이 뛰어나며, 의료 분야에서도 진단·요약·임상 의사결정 지원에 활용되고 있다. 그러나 환자와 직

대형 언어 모델을 이용한 제올라이트 합성 절차 정보 추출 프롬프트 전략 비교 연구

대형 언어 모델을 이용한 제올라이트 합성 절차 정보 추출 프롬프트 전략 비교 연구

본 논문은 제올라이트 합성이라는 매우 구체적인 화학 분야에서 대형 언어 모델(LLM)의 정보 추출 능력을 체계적으로 검증한 최초의 연구 중 하나로 평가할 수 있다. 먼저 연구자는 정보 추출 작업을 네 가지 세부 과제로 분류했는데, 이는 자연어 처리(NLP) 분야에서 흔히 사용되는 이벤트 기반 스키마와 유사하면서도 실험 과학에 특화된 형태이다. 이벤트 유형 분류는 “합성 단계”라는 거시적 카테고리를 식별하는 작업으로, 문맥 이해와 도메인 지식이

대형 언어 모델을 활용한 합성 전략 코딩 및 CASP 향상

대형 언어 모델을 활용한 합성 전략 코딩 및 CASP 향상

이 논문은 기존 CASP 시스템이 직면한 전략적 한계를 극복하기 위해 ‘지식 증류’를 핵심 아이디어로 삼는다. 대형 언어 모델(LLM)은 방대한 화학 문헌과 특허 데이터를 사전 학습함으로써 인간 화학자가 암묵적으로 사용하는 전략적 사고를 내재하고 있다. 연구팀은 이러한 LLM을 프롬프트 엔지니어링과 인간‑인공지능 협업 과정을 통해 ‘전략 규칙’이라는 형태로 추출한다. 구체적으로, 합성 경로를 입력으로 받아 각 단계에 적용 가능한 전략적 원칙(예

대형 언어 모델이 소수 인수 분해 트리 시퀀스의 규칙성을 학습할 수 있을까

대형 언어 모델이 소수 인수 분해 트리 시퀀스의 규칙성을 학습할 수 있을까

본 연구는 수학적 구조, 특히 자연수의 소수 인수 분해 과정을 트리 형태로 시각화하고 이를 일련의 기호열(NT)로 전환함으로써, 전통적인 언어 데이터와는 전혀 다른 유형의 ‘텍스트’를 생성한다는 점에서 혁신적이다. 이러한 접근은 수학적 규칙이 내재된 데이터셋이 언어 모델에 의해 얼마나 잘 포착될 수 있는지를 직접 검증할 수 있는 실험적 장을 제공한다. 먼저, 연구진은 각 자연수를 소수 인수들의 계층적 관계로 표현하는 방법을 정의한다. 예를

대화 외교관 다중 에이전트 강화학습 기반 갈등 해결 및 합의 형성 프레임워크

대화 외교관 다중 에이전트 강화학습 기반 갈등 해결 및 합의 형성 프레임워크

본 논문이 제시하는 Dialogue Diplomats는 기존 다중 에이전트 강화학습 연구에서 흔히 간과되던 ‘대화’를 핵심 메커니즘으로 도입함으로써, 갈등 상황에서의 협상 과정을 보다 인간에 가까운 형태로 재현한다는 점에서 혁신적이다. 첫 번째 핵심 기술인 계층적 합의 네트워크(HCN)는 두 가지 주요 요소를 결합한다. 하나는 에이전트 간 상호작용을 그래프 형태로 표현하고, 그래프 신경망(GNN)을 통해 전역적인 의존성을 학습하는 것이며, 다른

데이터 기반 히스테리시스 모델 자동 추출을 위한 통합 내부 변수 학습 및 심볼릭 회귀 프레임워크

데이터 기반 히스테리시스 모델 자동 추출을 위한 통합 내부 변수 학습 및 심볼릭 회귀 프레임워크

히스테리시스 현상은 비선형 시스템에서 과거 이력에 따라 현재 응답이 달라지는 메모리 효과를 의미한다. 구조공학에서는 지진에 의해 발생하는 비탄성 변형, 재료공학에서는 강자성 물질의 자화·탈자 곡선, 마이크로액추에이터 분야에서는 압전 재료의 전기‑기계 결합 특성 등 다양한 분야에서 핵심적인 역할을 한다. 전통적으로 Bouc‑Wen 모델과 같은 경험적 모델이 널리 사용되어 왔지만, 이러한 모델은 파라미터 식별 과정에서 고도의 실험적 데이터와 복잡한

No Image

돌연변이 소수 매듭을 이용한 포스트‑퀀텀 암호체계

1. 연구 배경 및 동기 - 포스트‑퀀텀 암호의 필요성 : 현재 널리 사용되는 RSA·ECC 등은 정수 인수분해·이산 로그 문제에 기반하며, Shor 알고리즘에 의해 양자 컴퓨터가 쉽게 깨뜨릴 수 있다. 따라서 전혀 다른 수학적 구조를 이용한 대안이 요구된다. - 매듭 이론과 양자 물리 : 1980년대 이후 매듭 불변량(Jones 다항식 등)은 Chern‑Simons 이론과 연결돼 양자 컴퓨팅에서도 중요한 역할을 한다. 특히

No Image

동시 관측으로 본 플레어 블레이저 3C 66A: Fermi‑LAT와 VERITAS가 그린 고에너지 스펙트럼

1. 연구 배경 및 동기 - 블레이저(Blazar) 연구의 핵심 과제 는 고에너지(HE, MeV–GeV)와 초고에너지(VHE, TeV) 관측을 동시성 있게 확보하는 것이다. 기존에는 EGRET(HE)와 지상형 체리코프 망원경(VHE) 사이에 시간·공간 격차가 커, 두 대역의 스펙트럼을 연결하기 어려웠다. - Fermi‑LAT (우주 기반)와 VERITAS (지상형) 모두 감도와 시공간 해상도가 크게 향상돼, 3C 

No Image

동시 파라미터 식별·동기화의 확장성·수렴성: 차세대 적응법 제안

1. 연구 배경 및 문제 정의 - 동기화와 파라미터 식별의 결합 : 전통적인 동기화는 동일한 모델을 전제로 하지만, 실제 시스템에서는 모델 파라미터가 미지인 경우가 많다. Chen & Lü(2002)는 파라미터가 선형적으로 모델에 들어가는 경우, 적응법을 통해 동기화와 동시에 파라미터 식별을 시도하였다. - 기존 방법의 두 가지 핵심 한계 1. 확장성 문제 : 파라미터 차원 (m)이 상태 차원 (n)보다 클 때,

동적 확대로 시각‑언어 모델의 미세 이미지 이해력 강화: CropVLM

동적 확대로 시각‑언어 모델의 미세 이미지 이해력 강화: CropVLM

1. 연구 배경 및 문제 정의 - 해상도 병목 : 대부분의 최신 VLM은 224×224 ~ 336×336 픽셀 정도의 고정 입력 해상도를 사용한다. 작은 텍스트나 미세 객체는 이 해상도에서 소실된다. - 전통적 해결책의 한계 : 전체 이미지를 고해상도로 확대하면 Transformer 기반 VLM의 연산량이 제곱으로 증가해 실용성이 떨어진다. 기존의 아키텍처 개조·전용 파인튜닝은 대규모 재학습이 필요하고, 폐쇄형 모델에는 적용이

두 단계 자기지도 학습으로 구현한 고효율 음성 표현 및 압축 프레임워크

두 단계 자기지도 학습으로 구현한 고효율 음성 표현 및 압축 프레임워크

본 논문은 음성 신호를 효율적으로 인코딩하고 복원하기 위한 새로운 두 단계 자기지도 학습 파이프라인을 제시한다. 첫 번째 단계는 JEPA라는 최신 자기지도 학습 구조에 Density Adaptive Attention Mechanism(DAAM)을 결합한다는 점에서 혁신적이다. JEPA는 입력 신호를 두 개의 뷰(view)로 나누어 하나를 예측하도록 학습함으로써 의미론적 표현을 추출한다. 여기서 DAAM은 가우시안 혼합 모델(GMM)을 기반으로

듀얼게이지 LLM 기반 코드 생성 보안과 정확성 동시 평가 자동 벤치마크 프레임워크

듀얼게이지 LLM 기반 코드 생성 보안과 정확성 동시 평가 자동 벤치마크 프레임워크

DUALGAUGE가 제시하는 가장 큰 혁신은 “보안과 정확성의 동시 평가”라는 목표를 실현하기 위해 평가 파이프라인을 완전 자동화했다는 점이다. 기존 연구들은 보통 두 축을 별도로 다루었다. 예를 들어, 보안 중심 벤치마크는 OWASP Top‑10 같은 취약점 목록에 기반해 코드가 해당 취약점을 포함하는지를 검사했으며, 기능성 평가는 별도의 유닛 테스트 세트로 진행했다. 이러한 접근법은 실제 개발 현장에서 요구되는 ‘정확히 동작하면서도 안전한

드롭아웃 프롬프트 학습을 통한 비전‑언어 모델 강인성 향상

드롭아웃 프롬프트 학습을 통한 비전‑언어 모델 강인성 향상

본 논문은 기존 드롭아웃 기법을 비전‑언어 모델(VLM)의 프롬프트 학습에 적용함으로써 모델의 일반화와 강인성을 동시에 향상시키는 새로운 접근법을 제시한다. 전통적인 드롭아웃은 신경망의 은닉 유닛을 무작위로 비활성화하여 과적합을 방지하고, 학습 과정에서 다양한 서브네트워크를 경험하게 함으로써 모델이 보다 넓은 함수 공간을 탐색하도록 돕는다. 그러나 이러한 방식은 주로 이미지나 텍스트 단일 모달에 국한되어 적용되며, 멀티모달 구조에서 토큰 수준의

디퓨전 트랜스포머 비디오 생성에 세계 지식 메모리를 주입하는 혁신적 접근

디퓨전 트랜스포머 비디오 생성에 세계 지식 메모리를 주입하는 혁신적 접근

본 논문은 최근 비디오 생성 분야에서 주목받고 있는 디퓨전 트랜스포머(DiT) 모델이 물리적 일관성이나 상식적인 동작을 제대로 반영하지 못한다는 근본적인 한계를 짚어낸다. 이는 이미지·텍스트 분야에서 대규모 언어 모델이 인‑컨텍스트 학습을 통해 외부 지식을 효율적으로 활용하는 방식과는 대조적이다. 저자들은 먼저 DiT의 내부 표현을 직접 조작함으로써 모델의 출력에 영향을 미칠 수 있음을 실험적으로 증명한다. 특히, 임베딩 공간에서 저역(appe

루빅큐브를 통한 평생 전문가 학습의 보편성: 집단 지능과 인지 공예의 새로운 통찰

루빅큐브를 통한 평생 전문가 학습의 보편성: 집단 지능과 인지 공예의 새로운 통찰

1. 연구 배경 및 목적 - 문제 인식 : 전문가 성과에 대한 장기적인 정량 데이터가 부족해, 학습 메커니즘과 지식 전파 과정을 체계적으로 모델링하기 어렵다. - 루빅큐브 선택 이유 : 물리적 퍼즐이면서도 3‑차원 퍼뮤테이션 군의 Cayley 그래프라는 엄격한 수학적 구조를 갖는다. 따라서 인지 공예(Cognitive Artifact) 로서 ‘엔트로피·난이도·검색·최적성’ 등 추상적 개념을 구체화할 수 있다.

No Image

링크 편향 전략을 통한 네트워크 형성 게임: 임의의 차수 분포를 갖는 안정 그래프 구축

1. 연구 배경 및 동기 - 네트워크 과학 에서는 실제 시스템에서 관찰되는 스케일프리, 소규모 세계 등 다양한 토폴로지를 설명하려고 한다. - 기존 모델들은 플레이어들의 목표 함수가 차수(k_i)를 직접 최소화/최대화 하도록 가정했으며, 이는 현실적인 “정확히 k_i개의 링크를 원한다”는 전제와는 거리가 있다. - 링크 편향 (특정 파트너와의 연결을 선호하거나 회피하는 성향)을 도입하면, 플레이어가 링크 자체보다는

< 분야별 논문 현황 (Total: 4501) >

Research
4501

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키