General Research

All posts under category "General Research"

718 posts total

Sorted by date

SR‑MCR: 자체참조 신호를 활용한 단계별 추론 정렬 프레임워크

Multimodal LLMs often produce fluent yet unreliable reasoning, exhibiting weak step-to-step coherence and insufficient visual grounding, largely because existing alignment approaches supervise only the final answer while ignoring the reliability of the intermediate reasoning process. We introduce SR

SR‑MCR: 자체참조 신호를 활용한 단계별 추론 정렬 프레임워크

깊은 정렬을 통한 대형 언어 모델의 지속 학습 망각 방지

다중패턴 강화학습으로 시각언어행동 모델을 위한 다양하고 확장 가능한 데이터 생성

베이지안 사전 가이드 최적화로 강화된 그룹 상대 정책 최적화

사회복지를 최우선으로 하는 인센티브 설계 비용 효율성 및 협력 빈도

실제 환경 제어 인터페이스 벤치마크 SWITCH

코트 레시피 메타학습으로 새로운 추론 과제의 인 컨텍스트 학습 강화

AI 기반 사전 의료 계획 대리인 연구

AI 훈련의 물질 발자국: A100 GPU 구성과 모델 규모에 따른 자원 요구량 분석

Arxiv 2512.14312

Arxiv 2512.14417

Arxiv 2512.16855

Arxiv 2512.21652

Arxiv 2601.02071

Icy worlds: Moons and Dwarf Planets

LLM 기반 오프라인 환경 설계로 실시간 협동 MARL 안정성 강화

공간 가변 스펙트럼을 학습하는 신경망 표현

그래프 신경망 기반 강화학습을 활용한 라벨 전이 시스템 제어 합성

길이최적 토크나이저로 토큰 수와 연산 효율 크게 향상

대형 언어 모델이 소수 인수 분해 트리 시퀀스의 규칙성을 학습할 수 있을까

듀얼게이지 LLM 기반 코드 생성 보안과 정확성 동시 평가 자동 벤치마크 프레임워크

멀티모달 도구 사용 벤치마크 M3

물리학에서 결정론과 비결정론의 표상적 대립과 모델 불변성 기반 구조 실재론

병렬 토큰 생성 위한 강화학습 기반 마스크 확산 언어 모델 가속기 dUltra

비정상 환경을 위한 예측 기반 오프라인 강화학습 프레임워크

생성형 AI가 금융 애널리스트 보고서에 미치는 생산성·정확도 양면 효과

생성형 검색에서 공정한 기여도 평가를 위한 MAXSHAPLEY 알고리즘

수직 계층 구조로 토큰 생성 가속화하는 PHOTON 모델

스마트 홈 기반 요로감염 조기 탐지를 위한 불확실성 인식 임상 지원 시스템

시각 기반 VLM을 활용한 CNC 가공 코드와 HMI 동시 검증

시간 시계열 기반 모델 툴킷으로 혁신적인 파이프라인 구축

예산 제약 하 비용 효율적인 다중 에이전트 시스템 설계와 AgentBalance 프레임워크

의미인식 기반 의료 영상 복원과 블록체인 추적 통합 시스템

저조도 교통 영상 향상을 위한 무지도 학습 다단계 프레임워크

주가 예측에서 KAN과 LSTM 성능 비교 정확도와 해석 가능성의 균형

중국 K12 교육용 대형언어모델 평가 벤치마크 EduEval

천문·기하학적 접근을 통한 기블라 방향 결정 연구

첫 프레임 편집을 전체 영상에 자연스럽게 전파하는 방법

툴 호출 에이전트를 위한 최소 권한 프레임워크 MiniScope

프리즘 월드 모델: 하이브리드 로봇 동역학을 위한 모드 분리 전문가 혼합

프리필·디코드 분리형 FPGA LLM 가속기 PD Swap

LLM 기반 회로 분석 과제 채점 향상 파이프라인 GPT4o의 다단계 프롬프트와 데이터 증강 적용

Towards Transferable Defense Against Malicious Image Edits

CauSTream: Causal Spatio-Temporal Representation Learning for Streamflow Forecasting

cuPilot: A Strategy-Coordinated Multi-agent Framework for CUDA Kernel Evolution

LLM 기반 거시금융 스트레스 테스트 파이프라인: 투명성·검증 가능성·위험 평가

Scaling Spatial Reasoning in MLLMs through Programmatic Data Synthesis

Security Risks of Agentic Vehicles: A Systematic Analysis of Cognitive and Cross-Layer Threats

Towards Efficient LLM-aware Heterogeneous Graph Learning

게이트링에 의한 혁신 통계 수축과 최근접 이웃 연관 효과

< Category Statistics (Total: 5008) >

Start searching

No results found