Research

All posts under category "Research"

3632 posts total

Sorted by date

세밀한 이미지 이해를 위한 동적 확대 기법

Vision-Language Models (VLMs) often struggle with tasks that require fine-grained image understanding, such as scene-text recognition or document analysis, due to perception limitations and visual fragmentation. To address these challenges, we introd

세밀한 이미지 이해를 위한 동적 확대 기법

소프트 기하학적 편향을 활용한 객체 중심 세계 모델링

수직 계층 구조로 토큰 생성 가속화하는 PHOTON 모델

수화 시멘트 미세구조 진화를 위한 개량형 위상장 모델

스마트 홈 기반 요로감염 조기 탐지를 위한 불확실성 인식 임상 지원 시스템

스무딩 보정 트랜스포머 기반 고해상도 복원 모델

스캔포드 로봇으로 도서관 데이터 자동 수집 및 VLM 맞춤 학습

스케일링 취약점을 이용한 적응형 시각‑언어 모델 공격 프레임워크

스탠포드 수면 벤치마크 대규모 PSG 데이터와 자기지도 학습 기반 수면 분석 혁신

시각 기반 VLM을 활용한 CNC 가공 코드와 HMI 동시 검증

시각 인지와 추론을 위한 종합 퍼즐 벤치마크 SPHINX

시각 증강 사유 사슬: 추론 단계에서 동적 이미지 변환으로 VLM 견고성 강화

시각 콘텐츠 기억력 모델링을 위한 대규모 비지도 데이터셋 및 멀티모달 ToT 검색

시각‑언어 모델 텍스트 관성 해소를 위한 의식적 시선 제어

시각‑우선 멀티모달 RAG: OCR‑프리 파이프라인과 피라미드 인덱싱의 혁신

시각언어 모델 편향 제거를 위한 서브스페이스 투영 기법

시각적 지식 그래프를 활용한 대형 언어 모델 환각 탐지 및 인간‑인‑루프 피드백 프레임워크

시간 시계열 기반 모델 툴킷으로 혁신적인 파이프라인 구축

시간 예측을 위한 통합 인코더 디코더 프레임워크 TIMEPERCEIVER

시간과 공간을 압축하는 튜링 기계 시뮬레이션의 전자역학적 법칙

시맨틱 매칭 기반 대조 학습으로 부분 정렬 클러스터링 강화

시점 변화와 움직이는 음원에 대응하는 고품질 바이노럴 오디오 ViSAudio

시점별 시각 전문가와 자기지도 융합 기반 무노이즈 기하학적 사전

신경 영감형 위상 정규화가 멀티모달 비전‑언어 모델의 프라이버시 방어력을 강화한다

신경신호 기반 로봇 안전 보장을 위한 실시간 이중 검증 프레임워크

실시간 비디오 기반 2D 동작 모방을 통한 다중 캐릭터 제어 학습

실시간 스트리밍을 위한 4D 가우시안 스플래팅 최적화 프레임워크 AirGS

실제 세계와 같은 복합 환경을 위한 LLM VLM 에이전트 시뮬레이터 SimWorld

실제 환경 제어 인터페이스 벤치마크 SWITCH

실현 가능한 추상화를 통한 효율적인 계층 강화학습

심볼릭 드라이브 로컬 퍼스트 자율주행 데이터 마이닝 프레임워크

안전중요 객체 인식·예측·계획 종합 고찰

압축기‑예측기 시스템의 정보이론적 설계와 성능 예측

액션플로우: 엣지 로봇을 위한 초고속 비전‑언어‑액션 추론 프레임워크

양자 연합 학습 이질성 데이터와 시스템 차이점이 수렴에 미치는 영향

에이전트 시스템 스케일링 원리 다중 에이전트 협업과 모델 능력의 정량적 분석

엔트로피 신호 기반 효율적 강화학습으로 대형 언어 모델 추론 향상

연결 막대 차트의 수직 선 길이 최소화

예산 제약 하 비용 효율적인 다중 에이전트 시스템 설계와 AgentBalance 프레임워크

오디오 토큰 압축으로 확장 가능한 대형 오디오 언어 모델 구현

오메가 정규 목표와 제약을 결합한 모델 기반 강화학습

오픈 의도 분류를 위한 탄력적인 타원형 경계 학습

온라인 다기관 협업으로 구현하는 소프트웨어 공학 연구 강좌

요리 단계별 이미지 생성의 새로운 패러다임

웹쉘 패밀리 자동 분류를 위한 동적 호출 추적과 그래프 기반 표현 연구

위키백과 댓글 무례성 탐지를 위한 그래프 신경망 기반 구조적 분석

유전 알고리즘 기반 양자 자동인코더 아키텍처 탐색

음성 분석 기반 근위축성 측삭경화증 중증도 통합 분류 연구

음향 기반 드론 인식 네트워크 AUDRON

의료 비전 언어 모델 시각 정렬을 위한 경량 디스틸레이션

< Category Statistics (Total: 4634) >

Start searching

No results found