KOINEU

두 단계 자기지도 학습으로 구현한 고효율 음성 표현 및 압축 프레임워크

We introduce a two-stage self-supervised framework that combines the Joint-Embedding Predictive Architecture (JEPA) with a Density Adaptive Attention Mechanism (DAAM) for learning robust speech representations. Stage 1 uses JEPA with DAAM to learn semantic audio features via masked prediction in lat

두 단계 자기지도 학습으로 구현한 고효율 음성 표현 및 압축 프레임워크

듀얼게이지 LLM 기반 코드 생성 보안과 정확성 동시 평가 자동 벤치마크 프레임워크

멀티모달 도구 사용 벤치마크 M3

멀티모달 오토인코더의 리프시츠 특성 분석과 주의 기반 융합 안정화 기법

모나딕 컨텍스트 엔지니어링: 대형 언어 모델 에이전트 설계의 새로운 패러다임

무선주파수 라디언스필드 기반 사전학습으로 실내 위치추정 일반화 혁신

물리학에서 결정론과 비결정론의 표상적 대립과 모델 불변성 기반 구조 실재론

범용 고충실도 시뮬레이션 플랫폼 TongSIM

범위 분할 엔트로피 기반 알고리즘의 보편 최적성 증명

법률 분야 LLM 성능 향상을 위한 문서 구조 재배치와 역할 기반 프롬프트 연구

변형 망베 기반 글로벌 컨텍스트 학습을 통한 3D 손 자세 추정

변형 트랜스포머 정책을 위한 일반화 정책 그래디언트 정리

병렬 토큰 생성 위한 강화학습 기반 마스크 확산 언어 모델 가속기 dUltra

비정상 환경을 위한 예측 기반 오프라인 강화학습 프레임워크

생성형 AI가 금융 애널리스트 보고서에 미치는 생산성·정확도 양면 효과

생성형 검색에서 공정한 기여도 평가를 위한 MAXSHAPLEY 알고리즘

수직 계층 구조로 토큰 생성 가속화하는 PHOTON 모델

스마트 홈 기반 요로감염 조기 탐지를 위한 불확실성 인식 임상 지원 시스템

스케일링 취약점을 이용한 적응형 시각‑언어 모델 공격 프레임워크

시각 기반 VLM을 활용한 CNC 가공 코드와 HMI 동시 검증

시각‑언어 모델 텍스트 관성 해소를 위한 의식적 시선 제어

시간 시계열 기반 모델 툴킷으로 혁신적인 파이프라인 구축

시점 변화와 움직이는 음원에 대응하는 고품질 바이노럴 오디오 ViSAudio

실시간 스트리밍을 위한 4D 가우시안 스플래팅 최적화 프레임워크 AirGS

실제 세계와 같은 복합 환경을 위한 LLM VLM 에이전트 시뮬레이터 SimWorld

심볼릭 드라이브 로컬 퍼스트 자율주행 데이터 마이닝 프레임워크

엔트로피 신호 기반 효율적 강화학습으로 대형 언어 모델 추론 향상

예산 제약 하 비용 효율적인 다중 에이전트 시스템 설계와 AgentBalance 프레임워크

웹쉘 패밀리 자동 분류를 위한 동적 호출 추적과 그래프 기반 표현 연구

위키백과 댓글 무례성 탐지를 위한 그래프 신경망 기반 구조적 분석

의료 현장 대형언어모델 평가를 위한 MediEval과 안전 파인튜닝

의미인식 기반 의료 영상 복원과 블록체인 추적 통합 시스템

이더리움 거래 경제적 의도 파악을 위한 TxSum 데이터셋과 MATEX 멀티에이전트 시스템

이중 추론 학습: 긍정‑부정 논리를 결합한 대형 언어 모델의 과학적 추론 강화

자동화된 MDP 모델링과 정책 생성을 위한 에이전트형 LLM 프레임워크 A‑LAMP

저조도 교통 영상 향상을 위한 무지도 학습 다단계 프레임워크

주가 예측에서 KAN과 LSTM 성능 비교 정확도와 해석 가능성의 균형

중국 K12 교육용 대형언어모델 평가 벤치마크 EduEval

천문·기하학적 접근을 통한 기블라 방향 결정 연구

첫 프레임 편집을 전체 영상에 자연스럽게 전파하는 방법

큐브벤치 멀티모달 대형 언어 모델의 공간·순차 추론 평가

클린노트에이전트 대형언어모델 기반 다중‑에이전트 프레임워크를 활용한 심부전 30일 재입원 위험 예측

텍스트 기반 이미지 편집 평가를 위한 종합 벤치마크와 인간 지각에 맞춘 메트릭

툴 호출 에이전트를 위한 최소 권한 프레임워크 MiniScope

튜링 테스트 재조명과 최신 비판 여섯 가지

프리즘 월드 모델: 하이브리드 로봇 동역학을 위한 모드 분리 전문가 혼합

프리필·디코드 분리형 FPGA LLM 가속기 PD Swap

플라스틱성 회복을 위한 트윈 네트워크 기반 리셋 기법 AltNet

픽셀 동등 잠재 합성으로 구현하는 고품질 이미지 인페인팅

핀란드 고등학생의 AI 역량 인식이 위험 인식에 미치는 차이

< Category Statistics (Total: 5003) >

Start searching

No results found