Cs-Cl
강화학습으로 LLM을 훈련시켜 인간 선택을 설명한다
감독 학습으로 대형 언어 모델의 분포 정렬 향상
뇌 영감을 받은 장문 이해를 위한 PaceLLM: 지속 활성화와 피질 전문가 클러스터링
MoE 모델을 위한 전문가 인식 양자화 혁신
RLHF와 DPO의 성능 격차: 모델 표현력과 샘플 효율성의 이중 딜레마
다양성을 위한 레시피 적응 RAG 프레임워크
모바일 에이전트 평가를 위한 차세대 벤치마크 모바일벤치V2
경험 기반 소프트웨어 이슈 해결
LFQA‑E: 장문 질문‑응답 평가를 위한 다국어 기준 벤치마크
감정과 대처 전략을 연결한 역할극 기반 코퍼스 구축
인간처럼 대화하는 대형 언어 모델 강화
조건 인식 문장 임베딩 CASE로 조건별 의미 유사도 정밀 측정
활성학습 채택 현황 재조명: NLP 커뮤니티 설문 조사
수학 문제 해결을 위한 적응형 커리큘럼 강화 미세조정
추론 기반 대형언어모델이 임상 문서 분류에 미치는 영향
SAE 기반 특징으로 안전한 분류와 전이 학습을 구현하는 새로운 베스트 프랙티스
보상조건부 그룹 상대 정책 최적화로 다중턴 도구 호출 강화
RL 기반 중간 학습으로 LLM 순환 진화
자기 적응형 누적 오류 억제를 위한 SVD 기반 대형 언어 모델 압축
테스트 시점 재귀 사고: 외부 피드백 없이 자체 향상
MAS 프로베 다중 에이전트 시스템 프로세스 검증 이해
표준에서 방언까지 텍스트와 음성 전이 차이