NLP

'NLP' 태그의 모든 글

총 43개의 글
시간순 정렬
KS LIT 3M 대형 언어 모델 사전 학습을 위한 310만 단어 카슈미리 텍스트 데이터셋

KS LIT 3M 대형 언어 모델 사전 학습을 위한 310만 단어 카슈미리 텍스트 데이터셋

📝 원문 정보 Title: ks-lit-3m: A 3.1 million word kashmiri text dataset for large language model pretraining ArXiv ID: 2601.01091 발행일: 2026-01-03 저자: Haq Nawaz Malik 📝 초록 (Abstract) 대형 언어 모델(LLM)은 고자원 언어에서는 뛰어난 유창성을 보이지만, 약 700만 명이 사용하는 카슈미리어에서는 일관된 텍스트를 …

NLP Data Computer Science Model
언어 모델의 내적 의도와 외적 토큰 사이: 의도 붕괴 메트릭을 통한 추론 분석

언어 모델의 내적 의도와 외적 토큰 사이: 의도 붕괴 메트릭을 통한 추론 분석

📝 원문 정보 Title: Intention Collapse: Intention-Level Metrics for Reasoning in Language Models ArXiv ID: 2601.01011 발행일: 2026-01-03 저자: Patricio Vera 📝 초록 (Abstract) 언어 생성은 고차원 내부 상태를 단일 토큰 시퀀스로 투사한다. 본 연구는 이러한 다대일 매핑을 ‘의도 붕괴(intention collapse)’라는 관점에서 …

NLP Computer Science Model
임베딩 일관성 규제로 소형 언어 모델의 의미 구조 보존

임베딩 일관성 규제로 소형 언어 모델의 의미 구조 보존

📝 원문 정보 Title: ECR: Manifold-Guided Semantic Cues for Compact Language Models ArXiv ID: 2601.00543 발행일: 2026-01-02 저자: Chung-Wei Victor Yuan 📝 초록 (Abstract) 소형 모델은 용량이 제한되거나 다언어 데이터를 다룰 때 임베딩 공간의 구조가 붕괴되는 경향이 있다. 기존 압축 기법은 출력 로짓이나 내부 특징을 맞추는 데 초점을 맞추 …

NLP Computer Science Model
빅 AI가 메타위기를 가속화한다 우리가 할 수 있는 일

빅 AI가 메타위기를 가속화한다 우리가 할 수 있는 일

📝 원문 정보 Title: Big AI is accelerating the metacrisis: What can we do? ArXiv ID: 2512.24863 발행일: 2025-12-31 저자: Steven Bird 📝 초록 (Abstract) 세계는 생태·의미·언어 위기의 삼중고에 직면해 있으며, 이들 위기가 서로 얽혀 메타위기로 전개되고 있다. 대규모 인공지능, 특히 자연어 처리 기술은 이러한 위기를 모두 가속화하고 있다. 언어 엔지니어 …

NLP Computer Science
생각 흐름으로 보는 언어 모델링

생각 흐름으로 보는 언어 모델링

📝 원문 정보 Title: Modeling Language as a Sequence of Thoughts ArXiv ID: 2512.25026 발행일: 2025-12-31 저자: Nasim Borazjanizadeh, James McClelland 📝 초록 (Abstract) 트랜스포머 기반 언어 모델은 토큰을 순차적으로 예측함으로써 매우 자연스러운 텍스트를 생성한다. 그러나 표면적인 동시출현 통계에 의존하기 때문에 엔티티와 사건에 대한 전역적 …

NLP Computer Science Model
숨은 위험 질의 변환을 위한 다중 에이전트 토론 프레임워크

숨은 위험 질의 변환을 위한 다중 에이전트 토론 프레임워크

📝 원문 정보 Title: HarmTransform: Transforming Explicit Harmful Queries into Stealthy via Multi-Agent Debate ArXiv ID: 2512.23717 발행일: 2025-12-09 저자: Shenzhe Zhu 📝 초록 (Abstract) 대형 언어 모델(LLM)은 위험한 질의를 탐지하고 차단하는 안전 메커니즘을 갖추고 있지만, 기존 정렬 방법은 명백히 위험한 콘텐츠에 집중 …

NLP Computer Science
속보 없는 세상: 뉴스,:

속보 없는 세상: 뉴스,:

📝 원문 정보 Title: SirenLess: reveal the intention behind news ArXiv ID: 2001.02731 발행일: 2020-01-10 저자: Xumeng Chen, Leo Yu-Ho Lo, Huamin Qu 📝 초록 (Abstract) 신문 기사는 이제 더 이상 솔직하고 객관적인 정보를 제공하지 못하는 경우가 많아졌습니다. 이로 인해 독자들은 특정 사건에 대한 주관적인 판단을 내리는 데 어려움을 겪고 있습니 …

NLP Computer Science HCI
문맥화된 단어 표현을 활용한 독서 이해

문맥화된 단어 표현을 활용한 독서 이해

📝 원문 정보 Title: Contextualized Word Representations for Reading Comprehension ArXiv ID: 1712.03609 발행일: 2018-09-05 저자: Shimi Salant, Jonathan Berant 📝 초록 (Abstract) 문서를 읽고 그 내용에 대한 질문에 답변을 추출하는 것이 최근 큰 관심을 받았습니다. 대부분의 연구가 문장과 문서 간 상호작용에 초점을 맞추었지만, 본 논 …

NLP Computer Science
영화 장르를 플롯 요약을 기반으로 예측하기

영화 장르를 플롯 요약을 기반으로 예측하기

📝 원문 정보 Title: Predicting Movie Genres Based on Plot Summaries ArXiv ID: 1801.04813 발행일: 2018-01-16 저자: Quan Hoang 📝 초록 (Abstract) 이 프로젝트는 영화 장르를 플롯 요약을 기반으로 예측하기 위해 몇 가지 머신 러닝 방법을 탐색합니다. 나이브 베이즈, 워드2vec+XGBoost 및 순환 신경망이 텍스트 분류에 사용되며, K-이진 변환, 등급 방법 …

NLP Statistics Machine Learning Computer Science
사회미디어 텍스트 처리와 스마트시티를 위한 의미 분석

사회미디어 텍스트 처리와 스마트시티를 위한 의미 분석

📝 원문 정보 Title: Social Media Text Processing and Semantic Analysis for Smart Cities ArXiv ID: 1709.03406 발행일: 2017-09-12 저자: Jo~ao Filipe Figueiredo Pereira 📝 초록 (Abstract) 사회 미디어의 등장으로 사람들은 24시간 내내 정보를 즉시 얻고 공유하는 것이 가능해졌습니다. 많은 연구 영역에서 이러한 방대한 양의 사용자 …

Computers and Society Social Networks NLP Computer Science Analysis
IISCNLP tại SemEval 2016 Task 2: ILP 기반 다중 청크 정렬을 사용한 해석 가능한 STS

IISCNLP tại SemEval 2016 Task 2: ILP 기반 다중 청크 정렬을 사용한 해석 가능한 STS

📝 원문 정보 Title: IISCNLP at SemEval-2016 Task 2: Interpretable STS with ILP based Multiple Chunk Aligner ArXiv ID: 1605.01194 발행일: 2016-05-05 저자: Lavanya Sita Tekumalla and Sharmistha 📝 초록 (Abstract) 해석 가능한 의미 텍스트 유사도(iSTS) 작업은 쌍방향 문장 유사성에 중요한 설명적 레이어를 …

NLP Statistics Machine Learning Computer Science
의미 기반 단어 임베딩을 이용한 텍스트 구분 방법 연구

의미 기반 단어 임베딩을 이용한 텍스트 구분 방법 연구

📝 원문 정보 Title: Text Segmentation based on Semantic Word Embeddings ArXiv ID: 1503.05543 발행일: 2015-03-19 저자: Alexander A Alemi, Paul Ginsparg 📝 초록 (Abstract) 본 논문은 의미론적 단어 임베딩을 텍스트 분할 알고리즘에 사용하는 것을 탐구하였습니다. 이는 C99 분할 알고리즘과 분산된 단어 벡터 표현에서 영감을 받은 새로운 알고 …

NLP Information Retrieval Computer Science

< 분야별 논문 현황 (Total: 1373) >

General
757
MATH-PH
1
Nonlinear Sciences
3
Quantitative Biology
4
Quantum Physics
6

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키