Data

'Data' 태그의 모든 글

총 62개의 글
시간순 정렬
데이터 격리형 교차 도메인 시퀀스 추천을 위한 모델 병합 프레임워크 MergeRec

데이터 격리형 교차 도메인 시퀀스 추천을 위한 모델 병합 프레임워크 MergeRec

📝 원문 정보 Title: MergeRec: Model Merging for Data-Isolated Cross-Domain Sequential Recommendation ArXiv ID: 2601.01753 발행일: 2026-01-05 저자: Hyunsoo Kim, Jaewan Moon, Seongmin Park, Jongwuk Lee 📝 초록 (Abstract) 현대의 추천 시스템은 도메인별 데이터에만 의존해 학습되기 때문에 여러 도메인에 …

Data Information Retrieval Computer Science Model
KS LIT 3M 대형 언어 모델 사전 학습을 위한 310만 단어 카슈미리 텍스트 데이터셋

KS LIT 3M 대형 언어 모델 사전 학습을 위한 310만 단어 카슈미리 텍스트 데이터셋

📝 원문 정보 Title: ks-lit-3m: A 3.1 million word kashmiri text dataset for large language model pretraining ArXiv ID: 2601.01091 발행일: 2026-01-03 저자: Haq Nawaz Malik 📝 초록 (Abstract) 대형 언어 모델(LLM)은 고자원 언어에서는 뛰어난 유창성을 보이지만, 약 700만 명이 사용하는 카슈미리어에서는 일관된 텍스트를 …

NLP Data Computer Science Model
대규모 언어 모델을 활용한 범주형 데이터 클러스터링의 의미 격차 해소

대규모 언어 모델을 활용한 범주형 데이터 클러스터링의 의미 격차 해소

📝 원문 정보 Title: Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models ArXiv ID: 2601.01162 발행일: 2026-01-03 저자: Zihua Yang, Xin Liao, Yiqun Zhang, Yiu-ming Cheung 📝 초록 (Abstract) 범주형 데이터는 의료, 마케팅, 바이오인포매틱스 등 다양한 분야에서 흔히 나타 …

Data Machine Learning Computer Science Model
스케일러블 데이터 기반 도달 가능성 분석 및 제어 쿠프만 연산자와 컨포멀 보장

스케일러블 데이터 기반 도달 가능성 분석 및 제어 쿠프만 연산자와 컨포멀 보장

📝 원문 정보 Title: Scalable Data-Driven Reachability Analysis and Control via Koopman Operators with Conformal Coverage Guarantees ArXiv ID: 2601.01076 발행일: 2026-01-03 저자: Devesh Nath, Haoran Yin, Glen Chou 📝 초록 (Abstract) 우리는 알려지지 않은 비선형 시스템에 대한 확률적 데이터 …

Electrical Engineering and Systems Science Data Analysis
주의 메커니즘 기반 EfficientNetV2를 활용한 백혈병 세포 자동 분류 시스템

주의 메커니즘 기반 EfficientNetV2를 활용한 백혈병 세포 자동 분류 시스템

📝 원문 정보 Title: Enhanced Leukemic Cell Classification Using Attention-Based CNN and Data Augmentation ArXiv ID: 2601.01026 발행일: 2026-01-03 저자: Douglas Costa Braga, Daniel Oliveira Dantas 📝 초록 (Abstract) 본 연구는 급성 림프구성 백혈병(ALL) 세포 분류를 위한 재현 가능한 딥러닝 파이프라 …

Computer Vision Data Computer Science
데이터 변동 상황에서 병리 비전‑언어 모델 성능 저하 탐지

데이터 변동 상황에서 병리 비전‑언어 모델 성능 저하 탐지

📝 원문 정보 Title: Detecting Performance Degradation under Data Shift in Pathology Vision-Language Model ArXiv ID: 2601.00716 발행일: 2026-01-02 저자: Hao Guan, Li Zhou 📝 초록 (Abstract) 비전‑언어 모델(VLM)은 의료 영상 분석과 질병 진단에서 큰 잠재력을 보여주지만, 실제 현장에 배포된 후 입력 데이터의 분포가 개발 …

Computer Vision Data Computer Science Model
드리프트 기반 데이터셋 안정성 벤치마크

드리프트 기반 데이터셋 안정성 벤치마크

📝 원문 정보 Title: Drift-Based Dataset Stability Benchmark ArXiv ID: 2512.23762 발행일: 2025-12-28 저자: Dominik Soukup, Richard Plný, Daniel Vašata, Tomáš Čejka 📝 초록 (Abstract) 머신러닝(ML)은 네트워크 트래픽 분류에 효율적이고 널리 사용되는 접근법이다. 그러나 네트워크 트래픽 분류는 데이터가 빠르게 변화하고 새로운 혹은 …

Machine Learning Computer Science Data
얼마나 많은 데이터가 충분한가 저차원 구조를 가진 생성 비전 언어 모델의 균일 수렴 경계

얼마나 많은 데이터가 충분한가 저차원 구조를 가진 생성 비전 언어 모델의 균일 수렴 경계

📝 원문 정보 Title: How Much Data Is Enough? Uniform Convergence Bounds for Generative & Vision-Language Models under Low-Dimensional Structure ArXiv ID: 2512.23109 발행일: 2025-12-28 저자: Paul M. Thompson 📝 초록 (Abstract) 현대의 생성 모델과 비전‑언어 모델(VLM)은 과학·의료 분 …

Data Machine Learning Computer Science Model
데이터셋 양자화 기반 적응형 압축으로 보는 새로운 프루닝 패러다임

데이터셋 양자화 기반 적응형 압축으로 보는 새로운 프루닝 패러다임

📝 원문 정보 Title: Adaptive Dataset Quantization: A New Direction for Dataset Pruning ArXiv ID: 2512.05987 발행일: 2025-11-28 저자: Chenyue Yu, Jianyu Yu 📝 초록 (Abstract) 본 논문은 자원 제한이 있는 엣지 디바이스에서 대규모 데이터셋의 저장·통신 비용을 감소시키기 위해, 샘플 내부의 중복 정보를 제거하는 새로운 데이터셋 양자화 기 …

Data
불변 텐서 아키텍처 보안 에너지 효율 AI 추론을 위한 순수 데이터플로우 접근

불변 텐서 아키텍처 보안 에너지 효율 AI 추론을 위한 순수 데이터플로우 접근

📝 원문 정보 Title: The Immutable Tensor Architecture: A Pure Dataflow Approach for Secure, Energy-Efficient AI Inference ArXiv ID: 2511.22889 발행일: 2025-11-28 저자: Fang Li 📝 초록 (Abstract) 대형 언어 모델(LLM)을 소비자 엣지 디바이스에 배치하는 데 가장 큰 제약은 “메모리 월”이다. 토큰을 생성할 때마다 수 …

Data
No Image

결과 제한형 데이터 인터페이스를 사용하여 질의에 답할 수 있는 시점은 언제인가?

📝 원문 정보 Title: When Can We Answer Queries Using Result-Bounded Data Interfaces? ArXiv ID: 1810.07822 발행일: 2023-06-22 저자: Antoine Amarilli and Michael Benedikt 📝 초록 (Abstract) 이 논문에서는 주어진 바인딩과 일치하는 튜플에 대한 조회 접근을 제공하는 접근 방법을 통해 데이터에 질의를 하는 문제를 고려합니다. 이 …

Databases Logic Computer Science Data
패널 데이터 양분 회귀를 이용한 치료 효과 모델 연구

패널 데이터 양분 회귀를 이용한 치료 효과 모델 연구

📝 원문 정보 Title: Panel Data Quantile Regression for Treatment Effect Models ArXiv ID: 2001.04324 발행일: 2021-11-18 저자: Takuya Ishihara 📝 초록 (Abstract) 이 연구에서는 랭크 불변성과 랭크 정역성을 가정한 양자적 처리 효과(QTE)의 새로운 추정 방법을 개발합니다. Ishihara (2020)는 이러한 가정 하에서 분리되지 않은 패널 데이 …

Statistics Data Economics Model
지구 관측 데이터의 시공간 분석을 위한 비선형 주성분 분석

지구 관측 데이터의 시공간 분석을 위한 비선형 주성분 분석

📝 원문 정보 Title: Nonlinear PCA for Spatio-Temporal Analysis of Earth Observation Data ArXiv ID: 2002.04539 발행일: 2020-02-12 저자: Diego Bueso, Maria Piles, Gustau Camps-Valls 📝 초록 (Abstract) 원격감지 관측, 제품 및 시뮬레이션은 우리의 행성과 기후 변동을 모니터링하는 기본적인 정보 소스입니다. 지구 데이터 …

Analysis Data Physics
링크드 데이터 세트의 품질 평가를 위한 확장 가능한 프레임워크

링크드 데이터 세트의 품질 평가를 위한 확장 가능한 프레임워크

📝 원문 정보 Title: A Scalable Framework for Quality Assessment of RDF Datasets ArXiv ID: 2001.11100 발행일: 2020-01-31 저자: Gezim Sejdiu, Anisa Rula, Jens Lehmann, and Hajira Jabeen 📝 초록 (Abstract) 최근 몇 년 동안 Linked Data의 사용이 지속적으로 늘어나면서, 오늘날 10,000개 이상의 데이터셋 …

Performance Computer Science Databases Data Framework
해석 가능한 모델의 프론트를 진화시키는 유전 알고리즘을 활용한 데이터 시각화

해석 가능한 모델의 프론트를 진화시키는 유전 알고리즘을 활용한 데이터 시각화

📝 원문 정보 Title: Genetic Programming for Evolving a Front of Interpretable Models for Data Visualisation ArXiv ID: 2001.09578 발행일: 2020-01-29 저자: Andrew Lensen, Bing Xue, Mengjie Zhang 📝 초록 (Abstract) 데이터 시각화는 대규모 데이터셋을 이해하는 데 중요한 도구입니다. 여러 시각화 방법이 제안되 …

Computer Science Model Neural Computing Data Computer Vision
No Image

인도 에모스피치 명령 데이터셋: 야외에서 감정 기반 음성 인식을 위한 데이터셋

📝 원문 정보 Title: Indian EmoSpeech Command Dataset: A dataset for emotion based speech recognition in the wild ArXiv ID: 1910.13801 발행일: 2019-10-31 저자: Subham Banga, Ujjwal Upadhyay, Piyush Agarwal, Aniket Sharma and Prerana Mukherjee 📝 초록 (Abstract) 말투 …

Audio Processing Sound Computer Science Electrical Engineering and Systems Science Data Multimedia
No Image

안드로이드 애플리케이션 데이터셋: 문헌 고찰

📝 원문 정보 Title: Datasets of Android Applications: a Literature Review ArXiv ID: 1809.10069 발행일: 2018-09-27 저자: Franz-Xaver Geiger, Ivano Malavolta 📝 초록 (Abstract) 휴대폰과 태블릿이 가장 널리 사용되는 컴퓨팅 기기로 자리잡았으며, 안드로이드 플랫폼의 우세가 두드러지고 있습니다. 이에 따라 안드로이드 애플리케이션 개발이 급 …

Data Computer Science Software Engineering
No Image

동적으로 성장하는 데이터베이스의 적응적 분석을 위한 차등적 프라이버시

📝 원문 정보 Title: Differential Privacy for Growing Databases ArXiv ID: 1803.06416 발행일: 2018-03-20 저자: Rachel Cummings, Sara Krehbiel, Kevin A. Lai, Uthaipon Tantipongpipat 📝 초록 (Abstract) 우리는 동적으로 성장하는 데이터베이스의 적응적 분석을 위한 미분 사생활 보호 알고리즘 설계를 연구합니다. 여기서 데이 …

Data Structures Databases Data Computer Science
No Image

빅 데이터 구조 특성화에서 필요한 표본 수를 결정하는 새로운 접근방식: 차분 메시지 중요도 측정

📝 원문 정보 Title: Differential Message Importance Measure: A New Approach to the Required Sampling Number in Big Data Structure Characterization ArXiv ID: 1801.07083 발행일: 2018-01-23 저자: Shanyun Liu, Rui She and Pingyi Fan 📝 초록 (Abstract) 빅데이터 시나리오에서 데이터 …

Statistics Numerical Analysis Computer Science Data Information Theory Mathematics
빅데이터와 고성능 컴퓨팅 로그 분석의 만남: 극한 규모에서 시스템 이해를 위한 확장 가능 접근법

빅데이터와 고성능 컴퓨팅 로그 분석의 만남: 극한 규모에서 시스템 이해를 위한 확장 가능 접근법

📝 원문 정보 Title: Big Data Meets HPC Log Analytics: Scalable Approach to Understanding Systems at Extreme Scale ArXiv ID: 1708.06884 발행일: 2017-08-24 저자: Byung H. Park, Saurabh Hukerikar, Ryan Adamson, Christian Engelmann 📝 초록 (Abstract) 현재의 고성능 컴퓨팅(HPC) …

Computer Science Databases Data System Distributed Computing
사이버물리 시스템을 스테인레스 데이터 주입 공격으로부터 보호하기 위한 코딩 방안

사이버물리 시스템을 스테인레스 데이터 주입 공격으로부터 보호하기 위한 코딩 방안

📝 원문 정보 Title: Coding Schemes for Securing Cyber-Physical Systems Against Stealthy Data Injection Attacks ArXiv ID: 1605.08962 발행일: 2016-11-17 저자: Fei Miao, Quanyan Zhu, Miroslav Pajic, George J. Pappas 📝 초록 (Abstract) 이 논문은 지능적인 공격자가 시스템 파라미터를 알고 있을 …

Systems and Control Computer Science Cryptography and Security Data System
대규모 고차원 데이터를 위한 효율적인 시각화 기법

대규모 고차원 데이터를 위한 효율적인 시각화 기법

📝 원문 정보 Title: Visualizing Large-scale and High-dimensional Data ArXiv ID: 1602.00370 발행일: 2016-04-06 저자: Jian Tang, Jingzhou Liu, Ming Zhang and Qiaozhu Mei 📝 초록 (Abstract) 본 연구는 고차원 데이터를 저차원(주로 2D 또는 3D) 공간에 시각화하는 문제를 다룬다. 최근 데이터 포인트 간 유사도 구조를 먼저 계 …

Data Machine Learning Computer Science HCI

< 분야별 논문 현황 (Total: 1373) >

General
757
MATH-PH
1
Nonlinear Sciences
3
Quantitative Biology
4
Quantum Physics
6

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키