Information Retrieval

'Information Retrieval' 카테고리의 모든 글

총 13개의 글
시간순 정렬
No Image

_chatGPT의 추천에서 다양성, 신선함 및 인기 편향 탐색

ChatGPT는 다양한 분야에서 능력을 보여주는 다재다능한 도구로 부상하고 있다. 이러한 성공에 따라 추천 시스템(RS) 커뮤니티에서는 주로 정확도에 초점을 맞추고 ChatGPT의 추천 시나리오 내 적용을 조사하기 시작했다. ChatGPT가 RS에 통합되면서 많은 관심을 받았지만, 다양한 차원에서의 성능에 대한 포괄적인 분석은 아직 충분히 이루어지지 않았다. 특히 다각도의 다양성과 새로운 추천 제공 능력, 인기도 편향 가능성 등이 철저하게 검토되지 않은 상태이다. 이러한 모델의 사용이 계속 확대됨에 따라 이러한 측면을 이해하는 것은 사용자 만족도를 높이고 장기적인 개인화를 달성하는 데 중요하다. 본 연구는 ChatGPT-3.5와 ChatGPT-4가 제공하는 추천을 분석하여 다양성, 신규성 및 인기도 편향 측면에서 ChatGPT의 능력을 평가한다. 세 가지 다른 데이터셋에서 이 모델들을 평가하고 상위 N개 추천과 냉기 시작 시나리오에서의 성능을 분석한다. 결과는 ChatGPT-4가 전통적인 추천자들과 맞먹거나 그 이상으로, 추천에서 신규성과 다양성을 균형 있게 유지할 수 있음을 보여준다. 또한 냉기 시작 시나리오에서는 ChatGPT 모델들이 정확도와 신규성 측면에서 우수한 성능을 나타내어 새 사용자에게 특히 유익하다는 것을 나타낸다. 이 연구는 ChatGPT의 추천에 대한 강점과 한계를 강조하고, 정확도 중심 지표를 넘어 이러한 모델들이 제공할 수 있는 추천 능력을 재해석한다.

paper AI 요약
MACA  신뢰할 수 있는 대형 언어 모델을 효율적인 검색기로 추출하는 프레임워크

MACA 신뢰할 수 있는 대형 언어 모델을 효율적인 검색기로 추출하는 프레임워크

현대 기업 검색 시스템은 정확성과 지연 시간 사이의 균형을 유지하면서 해외 거래 수수료 환불 이나 최근 통장 상태 와 같은 부분적으로 명시된 사용자 질의를 처리해야 합니다. 이러한 질의는 주제, 하위 주제, 의도 또는 엔티티에 대한 중요한 세부 사항을 생략하는 경향이 있어 여러 후보 답변이 가능하게 됩니다. 이 논문에서는 메타데이터에 민감한 검색기인 MACA를 제안하며, 이를 통해 LLM 호출 없이 정확성과 지연 시간 간의 균형을 맞춥니다.

paper AI 요약
MergeRec  Model Merging for Data-Isolated Cross-Domain Sequential Recommendation

MergeRec Model Merging for Data-Isolated Cross-Domain Sequential Recommendation

현대의 추천 시스템은 도메인별 데이터를 기반으로 학습되지만, 여러 도메인 간에 일반화하는 데 어려움을 겪는다. 도메인 간 순차적 추천은 이러한 문제점을 해결하기 위한 유망한 연구 방향으로 부상했지만, 기존 접근법들은 도메인 간 중복 사용자나 항목의존성 또는 프라이버시 제약을 무시하는 비현실적인 가정과 같은 근본적인 한계를 가지고 있다. 본 논문에서는 새로운 문제 설정인 데이터 고립된 도메인 간 순차적 추천 하에서 모델 합병에 기반한 새 프레임워크, MergeRec을 제안한다. 이 설정에서는 원시 사용자 상호작용 데이터가 도메인 간 공유되지 않는다. MergeRec은 세 가지 주요 구성 요소로 이루어져 있다 (1) 합병 초기화, (2) 가상 사용자 데이터 생성, (3) 공동 합병 최적화. 먼저, 우리는 트레이닝 없는 합병 기법을 통해 합병 모델을 초기화한다. 그다음으로 각 도메인에서 항목별로 가상 시퀀스를 만들어 실제 사용자 상호작용에 의존하지 않고 의미 있는 훈련 샘플을 생성한다. 마지막으로, 우리는 추천 손실과 디스티ல레이션 손실을 결합한 공동 목표를 통해 도메인별 합병 가중치를 최적화한다. 이 두 가지 손실은 각각 합병 모델이 관련 항목을 식별하도록 유도하고, 조정된 소스 모델에서 협업 필터링 신호를 전달한다. 광범위한 실험 결과 MergeRec은 원래 모델들의 강점을 유지하면서 새로운 도메인에 대한 일반화 능력을 크게 향상시킨다. 기존의 모델 합병 방법들과 비교했을 때, MergeRec은 평균적으로 Recall@10에서 최대 17.21%까지 개선되는 우수한 성능을 일관되게 보여주어, 모델 합병이 대규모 추천 시스템 구축에 효과적인 접근법임을 입증한다. 소스 코드는 https //github.com/DIALLab-SKKU/MergeRec에서 이용 가능하다.

paper AI 요약
ScienceDB AI  대규모 과학 데이터 공유 서비스를 위한 LLM 기반 에이전트 추천 시스템

ScienceDB AI 대규모 과학 데이터 공유 서비스를 위한 LLM 기반 에이전트 추천 시스템

과학기술용 AI(Science4AI)의 급속한 성장은 과학 데이터셋의 중요성을 부각시켰고, 그 결과 많은 국가적 수준의 과학 데이터 센터와 공유 플랫폼이 설립되었습니다. 그러나 이러한 발전에도 불구하고, 과학 연구를 위한 데이터셋의 효율적인 공유와 활용을 촉진하는 것은 여전히 어려운 문제입니다. 과학 데이터셋은 복잡한 도메인 특화된 지식과 맥락을 포함하고 있어, 기존의 협업 필터링 기반 추천 시스템이 적합하지 않습니다. 대형 언어 모델(LLMs)의 최근 발전은 깊은 의미 이해와 개인화된 추천이 가능한 대화형 에이전트 구축에 대한 전례 없는 기회를 제공합니다. 이에 따라 우리는 과학데이터뱅크(ScienceDB), 세계 최대 규모의 과학 데이터 공유 플랫폼 중 하나에서 개발한 새로운 LLM 기반 에이전트 추천 시스템인 ScienceDB AI를 소개합니다. ScienceDB AI는 자연어 대화와 깊은 추론을 활용하여 연구자의 과학적 의도와 변화하는 요구사항에 맞춘 데이터셋을 정확하게 추천합니다. 이 시스템은 다음과 같은 혁신들을 도입하고 있습니다 복잡한 쿼리에서 구조화된 실험 요소를 추출하는 Scientific Intention Perceptor, 다중 회차 대화를 효과적으로 관리하는 Structured Memory Compressor, 신뢰성 있는 검색 강화 생성(Trustworthy RAG) 프레임워크입니다. Trustworthy RAG는 두 단계의 검색 메커니즘을 사용하고 Citable Scientific Task Record(CSTR) 식별자를 통해 인용 가능한 데이터셋 참조를 제공하여 추천의 신뢰성과 재현성을 향상시킵니다. 과학적 연구에 활용되는 1,000만 개 이상의 실제 데이터셋을 사용한 광범위한 오프라인 및 온라인 실험을 통해 ScienceDB AI는 중대한 효과를 입증했습니다. 우리의 지식으로는, ScienceDB AI가 대규모 과학적 데이터셋 공유 서비스에 특화된 첫 번째 LLM 기반 대화형 추천 시스템입니다. 이 플랫폼은 다음 링크에서 공개적으로 이용 가능합니다 https //ai.scidb.cn/en.

paper AI 요약
계층적 계획과 다목적 선호도 정렬을 통한 효율적인 생성 슬래트 추천 HIgr

계층적 계획과 다목적 선호도 정렬을 통한 효율적인 생성 슬래트 추천 HIgr

본 논문은 계층적 생성 슬레이트 추천 프레임워크인 HiGR을 제안한다. HiGR은 대규모 온라인 서비스에서 사용자 경험의 핵심 요소로 작용하는 슬레이트 추천 문제를 해결하기 위해 설계되었다. 기존 방법론이 효율적이지만 항목 수준 목표만 최적화하고 전체 리스트 품질을 무시하는 반면, HiGR은 생성 모델과 대조 학습을 통한 계층적 구조화된 아이디를 통해 슬레이트의 글로벌 구조와 세부 항목 선택 사이에서 효율적인 추론을 가능하게 한다.

paper AI 요약
맨리폴드 일관 그래프 인덱싱  대용량 벡터 검색의 새로운 지평

맨리폴드 일관 그래프 인덱싱 대용량 벡터 검색의 새로운 지평

대형 언어 모델(LLMs)의 등장은 정보 검색과 지식 관리의 풍경을 근본적으로 변화시켰습니다. LLMs의 내재적 한계를 해결하기 위해 RAG(Retrieval-Augmented Generation)가 중요한 아키텍처 패러다임으로 떠올랐습니다. 이는 실시간으로 대규모 코퍼스에서 의미론적으로 관련된 컨텍스트를 검색하는 능력에 크게 의존합니다. 이 종속성은 근사 최근접 이웃 탐색(ANNS)을 현대 데이터 인프라의 핵심으로 자리매김하게 만들었고, 엄격한 생산 제약 하에서 백억 개 포인트 데이터셋까지 확장 가능한 벡터 인덱스를 요구합니다. 최첨단 ANNS 솔루션은 주로 그래프 기반 인덱스에 집중되었으며, DiskANN(Vamana)는 SSD 주재 로드의 대표적인 예입니다. 이 알고리즘들은 일반적으로 거리 그래프에서 탐색 경로를 그리디 라우팅을 통해 네트워크의 출발 지점에서 쿼리 목표까지 이동합니다. 이러한 방법은 SIFT1M과 같은 표준 벤치마크에서 우수한 성능을 보이지만, GIST1M과 같이 고차원 공간에서는 효율성이 크게 떨어집니다. 이를 차원의 저주로 설명하며, 유클리드 최단 경로가 데이터 맨입OLD 위의 기하학적 경로와 일치하지 않게 됩니다. 이 현상을 우리는 *유클리드-기하학적 불일치*라고 부릅니다. 우리의 핵심 통찰은 고차원 실제 데이터가 균일하게 분포되지 않는다는 것입니다. 대신, 그것은 일반적으로 맨입OLD 가설에 따라 임베딩된 하위 차원 구조 위에 존재합니다. 따라서 검색 난이도는 데이터셋 전체에서 균일하지 않고 지역적 내재 차원(LID)에 의해 조정됩니다. 우리는 이 문제를 해결하기 위해 Manifold-Consistent Graph Indexing(MCGI), 즉 기하학을 인식하는 디스크 기반 인덱싱 아키텍처를 제안합니다. LID 추정을 라우팅 로직에 통합함으로써 MCGI는 데이터의 지역적인 위상에 따라 탐색 전략을 조정할 수 있습니다.

paper AI 요약
모델이 데이터를 외웠는지 알아내는 방법은?

모델이 데이터를 외웠는지 알아내는 방법은?

이 논문에서는 대형 언어 모델(LLMs)의 데이터 기억 문제를 다루며, 특히 추천 시스템에서 사용되는 MovieLens-1M 데이터셋을 통해 LLMs가 얼마나 많은 훈련 데이터를 기억하는지 탐색합니다. 우리는 수동 프롬프팅, 무감독 잠재 지식 발견, 자동 프롬프트 엔지니어링 세 가지 접근 방법을 사용하여 이 문제를 해결하고자 합니다.

paper AI 요약
인간과 동조된 LLM 에이전트를 통한 추천시스템 평가을 위한 월드 모델 적용

인간과 동조된 LLM 에이전트를 통한 추천시스템 평가을 위한 월드 모델 적용

추천 시스템을 평가하는 것은 오프라인 지표와 실제 사용자 행동 사이의 간극, 그리고 상호작용 데이터의 부족으로 인해 여전히 어려움이 있습니다. 최근 연구에서는 대규모 언어 모델(LLM) 에이전트를 합성 사용자로 활용하는 것을 탐색하고 있지만, 이들은 일반적으로 few-shot 프롬프팅에 의존하여 환경을 얕게 이해하게 되고, 이는 실제 사용자의 행동을 충실하게 재현할 수 있는 능력을 제한합니다. 저희는 AlignUSER라는 프레임워크를 소개하며, 이를 통해 인간의 상호작용에서 월드 모델 구동 에이전트를 학습하고 있습니다. 액션과 상태의 롤아웃 시퀀스가 주어지면, 저희는 다음 상태 예측 작업으로 월드 모델링을 형식화하여 에이전트가 환경을 내재화할 수 있도록 합니다. 인간의 개성과 행동을 일치시키기 위해, 저희는 데모 주변에 가상 경로를 생성하고 LLM에 대해 그 결정을 인간의 선택과 비교하도록 하여 비효율적인 행동을 식별하고 교훈을 추출합니다. 학습된 정책은 이후 추천 시스템과의 에이전트 상호작용을 주도하는 데 사용됩니다. 저희는 AlignUSER를 다양한 데이터셋에 걸쳐 평가하였으며, 미시 및 거시 수준에서 이전 연구보다 실제 인간에게 더 가깝게 맞춰졌음을 입증하였습니다.

paper AI 요약
주제 풍부한 임베딩을 통합한 복합적 접근법으로 검색 강화 생성 개선

주제 풍부한 임베딩을 통합한 복합적 접근법으로 검색 강화 생성 개선

(이 논문은 주제-강화 임베딩 방법을 제안하고, 이를 통해 복잡한 데이터셋에서의 문서 클러스터링과 검색 정밀도를 향상시키는 데 초점을 맞춥니다. 이 접근 방식은 기존 통계적 모델과 확률적 주제 모델링을 현대적인 문맥 임베딩과 통합하여, 로컬 및 글로벌 의미 특성을 동시에 포착합니다.)

paper AI 요약
질의-문서 밀집 벡터를 활용한 LLM 관련성 판단 편향 분석

질의-문서 밀집 벡터를 활용한 LLM 관련성 판단 편향 분석

(본 논문은 대형 언어 모델(LLM)의 관련성 판단에서 숨겨진 편향을 진단하고 투명성을 높이기 위한 프레임워크를 제안합니다. 이 연구는 쿼리와 문서의 조합(Q-D 쌍)을 밀집 벡터로 임베딩하여 공유 의미 공간에서 클러스터링하는 방법론을 사용합니다. 이러한 접근법은 전역 통계를 넘어서, 특정 의미적 컨텍스트 내에서 인간과 LLM 사이의 판단 불일치를 분석할 수 있게 합니다.)

paper AI 요약
혁신의 눈  오픈노벨티

혁신의 눈 오픈노벨티

최근 몇 년 동안 학술 출판물이 급증하고 있다. 인공지능 분야만 보더라도 arXiv의 `cs.AI`와 `cs.LG` 카테고리에 매년 수만 편의 새로운 논문이 게재되고 있으며, NeurIPS, ICLR, ICML과 같은 상위 컨퍼런스로 제출되는 논문 수도 기록적인 수준을 보이고 있다. 이 출판 폭발 은 피어 리뷰 시스템에 전례 없는 압력을 가하고 있다. 리뷰어의 부담이 크게 증가했다. 한 명의 리뷰어는 한정된 시간 내에 여러 편의 논문을 평가해야 하는데, 각 리뷰에는 해당 분야의 최신 연구를 포괄적으로 이해하는 것이 요구된다. 하지만 현실은 달라서 많은 리뷰어들이 모든 제출 논문에 대한 철저하고 공정한 평가를 하지 못한다. 심지어 일부 리뷰어는 전체 텍스트를 신중하게 읽지 않고 피드백을 제공하기도 한다. 또한 학계에서는 AI 생성된 피드백을 적절히 검증하지 않고 사용하는 문제에 대해 점점 더 우려하고 있다. 평가 차원 중 하나인 **신규성**은 논문의 수용 여부를 결정하는 중요한 요소로 여겨진다. 그러나 신규성을 정확하게 평가하기는 어렵다. 이는 문헌 규모가 매우 크고, 세밀한 분석을 통해 주장을 검증하는 것이 어려우며, 리뷰어들의 판단에 주관성이 있기 때문이다. 대형 언어 모델(LLM)은 학술 논문 검토를 돕는 유망한 방향으로 부상하고 있지만, 기존 방법에는 한계가 있다 단순 LLM 기반 접근법은 매개변수적 지식에만 의존하면 존재하지 않는 참조를 생성할 수 있으며; 기존의 RAG 기반 방법은 제목과 초록만 비교하기 때문에 중요한 기술 세부 사항을 놓칠 수 있고; 대부분의 접근법은 문맥 창의 한계로 인해 관련 작업을 체계적으로 조직하지 못한다. 이러한 문제를 해결하기 위해 **<span class= smallcaps >OpenNovelty</span>**라는 LLM 기반 시스템을 제안한다. 이 시스템은 대규모 제출물에 대한 투명하고 검증 가능한 신규성 분석을 제공하도록 설계되었다. <span class= smallcaps >OpenNovelty</span>의 핵심 디자인 철학은 ** 신규성을 검증할 수 있게 하기 **이다 > *“우리는 LLM 내부의 매개변수적 지식에 의존하지 않고, 실제 논문을 찾아 신규성 주장 수준에서 전체 텍스트를 비교함으로써 모든 판단이 증거 기반임을 보장합니다.”* <span class= smallcaps >OpenNovelty</span>은 네 단계의 프레임워크를 통해 작동한다 - **Phase I 정보 추출** — 대상 논문에서 핵심 작업과 주장한 신규성 주장을 추출하고, 이후 검색을 위한 의미적 쿼리를 생성합니다. - **Phase II 논문 검색** — 추출된 쿼리 기반으로 <span class= smallcaps >Wispaper</span>을 사용하여 관련 이전 작업을 검색하고 다층 필터링을 통해 고질량 후보를 선택합니다. - **Phase III 분석 및 종합** — 추출한 주장과 검색된 논문을 기반으로 상위 구조의 관련 작업 세분화를 구성하고 전체 텍스트 비교를 수행하여 각 신규성 주장을 검증합니다. - **Phase IV 보고서 생성** — 모든 분석 결과를 명확한 인용 및 증거 조각과 함께 구조화된 신규성 보고서로 종합하며, 모든 판단이 검증 가능하고 추적 가능하도록 합니다. 각 단계의 기술적 세부 사항은 Section 2에서 제공됩니다. 또한 우리는 <span class= smallcaps >OpenNovelty</span>을 ICLR 2026에 제출된 500개 이상의 논문 분석에 배포했으며, 모든 신규성 보고서는 우리 웹사이트에서 공개적으로 이용 가능합니다. 예비 분석 결과 시스템이 관련 이전 작업, 특히 저자들이 놓칠 수 있는 유사한 논문을 식별할 수 있음을 나타냅니다. 우리는 이후 단계에서 이 분석을 2,000개 이상의 제출물로 확장할 계획입니다. 주요 기여는 다음과 같습니다 - 모든 평가를 추출된 실제 논문에 근거하며, 각 판단은 명확한 인용과 증거 조각으로 보완되어 단순 LLM 기반 접근법에서 발생하는 환영 문제를 효과적으로 피한다. - <span class= smallcaps >OpenNovelty</span>을 ICLR 2026에 제출된 논문 500개 이상에 배포하고, 모든 보고서를 우리 웹사이트에 공개하여 연구 커뮤니티에게 접근 가능한 투명한 신규성 분석을 제공한다.

paper AI 요약

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키