대규모 이분 그래프를 위한 효율적인 비트러스 분해
읽는 시간: 5 분
...
📝 원문 정보
- Title: Efficient Bitruss Decomposition for Large-scale Bipartite Graphs
- ArXiv ID: 2001.06111
- 발행일: 2020-01-20
- 저자: Kai Wang, Xuemin Lin, Lu Qin, Wenjie Zhang, Ying Zhang
📝 초록 (Abstract)
집합 그래프 내의 밀집된 하위 그래프 탐색은 최근 인기 있는 연구 주제가 되었습니다. 여기서 `k`-비트러스는 각 변이 적어도 k개의 버터플라이(즉, (2, 2)-빅리크)를 포함하는 최대 밀집된 하위 그래프입니다. 본 논문에서는 모든 `k >= 0`에 대해 `k`-비트러스를 찾는 비트러스 분해 문제를 연구합니다. 기존의 하향식 접근법은 가장 낮은 버터플라이 지원을 가진 변들을 반복적으로 제거하는 과정에서 시간이 많이 소요됩니다. 이를 해결하기 위해, 우리는 새로운 온라인 인덱스인 BE-Index를 제안하며, 이는 버터플라이를 `k`-블룸(즉, (2, k)-빅리크)으로 압축합니다. BE-Index를 기반으로 새로운 비트러스 분해 알고리즘인 BiT-BU와 두 가지 배치 기반 최적화 방법을 제안하여 피eling 과정에서 버터플라이 열거를 효율적으로 수행할 수 있습니다. 또한, 고 버터플라이 지원 변들을 처리하는 데 더 효과적인 BiT-PC 알고리즘이 개발되었습니다. 이 논문은 새로운 알고리즘들이 기존 알고리즘의 시간 복잡도를 크게 줄인다는 것을 증명하며, 실제 데이터셋에 대한 실험 결과는 우리의 새로운 기법이 최고 수준의 기술보다 두 배 이상 빠르게 처리할 수 있음을 보여줍니다.💡 논문 핵심 해설 (Deep Analysis)
This paper introduces a new algorithm to efficiently solve the `k`-bitruss decomposition problem in large-scale bipartite graphs. A bitruss is a cohesive subgraph where each edge participates in at least k butterflies (2x2 bicliques). The existing algorithms for this problem are time-consuming, particularly due to their inefficiency in enumerating butterflies during the peeling process. To address these issues, the authors propose BE-Index, an online index that compresses butterflies into `k`-blooms (2xk bicliques), and use it in a new algorithm called BiT-BU. They also introduce BiT-PC for more efficient handling of edges with high butterfly supports. The results show significant improvements over existing methods, with the proposed algorithms being up to two orders of magnitude faster on real datasets like `Wiki-it` (10^7 edges), where they can solve the bitruss decomposition problem within 20 minutes compared to more than 30 hours for state-of-the-art techniques. This research provides a new methodological framework for efficient cohesive subgraph mining in bipartite graphs, which is useful for applications such as social media analysis and recommendation systems.📄 논문 본문 발췌 (Translation)
Reference
이 글은 ArXiv의 공개 자료를 바탕으로 AI가 자동 번역 및 요약한 내용입니다.
저작권은 원저자에게 있으며, 인류 지식 발전에 기여한 연구자분들께 감사드립니다.