연관 배열로 보는 통합 데이터베이스 모델

연관 배열로 보는 통합 데이터베이스 모델
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 SQL, NoSQL, NewSQL 데이터베이스를 연관 배열이라는 수학적 구조로 통합 모델링한다. 관계형 모델을 연관 배열로 표현하고, 연산의 결합성·교환성·분배성·항등원·소거원·역원 등 핵심 대수적 성질을 보존함을 증명한다. 또한 분배성과 결합성에 대한 성능 실험을 통해 폴리스토어 환경에서 데이터 교환 및 쿼리 최적화에 활용 가능함을 보여준다.

상세 분석

연관 배열은 행과 열이 각각 키 집합으로 구성된 2차원 사전 구조이며, 값은 일반적인 반정수 혹은 복소수까지 확장될 수 있다. 논문은 이 구조를 이용해 전통적인 관계형 테이블을 ‘키‑키‑값’ 삼중항 형태로 변환한다. 즉, 각 튜플은 (행키, 열키, 값)으로 표현되며, 행키는 기본키 혹은 복합키, 열키는 속성명을 의미한다. 이러한 표현은 관계 연산인 선택(σ), 투사(π), 조인(⨝) 등을 연관 배열의 기본 연산인 행/열 교환, 행/열 합성, 행/열 필터링으로 재구성한다. 특히 조인은 두 연관 배열의 행키와 열키를 매칭시켜 새로운 배열을 생성하는 과정으로, 행렬 곱셈과 유사한 구조를 가진다.

핵심 대수적 성질을 검증하기 위해 저자는 연관 배열 연산이 결합법칙(a∘b)∘c = a∘(b∘c)와 교환법칙a∘b = b∘a를 만족함을 수학적으로 증명한다. 여기서 ∘는 배열 합성(덧셈) 혹은 교차곱(곱셈) 연산을 의미한다. 또한 분배법칙 a∘(b⊕c) = (a∘b)⊕(a∘c)와 항등원(0 배열), 소거원(∞ 배열), 역원(−a) 존재를 보이며, 이는 관계형 데이터베이스가 지원하는 집합 연산과 완전히 일치한다.

성능 실험에서는 대규모 랜덤 테이블을 연관 배열로 변환한 뒤, 결합성 및 분배성에 기반한 연산 재배치를 적용하였다. 결과는 연산 순서를 최적화함으로써 메모리 접근 패턴을 개선하고, 특히 조인 연산에서 데이터 스키밍 비용을 30 % 이상 감소시켰다. 이는 폴리스토어 환경에서 서로 다른 백엔드(예: PostgreSQL, Cassandra, SciDB) 간 데이터 이동 시 연산 재배치가 실질적인 응답 시간 단축으로 이어짐을 시사한다.

마지막으로 저자는 연관 배열이 SQL의 집합론적 기반, NoSQL의 그래프/키‑값 모델, NewSQL의 행렬 연산을 모두 포괄하는 공통 수학적 언어가 될 수 있음을 주장한다. 이를 통해 다중 데이터베이스를 하나의 추상화 계층 아래 통합 관리하고, 쿼리 플래너가 대수적 성질을 활용해 최적 실행 계획을 자동 생성하도록 지원할 수 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기