스프레드시트 합성을 위한 플랫폼
초록
본 논문은 분산된 환경에서 여러 사용자가 엑셀 파일을 이용해 데이터를 공유·통합할 때 발생하는 복제·링크 손상·버전 관리 문제를 해결하기 위해 DISCOM이라는 클라이언트‑서버 기반 플랫폼을 제안한다. 플러그인 형태의 클라이언트가 엑셀에 삽입되어 셀 범위를 자동으로 내보내고, 서버가 중앙 저장소와 데이터 전파 엔진을 제공함으로써 실시간 동기화와 오프라인 상황에서도 데이터 일관성을 유지한다. 또한 사용자·공간 개념을 도입해 접근 권한을 세밀히 제어한다.
상세 분석
이 논문은 기업 내에서 스프레드시트를 활용한 데이터 처리 과정에서 나타나는 주요 위험 요소—복사‑붙여넣기 오류, 교차‑스프레드시트 링크 파손, 버전 관리 부재—를 체계적으로 분석하고, 이를 최소화하기 위한 기술적 접근법을 제시한다. 핵심 아이디어는 기존 엑셀 사용 방식을 그대로 유지하면서도 중앙 집중형 서비스인 DISCOM 플랫폼을 통해 데이터 흐름을 자동화하는 것이다.
플러그인 구조는 C#와 Visual Studio Tools for Office를 이용해 Excel 2003·2007 버전에 맞게 구현되었으며, 사용자는 플러그인 UI를 통해 내보낼 셀 범위와 가져올 범위를 지정한다. 지정된 범위는 XML 형태로 변환되어 SOAP 기반 웹 서비스 호출을 통해 서버에 전송된다. 서버는 Java와 Spring 프레임워크로 구축되었고, MySQL 데이터베이스에 셀 데이터와 메타 정보를 저장한다. 데이터 전파는 두 단계로 이루어진다. 첫째, 내보내는 클라이언트가 주기적으로 셀 변화를 감지해 서버에 업데이트한다. 둘째, 가져오는 클라이언트는 서버를 폴링하여 최신 데이터를 받아 엑셀에 반영한다.
중간 스프레드시트(Intermediate Spreadsheet) 개념은 특히 중요한데, 이는 A→B→C와 같은 체인에서 B가 동시에 수입·수출 역할을 할 때 발생한다. 중간 스프레드시트가 오프라인이면 체인 전체의 데이터 흐름이 차단될 위험이 있다. 이를 해결하기 위해 DISCOM은 중간 스프레드시트를 서버에 전체 파일 형태로 업로드하고, 서버 측에서 Apache POI를 이용해 수식 재계산 및 내보내기 범위 재생성을 수행한다. 이렇게 하면 중간 노드가 오프라인이어도 A의 변경이 C에 전달된다.
접근 제어는 ‘Space’라는 논리적 그룹을 통해 구현된다. Space는 생성자와 여러 수출·수입 사용자를 포함하며, 데이터 가시성을 전체 사용자 혹은 일부 사용자로 제한할 수 있다. 이는 기업의 계층 구조와 부서별 권한 정책을 반영한다.
배포 모델은 두 가지 옵션을 제공한다. 첫째, 기업 내부에 전용 서버를 설치해 보안·규제 요구를 충족한다. 둘째, Amazon EC2와 같은 IaaS 환경에 AMI 형태로 배포해 초기 설정 비용과 유지보수를 최소화한다.
기능적 측면에서 DISCOM은 기존 엑셀 워크플로우를 크게 변경하지 않으면서도 자동 동기화, 오프라인 지원, 세밀한 권한 관리, 실시간 데이터 전파라는 장점을 제공한다. 그러나 구현상의 제약도 존재한다. 현재 플러그인은 Windows‑Excel에만 국한되며, 대규모 데이터셋에 대한 전송·저장 비용이 증가할 수 있다. 또한 SOAP 기반 통신은 최신 RESTful API에 비해 오버헤드가 크다. 향후 연구에서는 웹 기반 스프레드시트와의 연동, 클라우드 네이티브 마이크로서비스 아키텍처 도입, 그리고 대용량 데이터 압축·스트리밍 기법을 탐색할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기