지리 공간 데이터베이스란 무엇인가요?

2022년 2월 10일

지리공간 데이터베이스의 정의

'지리공간(geospatial)'이란 모든 사건, 특징, 개체 등을 특정 위치와 연결하고 해당 정보를 다양한 애플리케이션에 활용하기 위한 지도, 이미지, 데이터 세트, 도구, 절차와 같은 상호 의존적 리소스들을 통칭하는 표현입니다. 위치를 간단히 이해하기 위해서는 관련 데이터를 반드시 좌표계의 위치, 지명, 도로 주소와 같은 표준 매개변수를 사용해 표현해야 합니다.


지리공간 데이터베이스는 벡터 데이터 및 래스터 데이터와 같이 기하학적 공간에서 정의된 객체를 나타내는 데이터의 저장 및 쿼리에 최적화되어 있습니다. 지리공간 데이터베이스는 기하급수적으로 증가하는, 방대하고 복잡하며 이질적인 공간 데이터를 분석하기 위한 최상의 관리 용이성과 보안을 제공합니다.

지리공간 데이터베이스 플랫폼은 복잡한 지리공간 데이터에 필요한 전문적인 관리, 처리, 분석 엔진을 제공합니다. 이러한 시스템적 확장성 및 성능은 개발 및 통합 지원과 더불어 성공적인 지리공간 데이터 활용을 위한 두 가지 핵심 요소입니다.

지리공간 데이터베이스 플랫폼은 Open Geospatial Consortium(OGC)이 정의한 상호운용성 표준들을 지원합니다. OGC는 벡터 데이터용 Web Feature Services(WFS), 래스터 데이터용 Web Coverage Service(WCS), 분산된 지리공간 데이터 애플리케이션 및 서비스를 찾고 관리하고 유지하는 데 사용되는 Catalog Services(CSW) 등의 통합 프레임워크와 웹 서비스를 제공합니다.

Geographical Information System(GIS)은 지리공간 데이터를 편집하고 유지 관리하기 위해 지리공간 데이터베이스 위에 구축된 도구입니다. GIS는 시각적 및 논리적으로 중첩 가능한 레이어로 구성된 지리공간 객체를 지원합니다.

지리공간 분석은 지리적 관계에 기반한 복잡한 상호작용을 이해하고, 사람, 자산, 자원의 위치에 기반한 질문에 답하기 위한 작업입니다. 사용자는 지리공간 인사이트를 활용해 고객 서비스 개선, 인력 최적화, 유통 센터 위치 선정, 자산 관리, 상황 분석 수행, 영업 및 마케팅 캠페인 평가 등의 다양한 과업의 성과를 향상시킬 수 있습니다.


그림 1. 복잡한 지리공간 데이터의 다양한 계층 및 유형
그림 1. 복잡한 지리공간 데이터의 다양한 계층 및 유형

지리공간 데이터의 기초

'지리공간 데이터'는 지표면, 나아가 우주 공간에 존재하는 특징, 객체, 분류에 관한 정보를 의미합니다. 지리공간 데이터는 일반적으로 규모가 크고 복잡한 데이터 유형들로 저장되며 특수한 인덱싱, 쿼리, 처리, 분석 알고리즘 등이 필요합니다.

지리공간 데이터는 다음과 같은 데이터를 포괄합니다.

  • 점, 선, 다각형과 같은 단순한 2D 및 3D 벡터 기하학적 객체
  • 이미지 및 그리드 데이터와 같은 복잡한 래스터 데이터

지리공간 데이터는 기하학적 정보와 해당 정보를 지도상에 표현한 '속성(attributes)'으로 구성됩니다. 기하학적 정보로는 점, 선, 다각형 및 해당 요소들의 집합이 있습니다.

  • 점은 속성 테이블이 첨부된 위치 좌표로서, 주거지, 매장 위치, 휴대폰 위치 등을 나타낼 수 있습니다.
  • 선은 시작점, 끝점, 그리고 곡선의 경우 여러 중간점과 속성 테이블을 가집니다. 내비게이션 시스템은 연결된 선들과 교차로의 속도 제한 및 대기 시간 정보 노드들을 사용해 도로망을 표현할 수 있습니다.
  • 다각형(polygons)은 속성 테이블이 포함된 선들로 경계가 설정된 면적 단위입니다.

이러한 기하학적 정보들은 색상, 선 두께와 같은 지도 제작용(표시용) 속성과 인구(다각형 내부), 또는 측정, 스케일링 등이 가능한 항목과 같은 그 외의 속성을 가질 수 있습니다.

기하학적 데이터 및 속성 데이터는 Oracle의 공간 데이터베이스와 같은 관계형 데이터베이스 관리 시스템을 통해 서로 연결됩니다. Oracle의 데이터베이스 관리 시스템은 최고의 성능, 확장성, 보안성을 바탕으로 가장 까다로운 지리 공간 프로세스들을 지원합니다. 또한 다른 GIS 및 비GIS 애플리케이션과의 손쉬운 통합을 제공해 개발 노력을 줄여줍니다.

그림 2. 점, 선, 네트워크, 다각형 벡터 데이터의 예시(© 2022 Oracle Corporation; 맵 데이터 © 2020 HERE)

지리 공간 래스터 데이터는 Landsat 위성의 향상된 Thematic Mapper(ETM+) 센서에서 수집된 복잡한 정보 집합으로서 빛, 적외선 반사율 값 및 그 그리드 내 위치를 기록합니다. 색상, 디지털 혁신 모델의 고도 및 여러 변수 등의 위치 데이터가 모든 그리드 셀에 첨부됩니다. 주제별 지도, 수치 표고 모델/수치 지표 모델(DEM/DSM), 원격 탐사(RS) 이미지, 사진 측량 사진, 스캐닝된 지도, 지구 물리학적 이미지, 지질학적 지도 등이 그 예입니다.

래스터 데이터 유형은 크기가 크며 벡터 데이터 유형과 데이터 구조가 매우 다릅니다. 래스터 데이터 세트는 매우 빠르게 증가할 수 있으므로 방대한 양의 지리 공간 정보를 관리하기 위해서는 Oracle의 공간 데이터베이스와 같은 데이터 관리 시스템이 필요합니다.

포인트 클라우드는 라이다(LiDAR) 애플리케이션에서 생성되는 복잡한 3차원 데이터 유형입니다. 각 포인트 클라우드는 3차원 형상이나 특징을 나타내는 대량의 데이터를 저장하기 위한 일종의 기하학적 구조입니다. 각 포인트에는 고유한 X, Y, Z 좌표 세트 및 다른 속성들이 할당됩니다. 포인트 클라우드는 주로 사진측량법이나 라이다 애플리케이션을 활용한 원격 탐사를 통해 만들어집니다.

그림 3. 래스터 데이터의 예시(왼쪽) 및 3D 데이터 시각화(오른쪽)(© 2022 Oracle Corporation; 맵 데이터 © 2020 HERE)

근본적으로 다른 유형의 데이터를 통합하는 것은 지리공간 데이터 분석의 핵심 과제 중 하나입니다. 지리 공간 데이터 분석을 위한 중요한 도구는 지도를 통한 데이터 시각화입니다. 지도는 일반적으로 원격 탐사 데이터를 바탕으로 작성됩니다. 들판, 숲 등의 대상이 다각형에 부여된 디지털 속성으로 변환된 뒤 적절한 색상으로 표시됩니다.

그림 4. 벡터 데이터 및 래스터 데이터의 표현

데이터 범주에는 다음과 같은 대상들이 포함되지만 이에 국한되지는 않습니다.

  • 행정 및 정치적 경계
  • 농업 및 농경
  • 대기 및 기후
  • 생물학 및 생태학
  • 비즈니스 및 경제학
  • 지적(地籍)
  • 문화, 사회, 인구 통계
  • 고도 및 파생 제품
  • 환경 및 보존
  • 시설 및 구조물
  • 지질 및 지구물리학
  • 인간의 건강과 질병
  • 이미지 및 기본 지도
  • 내륙 수자원
  • 위치 및 측지 네트워크
  • 군사
  • 해양 및 하구
  • 교통망
  • 유틸리티 및 통신

지리공간 데이터 사용 사례

초연결 사회인 오늘날 모든 사물은 글로벌 네트워크의 일부로서 디지털 발자국을 남기며, 위치 정보 및 위치 기반 정보는 분석, 관리, 행정, 거버넌스와 관련된 핵심적인 역할을 수행합니다. 위치 인텔리전스는 사건, 활동, 개인, 거리, 건물의 위치 파악을 지원하여 특정 대상의 위치를 추적하는 애플리케이션 개발을 가능케 합니다. 이는 민간 및 공공 기업에서 다음과 같이 다양한 용도로 폭넓게 활용됩니다.

  • 운영 및 청구
  • 부동산 및 자산 관리
  • 과세
  • 재난 및 비상 상황 관리
  • 시장 및 고객 분석
  • 관광 정보
  • 위험 관리(예시 참고)
  • 자산 추적 및 분석(예시 참고)
  • 텔레매틱스 및 차량 관리
  • 토지/환경 관리
  • 공중 보건 및 질병 발생(예시 참고)

지리 공간 데이터의 사용 사례가 가장 많은 산업

  • 리테일

    위치 인텔리전스를 활용한 표적 마케팅, 현장 계획, 실내 고객 흐름 등을 통하여 고객 경험을 개선합니다

  • 금융 서비스

    고객 위치 데이터 분석을 기반으로 위험 구역 및 기타 패턴을 발견하고, 해당 인텔리전스를 기반으로 고객별 맞춤식 오퍼를 제공합니다

  • 유틸리티

    모바일 네트워크 계획, 셀 타워 배치를 위한 유틸리티 시설 관리 등을 위한 워크플로 최적화 및 비용 절감

  • 보건의료

    환자 관리 계획 수립을 개선하고, 위치에 기반하여 질병 발병 패턴, 발병 근원지, 노출 내역, 환경 영향 등을 추적합니다

  • 통신

    가동 중단 사례를 효율적으로 분석하고 현장 서비스를 효과적으로 계획해 경쟁력 강화

  • 운송 및 물류

    철도 자산, 공항 자산, 항공 교통, 장거리 트럭 운송, 소화물 배송 등의 유지 관리를 위한 대량의 복잡한 이기종 공간 데이터를 처리하여 운영 효율성을 높입니다

  • 엔지니어링 및 건설

    건물 정보 모델링(BIM) 및 시설 관리용 GIS 및 CAD 시스템을 결합, 워크플로 연결, 데이터 사일로 제거, 위치 컨텍스트 제공 등을 통해 고객 경험을 개선합니다

  • 공공 부문

    정부 기관은 국가 또는 지역 단위 데이터세트를 분석해 디지털 전장 및 감시, 접촉자 추적, 범죄 매핑, 예측 기반 순찰, 응급 서비스 등에 사용할 수 있습니다


그림 5. 같은 장소에 동시에 있었던 사람들의 위치와 체류 시간 추적(예: 코로나19 추적 및 추적)(왼쪽), 도시 계획 및 개발 시각화(가운데), 질병 발생 열지도 및 시각화(오른쪽) 등에 지리 공간 데이터를 사용할 수 있습니다(© 2022 Oracle Corporation; 맵 데이터 © 2020 HERE)

지리 공간 데이터베이스 도전 과제

  • 공간 데이터와 비즈니스 프로세스를 통합하기 어려움

    GIS 시스템은 비즈니스 시스템과 분리된 특수 전용 시스템인 경우가 많으며, 별도 시스템 운영으로 인해 시스템 교육, 운영, 유지보수 비용이 증가합니다. 위치 관련 정보를 애플리케이션에 제공하는 작업은 수작업으로 이루어집니다. 그만큼 노동 집약적이고 시간이 많이 소요되며 오류가 발생하기 쉽고, 대규모 인프라 프로젝트에 필요한 확장성이 부족합니다. 완전한 시스템 간 통합이 이뤄지지 못한 경우 관련 애플리케이션은 지리공간 정보의 가치를 온전히 활용할 수 없습니다.
  • 상호 운용성

    애플리케이션에 가치 있는 위치 기반 정보를 제공하기 위한 지도 및 데이터 통합의 수요가 갈수록 증가하고 있습니다. 그러나 기업에서는 프로젝트마다 서로 다른 솔루션을 사용하는 경우가 있습니다. 이는 기업 내에 복수의 GIS 또는 매핑 구성 요소를 존재하도록 만들고, 데이터 프라이버시와 데이터 레지던시에 대한 우려를 야기합니다.
  • 이질적 데이터

    다양한 종류의 데이터가 파일이나 특수 데이터 저장소에 보관되며 각각 전문적인 기술 세트가 필요하기 때문에 통합 분석이 어렵습니다. 지리공간 데이터를 통합할 때는 메타데이터의 정의와 사용에 대한 전사적 합의가 필수적입니다. 메타데이터가 불완전하거나 액세스/검색이 불가능하고, 데이터 세트의 의미론적 일관성이 결여되어(즉, 동일한 용어가 반드시 같은 의미를 지니지 않음) 적절한 데이터 세트를 찾기 어려워지는 경우가 많습니다.
  • 확장성

    상업용 애플리케이션에 필요한 센서 데이터, GPS 스트리밍 데이터, 3D 데이터 등의 위치 정보와 관련하여 지속적으로 증가하는 지리공간 데이터를 효과적으로 처리하기 위한 확장성이 필수 요소가 되었습니다.
  • 애플리케이션 레벨 통합

    매핑 시스템과 비즈니스 시스템 간의 통합 부족으로 인해 고객이 의사 결정 지원 시스템 전반에 걸쳐 중앙화된 위치 정보를 활용할 수 없는 경우가 많습니다.

지리 공간 데이터베이스의 작동 방식

그림 6. 데이터 수집부터, 처리, 시각화, 최종 결과 공유, 게시에 이르는 지리공간 데이터 흐름
  • 데이터 수집

    다양한 데이터 소스(다변량 데이터)로부터 공간적 속성(형상, 크기, 위치) 및 비공간적 속성(이름, 길이, 면적, 부피, 인구, 기타) 데이터를 필터링하고 수집합니다. 데이터 세트는 다양한 데이터 소스에서 수집한 방대한 수의 전용 도메인별 파일 형식으로 구성될 수 있으며, 이러한 다양한 데이터 유형을 변환하는 과정에는 많은 시간이 소요됩니다.
  • 데이터 보강

    주소 지오코딩 및 장소 이름과 같은 공간 속성으로 데이터를 보강하여 후속 분석을 지원합니다. 텍스트 데이터를 숫자 데이터로 변경하고 다른 모든 숫자 데이터를 정규화합니다. 사용자는 데이터 보강을 통해 정형화되지 않은 지리 데이터를 처리하여 정보를 분류, 비교, 필터링하고 다른 정형 데이터와 연계하여 공간 및 텍스트 분석을 수행할 수 있습니다.
  • 지리 공간 처리

    공간 분석 워크플로를 개발하고, 속성 데이터를 기하학적 데이터셋과 결합하여 공간 분석 및 매핑을 위한 데이터를 준비합니다.
  • 대화형 분석

    대화형 지도에서 다른 컨텍스트 계층과 함께 데이터를 시각화합니다. 지도를 탐색하고, 보기, 확대/축소, 이동, 패턴 찾기, 속성별 쿼리/필터링 등을 수행합니다.
  • 결과 공유 및 게시

    REST, GeoJSON, OGC 웹 서비스를 통해 공간 콘텐츠와 분석 결과를 통합합니다.

지리공간 데이터 관리 및 활용 모범 사례

  • 융합형 데이터베이스 등의 기술을 활용하면 지리공간 데이터를 다른 모든 기업 데이터와 결합하여 운영, 전략, 개발 관련 이점을 누릴 수 있습니다.
  • 데이터를 저장된 위치에서 바로 처리하여 성능을 개선합니다. 데이터베이스에서 제공하는 기능을 활용해 데이터 통합, 보강, 분석, 머신러닝을 수행할 수 있습니다.
  • 데이터 보안을 고려하여 설계된 검증된 데이터 관리 플랫폼으로 엔터프라이즈 등급의 보안 및 거버넌스를 구현해 보세요.
  • 확장성 및 고가용성을 지원하는 엔터프라이즈 데이터 관리 플랫폼의 성능을 활용하여 계속해서 증가하는 데이터 양을 관리하고 관련 수요에 대응할 수 있습니다.
  • 다양한 시스템과 공급업체 전반의 구성 요소를 결합할 수 있는 개방형 지리 공간 플랫폼을 선택하는 것은 미래에 대비하기 위한 안전한 투자입니다.
  • 클라우드에서의 로우 코드 애플리케이션 구축과 클라우드로의 간편한 리프트 앤 시프트를 모두 지원하는 플랫폼을 선택해 클라우드의 이점을 빠짐없이 누릴 수 있습니다.

관련 제품

Oracle Autonomous Database

세계 최초의 자율 구동 데이터베이스

Oracle Database

세계 최고 수준의 통합형 다중 모델 데이터베이스 관리 시스템

Oracle Exadata

Oracle Database의 독보적인 성능, 확장성, 가용성

Oracle Autonomous Data Warehouse

간결한 데이터 웨어하우스 운영