Analytics Platform Capabilities Explorer

데이터 모델

데이터 모델링은 데이터를 비즈니스 사용자들이 쉽게 이해할 수 있고, 본인의 의문에 대한 답을 구하는 데 활용 가능한 형식으로 가공하기 위한 프로세스입니다. 데이터 모델링을 위해서는 일관적인 엔터프라이즈 메트릭을 적용하기 위한 중앙화된 접근 방식과 함께 비즈니스 사용자가 직접 데이터를 혼합하여 데이터 조사를 진행할 수 있는 셀프 서비스 접근 방식이 필요합니다.

데이터 모델링

데이터 모델링은 제기될 가능성이 가장 높은 비즈니스 질문에 답하기 위한 형태로 데이터를 제공하고, 기업의 모든 지표를 일관적으로 열람 가능한 뷰를 사용하는 데 있어 꼭 필요한 기술입니다. 또한 데이터 모델은 데이터가 저장되는 물리적 방식의 복잡성을 우회하여 비즈니스 사용자에게 의미 있는 데이터 뷰를 제공합니다. 예를 들어 재무 분야의 사용자는 SQL 또는 MDX 쿼리 언어를 학습하는 대신 자체 용어집에 수록된 재무 용어를 사용하여 관계형 데이터베이스 관리 시스템(RDBMS) 또는 Essbase 큐브를 간단히 쿼리할 수 있습니다.

데이터 모델은 엔터프라이즈 비즈니스 계산을 정의하는 유일한 장소입니다. 따라서 계산이 어디에 어떻게 사용되든, 일관되고 신뢰할 수 있는 결과값이 도출됩니다. 예를 들어, 고용-비용(cost-to-hire) 메트릭을 사용하면 해당하는 소스 시스템을 올바르게 매핑하고 중앙화된 계산을 정의할 수 있습니다. 이후 해당 메트릭을 호출하는 모든 시각화 또는 보고 프로세스에서는 항상 동일한 수치를 보고할 수 있습니다.

관리형 시맨틱 모델

신뢰할 수 있는 관리형 시맨틱 모델을 개발하고 제공하여 비즈니스 크리티컬 데이터에 대한 일관적 뷰를 보장할 수 있습니다. 복잡한 데이터를 친숙하고 일관된 비즈니스 용어에 매핑합니다. 최적화와 미세 조정을 거친 실행용 쿼리를 설계합니다.

시맨틱 모델은 물리적 계층에서 시작하여 논리적 계층, 프리젠테이션 계층으로 이어지는 세 가지 계층으로 구성됩니다. 물리적 계층은 조직의 물리적 데이터 소스 시스템을 매핑하는 데 사용되고, IT 부서에서 구성 및 관리하는 것이 일반적입니다. 논리적 계층은 비즈니스 계산, 계층 구조, 다수의 데이터 소스를 논리적 보고 영역으로 매핑하는 데 사용됩니다. 예를 들어 ERP 시스템과 데이터 웨어하우스를 재무 보고 영역에 함께 매핑할 수 있습니다. 프리젠테이션 계층에는 사용자가 분석 스토리 작성에 사용할 수 있는 속성 및 메트릭이 표시됩니다. 모든 데이터는 일관적으로 계산되지만, 해당 데이터를 열람할 수 있는 사용자 뷰는 각 사용자의 보안 액세스 및 권한에 따라 필터링됩니다.

그림 1: 시맨틱 모델링 도구에서 데이터 계보 검토하기

관리형 시맨틱 모델은 타사 시각화 도구(예: Tableau, Power BI 또는 커스텀 앱)를 통해서도 JDBC 소스 형식으로 열람할 수 있습니다. 따라서 특정 기업 내 여러 비즈니스 그룹이 서로 다른 시각화 도구를 선택하는 경우에도 엔터프라이즈 메트릭은 한 차례만 정의하면 되고, 해당 기업의 모든 보고 플랫폼에서의 일관성이 유지됩니다.

시맨틱 계층 더 알아보기


셀프 서비스 데이터 모델링

사용자는 셀프 서비스 방식으로 직접 2개 또는 그 이상의 테이블을 병합하고 테이블 간 관계를 제어할 수 있습니다(예: 내부 또는 외부 조인). 셀프 서비스 데이터 모델을 동료들과 간단히 공유할 수 있습니다.

다중 테이블 데이터세트 데모 시청하기(2:57)


그림 2: 셀프 서비스 데이터 모델링

셀프 서비스 데이터 모델링 더 알아보기

데이터 보강 및 권장 사항

추가 데이터, 속성 또는 변환을 통해 데이터 세트를 보강할 수 있습니다. 기본 제공되는 참조 지식은 다음과 같습니다.

  • 글로벌 포지셔닝 시스템 보강:
    도시 또는 우편번호와 관련된 참조용 위도 및 경도를 제공합니다.
  • 참조 기반 보강:
    사람의 이름을 성별을 정의하는 속성으로 사용하여 성별을 지정할 수 있습니다.
  • 열 연결:
    하나의 열에 사람의 이름과 성을 연결합니다.
  • 부분 추출:
    주소의 도로명에서 집 번호를 분리합니다.
  • 시맨틱 추출:
    이메일 주소의 도메인과 같이 알려진 시맨틱 유형으로부터 정보를 추출합니다.
  • 날짜 부분 추출:
    월/일/년(또는 일/월/년) 형식을 사용하는 날짜 데이터에서 요일을 추출하여 시각화 작업에 보다 적합한 날짜 데이터를 만들 수 있습니다.
  • 전체 및 부분 난독화:
    신용카드나 주민등록번호와 같이 민감한 필드가 감지되면 마스킹합니다.
  • 일반적인 권장 사항:
    민감한 필드가 감지되면 해당 필드가 포함된 열을 삭제합니다.
  • 커스텀 지식 보강:
    관리자가 Oracle Analytics에 추가한 커스텀 포함 데이터를 활용합니다.

그림 3: 커스텀 참조 지식 구성하기

Semantic Modeler Markup Language(SMML)

데이터 모델 개발자는 웹 기반 그래픽 도구를 사용하여 시맨틱 모델을 구축, 편집, 조정할 수 있지만, Semantic Modeler Markup Language(SMML)를 사용하여 프로그래밍 방식으로 모델을 수정할 수도 있습니다. SMML은 설계-시간(design-time) 시맨틱 모델의 객체를 설명하는 JSON 기반 마크업 언어입니다. 각 SMML 파일은 시맨틱 모델의 객체를 나타냅니다. 메타데이터 마이그레이션, 프로그래밍 방식의 메타데이터 생성 및 조작, 메타데이터 패치 및 기타 기능에 SMML 파일을 사용할 수 있습니다. SMML을 사용하는 개발자는 시맨틱 모델 코드를 직접 편집할 수도 있고, SMML 정의의 텍스트를 변경하는 간단한 방식으로 다른 프로그래밍 프로세스를 통해 변경 사항을 적용할 수도 있습니다.


그림 4: JSON 기반 Semantic Modeler Markup Language(SMML)

다중 사용자 모델 개발 및 Git 통합

시맨틱 모델러는 GitHub, GitLab, Oracle Visual Builder 기반 Git등의 모든 Git 호환 리포지토리와 통합 가능하므로 협업을 지원하는 원활한 다중 사용자 개발 환경 및 소스 제어 기능을 제공할 수 있습니다. 다중 사용자 개발을 위한 Git 통합은 브랜칭, 머징, 풀 및 푸시 작업을 지원하고 시맨틱 모델의 개발 수명 주기 전반에 대한 완전한 가시성을 제공합니다.


그림 5: Git 통합에 기반한 다중 사용자 개발