고품질 데이터를 사용하여 라이브 데이터 분석을 수행하는 기능은 대부분의 산업 조직들에 중요하지만, 그중에서도 특히 리테일 업체들에게 중요합니다. 정확한 데이터에서 도출된 시의적절한 인사이트를 통해 제때에 제품 권장사항을 제공하고 적재적소에 재고를 유지하여 고객 만족도를 높일 수 있습니다. 또한 프로모션 성과에 대한 실시간 평가를 통해 상품화, 마케팅 및 영업 활동을 최적화하고, 보다 정확한 재고 예측을 통해 비용과 위험을 낮출 수 있습니다. 즉 효과적인 라이브 데이터 분석을 통해 조직 전반의 리테일 운영에 긍정적인 영향을 미칠 수 있습니다.
라이브 데이터 분석을 통해 최대의 가치를 창출하기 위해서는 가장 중요한 데이터세트 전반에서 데이터 수명 주기 관리에 대해 단일하고 최적화된 접근 방식을 구현해야 합니다. 이 접근 방식은 다음을 가능하게 합니다.
데이터 복잡성과 중복성을 줄일 수 있습니다.
저품질 데이터가 야기하는 위험 및 비용을 최소화할 수 있습니다.
데이터에 대한 단일하고 일관적인 뷰를 생성할 수 있습니다.
조직 전반에서 데이터를 일관적인 형식으로 제공할 수 있습니다.
도메인 팀에서 사용하는 도구와 관계없이, 보고 및 고급 데이터 분석을 위한 셀프 서비스 BI(비즈니스 인텔리전스)를 사용할 수 있습니다.
데이터 지형에 유연성을 더해 미래에 변화 발생 시, 이로 인한 비용을 최저 수준으로 유지합니다.
최적화된 분석 솔루션으로 분석 현대화하기
다음 아키텍처는 리테일 업체가 전체 데이터 분석 수명주기를 관리할 수 있도록 종합적인 통합 프레임워크를 제공하기 위해 구축된 Oracle Data Platform의 구조를 보여줍니다. 아키텍처의 중심에는 2개의 핵심 구성 요소가 있습니다. 변경 없이 원시 형태로 수집 및 유지되는 운영 데이터 저장에 사용되는 '운영 데이터 저장소(ODS)'와 쿼리 성능 및 고급 분석에 최적화된 형식으로 데이터가 저장되는 '데이터 웨어하우스'가 그것입니다.
이 둘을 결합하면 ODS와 데이터 웨어하우스는 보다 효율적인 고급 분석을 수행하는 데이터 플랫폼으로 거듭납니다. 이 결합 덕분에 고급 분석 및 시각화 도구를 효과적으로 적용할 수 있게 되며, 동시에 원시 형태의 데이터를 조사하여 기저의 트랜잭션 애플리케이션 성능에 영향을 미치지 않고도 이상과 인사이트를 식별할 수 있는 역량을 유지할 수 있게 됩니다. 이 접근 방식은 동일한 소스 데이터의 모순적이며 부정확한 중복을 방지함으로써 리테일 업체들에게 이점을 제공합니다. 만일 이와 같은 소스 데이터가 조직의 의사결정에 사용되는 경우 지연 및 오류는 물론, 궁극적으로 매출 손실이 발생할 수 있습니다.
Oracle Data Platform이 ODS, 데이터 웨어하우스 및 기타 주요 구성요소를 통합하여 리테일 업체가 라이브 데이터 분석을 효과적으로 활용할 수 있도록 지원하는 방법을 자세히 살펴보겠습니다.
리테일 업체가 데이터를 더 잘 분석할 수 있도록 아키텍처에 데이터를 삽입하는 2가지(조건적으로 3가지) 주요 방법이 있습니다.
프로세스를 시작하려면 비즈니스 기록 및 애플리케이션(예: 리테일 위치 전반의 재고 수준)에서 최신 데이터에 대한 가시성을 확보해야 합니다. 이를 위해 OCI GoldenGate를 사용하여 운영 데이터베이스에서 거의 실시간으로 데이터를 수집(트랜잭션 처리)할 수 있는 변경 데이터 수집(CDC)을 활성화합니다. 여기에는 POS 및 웹 트랜잭션(판매 및 반품), 재고, 물류 및 공급망 데이터를 비롯하여 리테일 트랜잭션과 관련된 모든 기록 또는 개별 기록 세트가 포함됩니다. 타임 스탬프 또는 플래그 필터를 사용하여 데이터 수집을 트리거하는 방식 외에도, 변경 사항 발생 시 이를 감지하는 CDC 메커니즘을 통해서도 데이터를 수집할 수 있습니다. OCI GoldenGate는 완료된 트랜잭션의 로그 파일을 처리하고 수집된 변경 사항을 데이터베이스와 별도로 외부 추적 파일에 저장하여 소스 변경 사항을 비침습적으로 처리할 수 있는 CDC 매커니즘을 제공합니다. 이후 변경 사항은 스테이징 데이터베이스 또는 운영 데이터 저장소로 안정적으로 전송됩니다.
이제 재고 및 제품 데이터, 고객 기록, 상품 및 가격을 포함한 핵심 리테일 거래와 관련된 데이터세트를 추가할 수 있게 되었습니다. 이러한 데이터세트는 대량의 온프레미스 데이터로 구성되는 경우가 많고, 대부분의 경우 일괄 수집이 가장 효율적인 수집 방식입니다.
운영 소스로부터 트랜잭션 데이터를 수집해 운영 데이터 저장소를 파퓰레이션하기 위한 방법을 결정할 때 고려해야 할 몇 가지가 있습니다. 예약된 일별 배치에서 지속적인 실시간 통합에 이르기까지 주로 데이터 통합 대기 시간의 측면에서 사용 가능한 기술이 다양합니다. 데이터는 타임 스탬프 또는 플래그를 기반으로 필터링을 수행하는 증분 쿼리를 통해 소스로부터 수집됩니다. 이 기법 역시 풀 작업을 사용하는지, 푸시 작업을 사용하는지에 따라 달라집니다. 풀 작업은 고정된 간격으로 새 데이터를 가져오고, 푸시 작업은 변경 사항이 나타나면 대상으로 데이터를 로드합니다. 데이터가 매일 최신일 필요가 없는 경우 일일 일괄 수집이 가장 적합합니다. 예를 들어 보다 장기간의 트렌드에 관한 데이터 또는 재무 마감 정보 등 하루에 한 번만 수집되는 데이터가 여기에 해당됩니다. 24시간 데이터 웨어하우스 가용성이 필요하지 않은 비즈니스 모델의 경우 일괄 로드가 다운타임 윈도우에서 수행될 수 있습니다. 가용한 다운타임 윈도우가 없는 경우 라이브 데이터 웨어하우스에 대한 로드의 영향을 최소화하기 위해 다양한 기술을(실시간 Partitioning 또는 Trickle 및 Flip) 활용할 수 있습니다.
스트리밍 수집을 사용하여 IoT, 머신 투 머신(M2M) 통신, 기타 수단을 통해 저장 위치의 송신소로부터 읽어온 데이터를 수집하는 옵션도 있습니다. 비디오 이미징 또한 같은 방식으로 사용할 수 있습니다. 추가로, 본 사용 사례에서는 소셜 미디어 메시지, 제1자 게시물에 대한 반응, 인기 메시지 등을 분석하여 소비자 정서를 분석하고 신속하게 대응하고자 합니다. 소셜 미디어(애플리케이션) 메시지/이벤트 데이터 수집 시에는 클라우드 스토리지에 해당 데이터를 저장하기 전에 몇 가지 기본적인 변환/집계를 수행하는 옵션이 함께 제공됩니다. 추가 스트리밍 분석 기능을 사용하여 상관관계가 있는 소비자 이벤트 및 행동들을 식별하고, 식별된 패턴은 원시 데이터의 데이터 과학 조사를 위해 OCI Data Science로 수동으로 전달할 수 있습니다.
데이터 지속성 및 처리는 2개의 구성 요소를 기반으로 구축됩니다.
운영 데이터 저장소는 원시 데이터에 대한 운영 보고 및 엔터프라이즈 또는 도메인 레벨 서비스 데이터 저장소 또는 엔터프라이즈 데이터 웨어하우스(EDW)에 대한 데이터 소스로 사용됩니다. 이 저장소는 의사결정 지원 환경에서 EDW를 보완하는 요소입니다. ODS는 일반적으로 추가 작업, 보고, 제어 및 운영 의사결정 지원에 사용하기 위해 여러 소스로부터 수집한 데이터를 통합 및 유지하도록 설계된 관계형 데이터베이스입니다. 반면 EDW는 전술적 및 전략적 의사 결정 지원에 사용됩니다. 일반적으로 ODS의 데이터 모델은 OLTP 소스 애플리케이션의 데이터 모델과 매우 가깝습니다. ODS는 모든 소스 데이터를 수용하며, 데이터 품질 규칙 구현이 거의 필요 없습니다. 덕분에 이 저장소는 운영 시스템으로부터 하루종일 수집한 모든 데이터를 보관하게 됩니다. 프러덕션 마스터 데이터 저장소와 달리 데이터가 운영 시스템으로 다시 전달되지 않습니다. 데이터 웨어하우스는 보통 읽기 전용이며, 정해진 일정에 따라 일괄 업데이트되는 반면, 운영 데이터 저장소는 실시간으로 유지 관리되고, 조금씩 업데이트됩니다.
이제 서비스 데이터 저장소에서의 선별 및 쿼리 성능을 위해, 최적화된 관계형 형식으로 보관될 준비를 마친, 처리된 데이터세트를 생성했습니다. 이 사용 사례에서 서비스 데이터 저장소는 데이터 웨어하우스로, 비즈니스 인텔리전스 활동 및 발전을 거듭하는 분석을 지원하기 위해 설계된 일종의 영구 플랫폼입니다. 데이터 웨어하우스의 주된 목표는 비즈니스 사용자에게 정확한 지표를 통합 및 제시하여 이들이 일상적인 업무 시에는 물론 대규모의 전략적 비즈니스 의사결정 수립 시에도 정보를 기반으로 결정을 내릴 수 있도록 돕는 것입니다. 이를 수행하기 위해, 데이터 웨어하우스는 고도로 전문화되어 있으며, 과거 데이터를 대규모로 포함하고 있는 경우도 종종 있습니다. 또한 데이터 웨어하우스는 쿼리 및 분석을 수행하기 위한 용도로만 사용됩니다. 데이터 웨어하우스는 애플리케이션 로그 파일, 트랜잭션 애플리케이션 등 여러 소스로부터 대량의 데이터를 중앙화 및 통합한 뒤, 이를 분석에 최적화된 형식으로 전달합니다. 데이터 웨어하우스의 분석 기능을 통해 조직은 데이터에서 귀중한 비즈니스 인사이트를 도출하여 의사결정을 개선할 수 있습니다. 시간이 지나면서 데이터 웨어하우스는 데이터 과학자와 비즈니스 분석가에게 귀중하게 쓰일 기록 레코드를 구축하게 됩니다. 이와 같은 기능 덕분에 조직은 데이터 웨어하우스를 '신뢰할 수 있는 소스'로 취급하기도 합니다. 데이터 웨어하우스를 순수한 기술 자산으로만 보는 경향도 있지만, 실제로는 비즈니스 사용자와 IT를 통합하여 리테일 업체의 운영 환경에 대한 공통의 이해를 제공하고, 다음과 같은 작업을 완료할 수 있는 고유한 환경을 제공하는 역할을 담당합니다.
비즈니스 니즈 정의(주요 지표), 주요 지표에 관한 소스 데이터 식별, 소스 정보를 주요 지표로 변환하기 위한 비즈니스 규칙 지정
주요 지표를 저장하기 위한 대상 웨어하우스의 데이터 구조 모델링
비즈니스 규칙 구현을 통한 지표 채우기
데이터 품질 규칙 설정을 통한 전반적인 데이터 정확성 측정
주요 지표에 대한 보고서 작성
임시 쿼리 도구 또는 사전 정의된 보고서를 통해 비즈니스 사용자가 주요 지표 및 메타데이터를 사용할 수 있게 지원
비즈니스 사용자의 만족도 측정 및 주요 지표 추가 또는 수정
분석, 학습, 예측 역량은 2가지 기술을 바탕으로 구축됩니다.
분석 및 시각화 서비스는 기술적 분석(히스토그램 및 차트를 통한 현재 추세 설명), 예측적 분석(미래 이벤트 예측, 추세 식별, 불확실한 결과의 확률 예측), 처방적 분석(적절한 작업 제안, 최적의 의사 결정에 기여) 등의 기능들을 활용하여 다음과 같은 질문들에 답할 수 있습니다.
이 기간의 실제 판매량은 현재 적용 중인 계획 대비 어떠하였습니까?
보유 재고의 소매가 기준 가치는 얼마이고, 해당 가치는 전년도 동일 기간 대비 어떻게 변화하였습니까?
특정 부서의 가장 잘 팔리는 품목은 무엇입니까?
최근의 프로모션은 얼마나 효과적이었습니까?
고급 분석 및 시각화 기능을 사용하는 것 외에도 여러 머신러닝 모델이 개발, 훈련, 배포될 수 있습니다.
거버넌스는 이와 같은 솔루션 구축 시 고려해야 할 주요 요소입니다. 비즈니스 사용자는 데이터 웨어하우스가 제시한 주요 지표의 정확성에 의존하여 의사결정을 내립니다. 만약 이와 같은 지표가 잘못된 경우, 의사결정 역시 잘못될 가능성이 높습니다. 귀하가 정의한 데이터 품질 전략에 따라 비즈니스 사용자는 데이터 불일치 모니터링에 적극적으로 참여해야 할 수 있습니다. 이들은 IT 팀이 지표의 계산 방법을 개선하도록 돕고, 잘못된 데이터의 검증 및 식별 과정을 지원해야 합니다. 이와 같은 과정은 보통 비즈니스 규칙의 수정 및 검증 가능한 개선으로 이어집니다.
Oracle이 선별 및 테스트한 고품질 데이터 및 모델에는 귀사의 거버넌스 규칙을 적용할 수 있으며, 이 모델이 리테일 조직 전반에 대한 배포를 위해 데이터 메시 아키텍처 내 데이터 제품(AP)으로 노출될 수 있습니다. 이와 같은 기능은 데이터 품질 문제 해결에 중요할 수 있습니다. 낮은 데이터 품질은 거의 모든 리테일 조직에 영향을 미치기 때문입니다. 일관되지 않고, 부정확하며, 불완전하고, 오래된 데이터는 종종 운영 비효율성, 잘못된 분석, 규모의 경제 실현 실패, 고객 불만족 등 값비싼 비용을 초래하는 비즈니스 문제의 근본 원인입니다. 이와 같은 데이터 품질 문제와, 그와 관련된 비즈니스 수준의 문제는 앞서 설명한 아키텍처의 능력을 활용한 전사적인 종합 데이터 품질 개선 노력을 통해 해결할 수 있습니다.
양질의 데이터로 의사결정 수준 높이기
Oracle Data Platform은 필요할 때, 필요한 곳에서 일관적인 고품질 데이터에 대한 액세스를 전사적으로 갖출 수 있도록 지원하기 위해 구축됩니다. 이를 통해 다음과 같은 성과를 얻을 수 있습니다:
보다 정보에 기반한 의사결정을 내릴 수 있습니다.
일관적이지만 유연한 데이터 지형을 통해 미래에 발생한 변화에도 비용을 최소화할 수 있습니다.
데이터 사일로가 줄어들고, 데이터 가용성 및 품질에 대한 영향이 없어 프로세스 및 데이터에 대한 변경을 여러 번 반영할 수 있습니다.
전사적 데이터 지형의 변환 로직을 다양화함으로써 동일한 데이터의 단절된 사본을 삭제하여 핵심 재무 및 규제 보고서 작성 시 오류의 위험을 줄일 수 있습니다.
훨씬 향상된 데이터 가용성으로 보고서를 위한 셀프 서비스 고급 분석 및 데이터 검색 기능을 제공합니다. 이제 도메인 팀이 사용하는 특별한 도구를 통해서만 데이터에 액세스할 수 있던 시절은 끝났습니다.
ODS 및 기타 데이터 저장소의 확장으로 인한 저장 비용을 절감할 수 있습니다.
데이터가 제공하는 인사이트를 들여다 보는 데 더 많은 시간을 할애하고, 단절된 사일로 전반의 여러 데이터 사본이 야기하는 불일치를 식별하는 데에 허비하던 시간을 줄일 수 있습니다.
공격면 노출을 늘리던 다수의 데이터 사본이 사라지기 때문에 위험이 줄어듭니다.
관련 리소스
사용 사례
리테일 가격 정책 최적화를 위한 인사이트 확보하기
본 사용 사례를 통해 리테일용 Oracle Data Platform을 사용한 재고 및 프로모션 최적화 방안을 확인해 보세요.
Oracle이 제공하는 무료 체험을 통해 Autonomous Database, Arm Compute, Storage 등을 무기한 사용할 수 있으며 추가 클라우드 서비스를 체험할 수 있는 미화 300달러 상당의 무료 크레딧이 함께 제공됩니다. 자세한 내용을 확인하고 지금 바로 무료 계정에 가입해보세요.
튜토리얼 및 실습을 통해 다양한 OCI 서비스를 경험해볼 수 있습니다. 개발자, 관리자, 분석가, 각 사용자에 적합한 방식으로 OCI 작동 방법을 보여드리겠습니다. 대부분의 실습은 Oracle Cloud 무료 체험, 또는 Oracle에서 제공하는 무료 실습 환경에서 실행됩니다.
Oracle의 아키텍트 및 기타 고객들이 엔터프라이즈 앱, HPC, 마이크로서비스, 데이터 레이크 등 다양한 워크로드를 배포하는 방식을 확인할 수 있습니다. 모범 사례들로부터 정보를 얻고, Oracle의 Built & Deployed 시리즈를 통해 고객사 아키텍트들이 공유하는 관련 내용들을 살펴보세요. '클릭하여 배포(click to deploy)' 기능을 활용하거나 Oracle의 GitHub 저장소에 직접 액세스하여 다양한 워크로드를 배포할 수도 있습니다.