最適化された分析ソリューションで分析を最新化
次のアーキテクチャは、データ分析ライフサイクル全体を管理するのに役立つ、まとまりのある包括的なフレームワークを小売業者に提供するために、Oracle Data Platformがどのように構築されているかを示しています。その中心には、2つの重要なコンポーネントがあります。取り込まれた後、変換さていない生の状態で永続化された運用データの保存に使用される運用データストア(ODS)と、問合せのパフォーマンスや高度な分析のために最適化された形でデータを保存するデータウェアハウスです。
ODSとデータウェアハウスを組み合わせることで、より効率的かつ高度な分析が可能なデータ・プラットフォームが実現します。この組み合わせにより、高度な分析と可視化ツールを効果的に使用することができます。また、基礎となるトランザクション・アプリケーションのパフォーマンスに影響を与えることなく、データを生のまま調査して異常やインサイトを特定することができます。これは、同じソースデータの矛盾や不正確な複製を防ぐことができるため、小売業者にとって有益なアプローチとなっています。このようなデータを組織の意思決定に使用してしまうと、遅延やエラー、最終的には売上損失の原因となる可能性があるからです。
それでは、Oracle Data PlatformがどのようにODS、データウェアハウス、およびその他の主要コンポーネントを組み込み、小売業者による効果的なライブ・データ分析を支援しているのかを、詳しく見ていきましょう。
この図は、小売向けOracle Data Platformを使用して、ライブデータと履歴データの分析を最適にサポートする方法を示しています。このプラットフォームは、以下の5つの柱を掲げています。
1 データソース、検出
2 接続、取込み、変換
3 永続化、キュレーション、構築
4 分析、学習、予測
5 測定、実行
データソース、検出の柱には、2つのカテゴリーのデータが含まれます。
1. アプリケーションは、ERP、SCM、CX、WMSアプリケーション、Fusion SaaS、NetSuite、E-Business Suite、PeopleSoft、JD Edwards、Salesforce、SAP、Workdayからのデータで構成されています。
2. ビジネス・レコードは、販売取引、顧客データ、製品データ、返品取引、サプライヤー・データ、在庫データ、POSシステムからのデータ、収益およびマージン・データで構成されています。
接続、取込み、変換のピラーは、2つの機能で構成されます。
1. バッチ取り込みには、OCI Data Integration、Oracle Data Integrator、DBツールなどを使用します。変更データの取得には、OCI GoldenGateとOracle Data Integratorを使用します。
2. 両機能は、永続化、キュレーション、構築のピラーにある運用データストア機能に一方向に接続されています。
永続化、キュレーション、構築のピラーは、3つの機能で構成されます。
1. 運用データストアは、Oracle Autonomous Transaction Processingを使用します。
2. サービング・データストアは、Oracle Autonomous Data Warehouseとデータベース・ツールを使用します。
3. ガバナンスはOCI Data Catalogを使用します。
こうした機能は、柱の中で接続されています。運用データストアは、サービング・データストアと一方向に接続されています。
1つの機能が、分析、学習、予測のピラーに接続されます。サービング・データストアは、分析と可視化機能に一方向に接続されています。
分析、学習、予測のピラーは、1つの機能で構成されます。
1. 分析、可視化は、Oracle Analytics Cloud、GraphStudio、およびISVを使用します。
測定、実行のピラーは、ダッシュボードとレポートという単一の消費者カテゴリーで構成されています。
3つの中心的な柱である、取り込み、変換と永続化、キュレーション、構築と分析、学習、予測は、インフラ、ネットワーク、セキュリティ、IAMでサポートされます。
小売業者がデータをより良く分析できるようにするために、アーキテクチャにデータを取込む主な方法は2つ(またはオプションで3つ)あります。
このプロセスを開始するには、ビジネス記録やアプリケーションから最新のデータを可視化する必要があります(例えば、小売店舗全体の在庫レベルなど)。そのために、OCI GoldenGateを使用して、運用データベース(トランザクション処理)からのほぼリアルタイムのデータのチェンジ・データ・キャプチャ (CDC)取り込みを可能にします。これには、POSおよびWebトランザクション(販売と返品の両方)を含む小売取引に関連するすべてのレコードまたは個別のレコードセット、および在庫、物流、およびサプライチェーン・データが含まれます。タイムスタンプやフラグ・フィルターを使用してデータ取込みをトリガーするだけでなく、変更が発生したときにそれを検出するCDCメカニズムによってデータを取り込むことができます。OCI GoldenGateは、完了したトランザクションのログ・ファイルを処理し、取得した変更をデータベースとは独立した外部の証跡ファイルに保存することで、ソース変更を非侵襲的に処理できるCDCメカニズムを提供します。その後、変更はステージング・データベースまたは運用データストア に確実に転送されます。
また、現在では、在庫や製品データ、顧客レコード、オファーや価格など、コア小売取引に関連するデータセットを追加できるようになりました。これらのデータセットは、多くの場合、大量のオンプレミス・データから構成され、ほとんどの場合、バッチ取り込み が最も効率的であることが一般的です。 ただし、運用データストアに格納するために、運用ソースからトランザクション・データを収集する方法を決定する際には、いくつか考慮すべき点があります。利用可能な方法の違いは、主に、データ統合の際のレイテンシにあります。これは、毎日のスケジュールされたバッチから連続的なリアルタイム統合まで異なります。データは、タイムスタンプやフラグに基づいてフィルタリングする、増分クエリを介してソースから取得されます。方法は、プル操作とプッシュ操作のどちらを使用するかによっても異なります。プル操作は一定の間隔で新しいデータを取り込み、プッシュ操作は変更があったときにデータをターゲットにロードします。例えば、長期的なトレンドに関するデータや、決算情報のように毎日1回しか計算されないデータなど、日中の鮮度を必要としない場合は、日次バッチ取り込みが最も適しています。ビジネスモデル上、24時間データウェアハウスを利用する必要がない場合は、ダウンタイムにバッチ・ロードを実行することもできます。ダウンタイム・ウィンドウが存在せず、ライブ・データウェアハウスへのロードの影響を最小化したい場合には、リアルタイム・パーティショニングやトリクル&フリップなど、さまざまな方法を使用することができます。
オプションとして、ストリーミング取込み を使用して、IoT、マシン間通信、およびその他の手段を通じて店舗の場所にあるビーコンから読み取ったデータを取り込むこともできます。ビデオ映像もこのように利用することができます。さらに、このユースケースでは、ソーシャルメディアのメッセージ、ファーストパーティの投稿に対する反応、トレンドのメッセージなどを分析することで、消費者のセンチメントを分析し、迅速に対応することを目的としています。ソーシャルメディア(アプリケーション)のメッセージ/イベントの取り込みにはオプションがあり、データがクラウド・ストレージに保存される前に、いくつかの基本的な変換/集約を行うことができます。相関する消費者イベントと動向を特定するために追加のストリーミング分析の利用が可能であり、特定されたパターンは、OCI Data Scienceで生データを調査するために(手動で)フィードバックすることができます。
データの永続化と処理は、2つのコンポーネントで構築されています。
運用データストア は、生データに対する運用レポートや、企業/部門レベルのサービス・データストアまたはエンタープライズ・データウェアハウス(EDW)のデータソースとして使用されます。意思決定支援において、EDWの補完的要素となっています。ODSは通常、複数のソースからのデータを統合して永続化し、追加の運用、報告、制御、運用上の意思決定支援に使用するために設計されたリレーショナル・データベースであるのに対し、EDWは戦術的・戦略的意思決定支援に使用されます。通常、ODSのデータモデルは、OLTPソースアプリケーションのデータモデルに非常に近いものです。ODSはどんなソースデータも受け入れることができ、データ品質ルールをほとんど実装する必要がないため、運用システムから得られた一日分のデータすべてを格納するストアを確保できます。本番用マスター・データストアとは異なり、データは運用システムに返されることはありません。データウェアハウスは通常、読み取り専用かつ特定のスケジュールでバッチ更新されますが、運用データストアは、よりリアルタイムに近い状態で維持され、常にトリクル・フィードされています。
これで、最適化されたリレーショナル形式で永続化するための処理済みデータセットが完成し、効果的なキュレーションとサービング・データストア でのクエリ・パフォーマンスの向上が可能になります。このユースケースでは、サービング・データストアはデータウェアハウス であり、ビジネス・インテリジェンスや高度な分析をサポートするために設計された、永続性プラットフォームの一種です。データウェアハウスの主な目的は、ビジネス・ユーザーに正確な指標を集約して提供し、日常業務やより大きな戦略的ビジネス上の意思決定において、情報に基づいた意思決定を支援することです。そのために、データウェアハウスは高度に専門化され、多くの場合、大量の履歴データを含み、クエリと分析を実行することのみを目的としています。データウェアハウスは、アプリケーションのログファイルやトランザクション・アプリケーションなど、複数のソースから大量のデータを集約・統合し、分析に最適な形で提供します。その分析機能により、データからビジネス上の価値あるインサイトを導き出し、意思決定の向上を図ることができます。長期間の運用により、データ・サイエンティストやビジネス・アナリストにとって貴重な履歴レコードが蓄積されます。このような機能を持つデータウェアハウスは、組織の「信頼できる唯一の情報源」と言えるでしょう。データウェアハウスを単にテクノロジー資産として捉える傾向がありますが、実際には、ビジネス・ユーザーとITが一体となって、小売企業の経営環境に関する共通の理解を深め、次のようなタスクを完了するためのユニークな環境を提供します。
ビジネス・ニーズ(キー・インジケータ)の定義、キー・インジケータに関連するソースデータの特定、ソース情報をキー・インジケータに変換するためのビジネスルールの特定
キー・インジケータを格納するターゲット・ウェアハウスのデータ構造をモデリング
ビジネスルールの実装により、インジケータを入力
データ品質ルールを設定することにより、データの全体的な正確性を測定
キー・インジケータに関するレポートの作成
非定型クエリツールまたは事前定義されたレポートを通じて、キー・インジケータとメタデータをビジネス・ユーザーに提供
ビジネス・ユーザーの満足度を測定し、キー・インジケータを追加または修正
分析、学習、予測機能は、2つのテクノロジーで構築されています。
分析と可視化サービスは、記述的分析(ヒストグラムやチャートで現在の傾向を説明)、予測分析(将来の出来事を予測し、傾向を特定し、不確実な結果の確率を決定)、処方的分析(適切な行動を提案し、最適な意思決定を導く)を提供します。これにより、小売業者は、次のような質問に答えることができるようになります。
今期売上実績の現行の計画に対する推移を教えてください。
手持ちの在庫の小売価格と、前年同期との比較について教えてください。
部門や部署で最も売れている商品を教えてください。
直近のプロモーションの効果の度合いを教えてください。
高度な分析と可視化の使用と並行して、機械学習 モデルの開発、トレーニング、およびデプロイメントが可能です。
ガバナンスは、このようなソリューションを構築する際に考慮すべき重要な要素です。ビジネス・ユーザーは、データウェアハウスから得られる重要な指標の正確性に依存して意思決定を行っています。これらのインジケータが間違っていれば、意思決定も間違っている可能性が高いです。定義したデータ品質戦略にもよりますが、ビジネス・ユーザーは、データの不一致の監視に積極的に参加する必要があるでしょう。ビジネス・ユーザーは、ITチームがインジケータの計算方法を改善し、誤ったデータを認定・特定するのを支援する必要があります。これは一般的に、ビジネスルールの修正とテスト可能な改良につながります。
オラクルのキュレーション済み、テスト済み、かつ高品質なデータおよびモデルは、お客様のガバナンス ルールやポリシーを適用し、データメッシュ・アーキテクチャ内のデータ製品(API)として公開し、小売組織全体に配布することが可能です。これは、データ品質の問題に対処する上で非常に重要です。データ品質の低下は、すべての小売企業に影響を与えます。一貫性がなく不正確で不完全、および古いデータは、運用上の非効率性や、誤った分析、規模の経済が達成できないこと、顧客の不満など、高価なビジネス問題の根本原因となっている場合が多いです。このようなデータ品質の問題やそれに関連するビジネスレベルの問題は、上記のアーキテクチャの機能を活用し、企業全体で包括的なデータ品質の改善に取り組むことで解決できます。