Analytics Platformの機能に関する詳細

データ・モデル

データ・モデリングとは、ビジネス・ユーザーが理解しやすく、質問の答えを見つけやすい形でデータを表現するプロセスです。データ・モデリングには、一貫した企業メトリックを確保するための一元的なアプローチと、ビジネス・ユーザーがデータ調査をサポートするためにデータをブレンドするためのセルフサービス・アプローチが必要となります。

データ・モデリング

データ・モデリングとは、ビジネス・ユーザーが理解しやすく、質問に対する答えを見つけやすい形でデータを表現するプロセスです。データ・モデリングには、一貫した企業メトリックを確保する一元的なアプローチと、ビジネス・ユーザーがデータ調査をサポートするためにデータをブレンドするセルフサービス・アプローチが必要となります。例えば、財務ユーザはSQLやMDXクエリ言語を理解する必要はなく、自分の辞書から認識可能な財務用語を使用して、リレーショナル・データベース・マネジメント・システム(RDBMS)やEssbaseキューブに対するクエリを簡単に実行できます。

データ・モデルは、企業のビジネス計算を定義する単一の場所です。データ・モデルは、企業のビジネス計算を定義する唯一の場です。たとえば、雇用コストという指標では、該当するソース・システムが正しくマッピングされ、計算が一元的に定義されます。そうすれば、その指標を呼び出す可視化またはレポート・プロセスは、常に同じ数値をレポートすることになります。

ガバナンスの効いたセマンティック・モデル

ビジネスにとって重要なデータの一貫したビューを確保するために、信頼性の高い、ガバナンスの効いたセマンティック・モデルを開発および提供します。複雑なデータを、使い慣れた一貫性のあるビジネス用語にマッピングします。最適化され、実行のために微調整されたクエリを設計します。

セマンティック・モデルは、物理レイヤーから始まり、論理レイヤー、プレゼンテーション・レイヤーへと続く3つのレイヤーで構成されています。物理レイヤーは、組織の物理的なデータ・ソース・システムをマッピングし、多くの場合IT部門によって構成および管理されます。論理レイヤーは、ビジネス上の計算、階層、複数のデータ・ソースの論理レポート領域へのマッピングを構築するために使用されます。例えば、ERPシステムとデータウェアハウスは、財務レポート分野で一緒にマッピングすることができます。プレゼンテーション・レイヤーは、ユーザーが分析ストーリーを作成するために利用可能な属性と指標を提示する方法です。すべてのデータは一貫して計算されますが、そのデータに対するユーザーの特定のビューは、セキュリティ・アクセスと権限に基づいてフィルタリングされます。

図1: セマンティック・モデリング・ツールでのデータ系統の確認

セマンティック・モデルは、JDBCソースとしてサードパーティの可視化ツール(Tableau、Power BI、またはカスタム・アプリケーションなど)からも見ることができます。これにより、一部のビジネス・グループが異なる可視化ツールを選択した場合でも、企業指標は一度定義するだけで済み、企業内のすべてのレポート・プラットフォームにわたり一貫性が保たれます。

セマンティック・レイヤーの詳細


セルフサービスのデータ・モデリング

セルフサービスにより、2つ以上のテーブルを直接結合し、内部結合や外部結合などの相互関係を制御できます。セルフサービスのデータモデルをチームと簡単に共有できます。

マルチテーブル・データセットのデモを見る(2:57)


図2: セルフサービスのデータ・モデリング

セルフサービスのデータ・モデリングについての詳細

データの拡張と推奨

データセットは、追加データ、属性、変換で拡張できます。組み込みの参照ナレッジには以下が含まれます。

  • グローバル・ポジショニング・システムの強化:
    都市や郵便番号の緯度と経度を参照します。
  • 参照ベースの強化:
    性別判定を定義する属性として、個人のファーストネームを使用して性別を指定します。
  • 列の連結:
    個人の姓と名を1つの列に連結します
  • 部品抽出:
    住所の番地から番地を分離します。
  • セマンティック抽出:
    メール・アドレスからドメインなどの認識されたセマンティック・タイプから情報を抽出します。
  • 日付部分抽出:
    月/日/年(または日/月/年)形式を使用する日付から曜日を抽出し、データを可視化してより役立てやすくします。
  • 完全および部分的な不明瞭化:
    クレジットカード番号や社会保障番号などの検出された機密性の高いフィールドをマスクします。
  • 一般的な推奨事項:
    検出された機密性の高いフィールドを含むカラムを削除します。
  • カスタム・ナレッジ・エンリッチメント:
    管理者がOracle Analyticsに追加したカスタムな包含内容を活用します。

図3: カスタム参照ナレッジの構成

セマンティック・モデラー・マークアップ言語(SMML)

データ・モデルの開発者は、Webベースのグラフィカル・ツールを使ってセマンティック・モデルを構築、編集、調整することができます。しかし、別のアプローチとして、セマンティック・モデラー・マークアップ言語(SMML)を使ってプログラムでモデルを修正することもできます。SMMLは、デザインタイムのセマンティック・モデルのオブジェクトを記述するJSONベースのマークアップ言語です。各SMMLファイルは、セマンティック・モデルのオブジェクトを表します。SMMLファイルは、メタデータの移行、プログラムによるメタデータの生成と操作、メタデータのパッチ適用、その他の機能に使用することができます。つまり、開発者はSMML定義に直接テキスト変更を加えるだけで、セマンティック・モデルのコードを直接編集したり、他のプログラムによるプロセスを通じて変更を加えることができます。


図4: JSONベースのセマンティック・モデラー・マークアップ言語(SMML)

マルチユーザー・モデル開発とGit統合

セマンティック・モデラーは、GitHub、GitLab、Oracle Visual Builder上のGitなどのGit互換リポジトリと統合して、シームレスで協力的なマルチユーザー開発環境とソース管理を提供します。マルチユーザー開発のためのGit統合は、ブランチ、マージ、プル、プッシュ操作をサポートし、セマンティック・モデルの開発ライフサイクルを完全に可視化します。


図5: Git統合によるマルチユーザー開発