基礎から始めるデータベース入門セミナー

第1回「そもそもデータベースってなんだろう」

日本オラクル株式会社
井上 学 (いのうえ まなぶ) 山田 真二郎(やまだ しんじろう)

データベースについて1から学びたいという方、一緒に勉強しませんか!!

「基礎からはじめるデータベースセミナー」は、データベースの知識を習得するためにまず何から始めたらよいのかと、書籍を探したりセミナー情報を検索したりしている方のためのセミナーです。これまでデータベースに触れたことの無かった方や、おもにメインフレームやオフコンを中心に扱ってきたためにオープンな環境で動くリレーショナル・データベースに携わった経験がない方たち、さらに営業職の方向けに、「そもそもデータベースって何だろう?」というところから始まり、リレーショナルデータベースのしくみとOracle Databaseのアーキテクチャを基本中の基本から学んでいただくことを目的としています。本日は、その初回の講義です。

講師
講師
生徒
生徒

目次

データベースとは何か?

最近ではあちらこちらで頻繁に耳にする「データベース」という言葉ですが、そもそも「データベース」とは一体どのようなものなのでしょうか。まずは手っ取り早く辞書を引いてみましょう。

「大辞林 第二版」には以下のように書かれています。
“コンピュータで、相互に関連するデータを整理・統合し、検索しやすくしたファイル。また、このようなファイルの共用を可能にするシステム。通信ネットワークなどを介した商業用データベース・サービスがおこなわれている。”

辞書とはいえ、「ファイル」という語には少し引っかかるものを感じるのですが、これは次回以降の講義で論じたいと思います。また、辞書によっては、データベースとはコンピュータに限ったものではなく紙などの他の媒体を介しているものも広義に含む場合もありますが、話が大きくなりすぎますので、今回は「コンピュータ上のデータベース」を前提として話を進めていきましょう。

あの、つまり、ここでは、データベースとは

  • (1) データを整理・統合して格納し、
  • (2) そのデータを検索・活用しやすくした(コンピュータ上に構築された)仕組み

という認識で正しいのでしょうか?

はい、その認識で結構かと思います。また、このように定義すると、データベースというのは単に「データの箱」または「収集場所」といったイメージになるのですが、ビジネスの上で「データを管理する」ということは、とても大事な役割を担うことになります。

データと情報の違い

ところで皆さんは、「データ」と「情報」の違いを理解していますか?「データ共有」「情報共有」など、データと情報を普段同じように使っているのではないでしょうか。

データとは、「客観的な事実を数値、文字、図形、画像、音声などで表したもの」のことをいいます。「今日の天気は雨です。」といったことや「Wendyカレンダーの在庫は5個です。」「A社の株価はXX円です。」といったことは、客観的事実、つまりデータです。

それに対し情報とは、“ある特定の目的について、適切な判断を下したり行動の意志決定をするために役立つ資料や知識(大辞林 第二版より)” を指します。

ある目的に役立つデータ、またはデータを元に加工されたものが情報と言えるのですね。

そのとおりです。先ほどの例で言えば、「今日の天気は雨か。傘を持っていこう。」「えっ、Wendyカレンダーはあと5個しかないの? じゃあ追加の発注をしておこう。」「A社の株価がXX円まで上昇したか。そろそろ売りだな。」というように、データに基づいて判断しアクションを起こす、場合によっては判断の結果何もしないという判断を下すことで、データには情報としての価値が生まれるのです。

つまりデータと情報は、似て非なるものということですね。同じデータを元にしても、ある人にとってそれはただのデータでしかなく、また他の人にとっては有益な情報となり得るという…。

はい、そう理解していただけると正しいかと。

ついでに質問です。データというと文字や数値がまず思い浮かびますが、最近では画像や動画もデータの1つと考えられるのではないでしょうか?

良い質問ですね。もちろん画像や動画もデータとしてデータベースに直接蓄積することができます。その目的は、単にデータを保存するだけではなく、データに情報としての価値をもたせ、有効に活用することなのです。

データの価値

では、情報としての価値があるのはどのようなデータなのでしょうか? 「価値があるデータ」「価値が無いデータ」について考えてみましょう。

正確性 まずは極めて当たり前のことですが、データは正確でなければなりません。皆さんも当然のことと思われるかもしれませんが、“データに基づいて判断する”上でこれはとても重要なことです。間違ったデータを情報として捉えた場合、当然間違ったアクションを起こす結果となってしまいます。たとえば、もし経営上の数字が不正確であったとしたら、経営陣は会社を間違った方向へと導いてしまう危険性があります。
整合性 データに正確さを求める際には、単に数値が正しいか否かだけではなく、“いつの時点のデータか”が重要になります。ビジネスのデータは刻々と変化していきます。「いつの時点での売上・在庫なのか」とか「いつの時点での価格なのか」といったように、常に“いつの時点でのデータか”ということを認識していないと、結果的に間違ったデータを情報として渡してしまうことになりかねません。これを「データの整合性」と呼びます。
スピード いくらデータが正確でも、タイムリーでないと意味がありません。たとえば、天気や株価をチェックするのに昨日の新聞を見ていたのでは、有益な情報とは言えません。データによっては“鮮度”が重要なものもあり、スピードが要求されます。
一元化 スピードは、単に速いコンピュータやネットワークだけで実現できるものではありません。前述したように、データが常に整理されて使いやすい状態で蓄積されているからこそ、容易に取り出して活用できるのです。
データベースの定義のところで「整理・統合」という言葉が出てきましたが、データがばらばらに存在していたのでは非常に使いづらいものになります。データは一箇所にまとめられて管理されている方が正確性も増し管理も容易になり、利用価値も高くなります。これを「データの一元化」と呼んでいます。
共有 「共有」というのは大事なキーワードです。データは、多くの人から情報として利用されることでその価値がさらに大きくなります。インターネットがその良い例でしょう。インターネットがここまで成長した理由の1つには、その「共有」の仕組みにあるのではないでしょうか。世界中の人たちが容易にアクセスでき、ニュースやさまざまな情報を参照することや、航空券、ホテル、チケットなどのオンライン予約が可能になりました。
しかし、裏を返せばインターネットにはそのような世界中からの急激なアクセスにも十分耐え得るだけの仕組みが必要です。もしある一定の時間帯は限られた人数しかニュースや株価を参照できないとしたら、ここまでインターネットが成長することもなかったでしょう。もちろん、そのような大規模な情報共有の仕組みを支えている技術の1つは、データベースであることは言うまでもありません。
セキュリティ 上記で述べたように、データは多くの人に使われることでその価値が増しますが、その反面、皆がデータにアクセスできるようになるとセキュリティも重要になってきます。最近では個人情報の漏洩といったニュースが世間を騒がせることも多くなってきています。いくら共有すべきだといっても、個人情報や会社の機密情報まで自由にアクセスできては困ります。つまり、データは必要な人のみがアクセスできるような仕組みに守られている必要があるのです。
容易性 データを情報として活用するためには、データを扱うことが容易である必要があります。データはそのままの状態で使われることもありますが、多くの場合は何らかの処理や加工をされて使用される場合がほとんどです。たとえば、同じデータでも帳票で取り出すこともあれば、グラフで表示することもあります。そういった場合、できるだけ手間をかけずにデータの操作ができると便利です。
可用性 必要な時にすぐにデータを取り出せないと、これは意味がないことになってしまいます。ある判断や行動を起こしたいときにデータを利用できないとなると、ビジネスのチャンスが不意になることもあります。たとえば、せっかくお客様から受注をいただいたのに、在庫があるかどうかその場でわからなかったため、急ぎのお客様は他の業者に発注してしまうといったケースも考えられるでしょう。

つまり、以上のことをまとめると、データを情報として価値のあるものとして活用するためには、

  1. 正確かつ整合性がとれていること
  2. スピードが満たせること
  3. 一元的に管理されていること
  4. 多くの人の間で共有できること
  5. 不正に使われないように守られていること
  6. 簡単に取り扱え、加工ができること
  7. 必要なときにいつでも取り出せること

が必要な条件になってきます。 これらの条件を満たしてこそ、目まぐるしく変わるビジネス環境のなかで、より価値のある使いやすい情報としてデータを利用することができるのではないでしょうか。

まとめ

さて、ずいぶん遠回りをしてきましたが、ここでまとめると、これまで語ってきたようなことがデータを管理するために求められる重要な要件であり、それらを満たすためにデータベースが開発され進化してきたといえると思います。

データベースとは、ビジネスの活動のなかでデータを蓄積し、そのデータを情報としての価値を最大限に活かせるようにするための重要な道具、またはインフラ基盤としての大変重要な役割を担っているのですね。なんとなくわかりました。

余談ですが、「データベース」を「データ・ベース」と区切らないでくださいね。最近は英語でもData BaseではなくDatabaseという一語になっています。辞書によっては「データ・ベース=データの基地」と書いてあるものもありますが、ちょっと格好悪いですね。

次回は、「ファイルシステム」と「データベース」の違いについてご説明します。

図1 データベースとは?
図1 データベースとは?

更にデータベースについて勉強したい方へ

いつでも好きな時間にオラクルの製品や技術について学んでいただけるように、オンデマンドコンテンツをご用意しています。「自分のペースで学習したい 」「日中のセミナーになかなか参加できない」といった方にお勧めです。日々の学習にお役立てください。

"基礎から始めるデータベース入門セミナー" インデックスに戻る

本記事は、「オラクル通信」の同名連載記事から抜粋し、一部に修正を加えたものです。

Copyright © 2010, Oracle Corporation Japan. All rights reserved.
無断転載を禁ず

この文書はあくまでも参考資料であり、掲載されている情報は予告なしに変更されることがあります。日本オラクル社は本書の内容に関していかなる保証もいたしません。また、本書の内容に関連したいかなる損害についても責任を負いかねます。

Oracleは米国Oracle Corporationの登録商標です。文中に参照されている各製品名及びサービス名は米国Oracle Corporationの商標または登録商標です。その他の製品名及びサービス名はそれぞれの所有者の商標または登録商標の可能性があります。