什么是数据库?

数据库的定义

数据库是结构化信息或数据的有序集合,一般以电子形式存储在计算机系统中。通常由数据库管理系统 (DBMS) 来控制。在现实中,数据、DBMS 及关联应用一起被称为数据库系统,通常简称为数据库。

为了提高数据处理和查询效率,当今最常见的数据库通常以行和列的形式将数据存储在一系列的表中,支持用户便捷地访问、管理、修改、更新、控制和组织数据。另外,大多数数据库都使用结构化查询语言 (SQL) 来编写和查询数据。

什么是结构化查询语言 (SQL)?

目前几乎所有的关系数据库都使用 SQL 编程语言来查询、操作和定义数据,进行数据访问控制。SQL 最初于 20 世纪 70 年代由 IBM 开发,当时 Oracle 是一个主要的贡献者,这推动了 SQL ANSI 标准的实施,而 SQL 的兴起也刺激了 IBM、Oracle 和 Microsoft 等公司开始全面扩张。时至今日,虽然 SQL 仍被广泛使用,但是新的编程语言也已经崭露头角。

数据库的发展历程

自 20 世纪 60 年代初诞生至今,数据库已经发生了翻天覆地的变化。最初,人们使用分层数据库(树形模型,仅支持一对多关系)和网络数据库(更加灵活,支持多种关系)这样的导航数据库来存储和操作数据。这些早期系统虽然简单,但缺乏灵活性。20 世纪 80 年代,关系数据库开始兴起;20 世纪 90 年代,面向对象的数据库开始成为主流。最近,随着互联网的快速发展,为了更快速地处理非结构化数据,NoSQL 数据库应运而生。现在,云数据库自治驾驶数据库在数据收集、存储、管理和利用方面正不断取得新的突破。

数据库与电子表格有何区别?

数据库和电子表格(例如 Microsoft Excel)都可以便捷地存储信息,两者的主要区别包括:

  • 存储和操作数据的方式
  • 谁可以访问数据
  • 可以存储多少数据

从一开始,电子表格就是专门针对单一用户而设计的,其特性也反映了这一点。它非常适合不需要执行太多高度复杂的数据操作的单一用户或少数用户。相反,数据库是为了保存大量甚至海量有组织的信息而设计的,它允许多个用户同时使用高度复杂的逻辑和语言,快速、安全地访问和查询数据。

数据库的类型

数据库有很多种,至于各种数据库孰优孰劣,主要取决于企业希望如何使用数据。

    关系数据库

  • 关系数据库在 20 世纪 80 年代成为了主流。在关系数据库中,项被组织为一组具有列和行的表。这为访问结构化信息提供了一种有效、灵活的方法。
  • 面向对象数据库

  • 面向对象数据库中的信息以对象的形式表示,这与面向对象的编程相类似。
  • 分布式数据库

  • 分布式数据库由位于不同站点的两个或多个文件组成。数据库可以存储在多台计算机上,位于同一个物理位置,或分散在不同的网络上。
  • 数据仓库

  • 数据仓库是数据的中央信息库,是专为快速查询和分析而设计的数据库。
  • NoSQL 数据库

  • NoSQL 或非关系数据库,支持存储和操作非结构化及半结构化数据(与关系数据库相反,关系数据库定义了应如何组合插入数据库的数据)。随着 Web 应用的日益普及和复杂化,NoSQL 数据库得到了越来越广泛的应用。
  • 图形数据库

  • 图形数据库根据实体和实体之间的关系来存储数据。
  • OLTP 数据库。OLTP 数据库是一种高速分析数据库,专为多个用户执行大量事务而设计。

这些只是目前投入使用的几十种数据库中的一小部分。另外还有许多针对具体的科学、财务或其他功能而定制的不太常见的数据库。除了不同的数据库类型之外,技术开发方法的变化以及云计算和自动化等重大进步也在推动数据库朝新的方向发展。一些最新的数据库包括

    开源数据库

  • 开源数据库系统是指源代码为开放源码的数据库系统,它可以是 SQL 或 NoSQL 数据库。
  • 云数据库

  • 云数据库指基于私有云、公有云或混合云计算平台的结构化或非结构化数据集合,可分为传统云数据库和数据库即服务 (DBaaS) 两种类型。在 DBaaS 中,管理和维护工作均由服务提供商负责。
  • 多模型数据库

  • 多模型数据库指的是将不同类型的数据库模型整合到一个集成的后端中,以此来满足各种不同的数据类型的需求。
  • 文档/JSON 数据库

  • 文档数据库专为存储、检索和管理面向文档的信息而设计,它是一种以 JSON 格式(而不是采用行和列)存储数据的现代方法。
  • 自治驾驶数据库

  • 基于云技术的自治驾驶数据库(也称作自治数据库)是一种全新的极具革新性的数据库,它利用机器学习技术自动执行数据库调优、保护、备份、更新,以及传统上由数据库管理员 (DBA) 执行的其他常规管理任务。

什么是数据库软件?

数据库软件旨用于创建、编辑和维护数据库文件及记录,帮助用户更轻松地执行文件和记录创建、数据录入、数据编辑、更新和报告等操作。除此之外,数据库软件还能处理数据存储、备份和报告以及多路访问控制和安全性等问题。随着当今数据盗窃日益频繁,数据库安全性已变得至为重要。数据库软件有时也称为“数据库管理系统” (DBMS)。

数据库软件支持用户以结构化形式存储数据然后访问数据,能够极大简化数据管理。它一般会提供图形界面来简化数据创建和管理,在某些情况下,用户可以使用数据库软件来自行构建数据库

什么是数据库管理系统 (DBMS)?

数据库通常离不开完备的数据库软件程序,也就是数据库管理系统 (DBMS)。DBMS 充当数据库与其用户或程序之间的接口,允许用户检索、更新和管理信息的组织和优化方式。此外,DBMS 还有助于监督和控制数据库,提供各种管理操作,例如性能监视、调优、备份和恢复。

常见的数据库软件或 DBMS 有 MySQL、Microsoft Access、Microsoft SQL Server、FileMaker Pro、Oracle Database 和 dBASE。

什么是 MySQL 数据库?

MySQL 是一种开源的基于 SQL 的关系数据库管理系统。它专门针对 Web 应用进行设计和优化,可以在任何平台上运行。互联网的兴起带来许多新的和不同的需求,MySQL 开始成为 Web 开发人员以及基于 Web 的应用的首选平台。它可以处理数以百万计的查询和数以千计的事务,因此深受那些需要进行大量资金转账的电商企业的欢迎。随需应变的灵活性是 MySQL 的一项主要特点。

目前全球许多顶级的互联网网站和基于 Web 的应用均采用 MySQL 作为 DBMS,例如 Airbnb、Uber、LinkedIn、Facebook、Twitter 和 YouTube。

使用数据库改善业务绩效和决策

物联网收集的海量数据正在改变各行各业和世界各地人们的生活,当今企业获得的数据比以往任何时候都多。除了满足基本数据存储和事务需求之外,高瞻远瞩的企业已经开始使用数据库来分析来自多个系统的大量数据。借助数据库和其他计算及商务智能工具,企业现在可以利用所收集的数据来更加有效地开展业务、做出更加明智的决策以及提高灵活性和可扩展性。如今,由于需要跟踪的数据量大大增加,企业需要优化数据访问和吞吐量,需要部署一个能够在企业发展过程中提供所需性能、可伸缩性和敏捷性的平台

自治驱动数据库将大大提升这些能力。自治驾驶数据库可以自动执行耗时耗力的手动流程,让业务用户投入更多时间,更有效地使用数据。用户可以直接控制数据库的创建和使用,在遵循重要安全标准的同时实现控制和自治。

数据库的挑战

如今,大型企业数据库一般都支持高度复杂的查询,同时用户也希望数据库能近乎实时地响应查询。因此,数据库管理员经常需要采用各种方法来帮助企业改善性能。他们面临的一些常见挑战包括:

  • 应对数据量的大幅增长。来自传感器、联网设备和许多其他来源的数据呈爆炸式增长,使数据库管理员忙于有效地管理和组织他们公司的数据。
  • 确保数据安全。如今数据泄露无处不在,黑客们的攻击手段层出不穷。在确保数据安全的同时让用户能够轻松访问数据比以往任何时候都更重要。
  • 满足不断变化的需求。在当今快速发展的商业环境中,企业需要能够实时访问其数据,以便于及时做出决策并抓住新机遇。
  • 管理和维护数据库与基础设施。数据库管理员需要持续监视数据库中的问题并开展预防性维护,以及应用软件升级和打补丁。随着数据库的日益复杂和数据量的日益增长,企业需要招聘更多的人员来监视和调优数据库,开销也随之增加。
  • 突破可扩展性限制。为了生存下去,企业需要不断谋求发展,而其数据管理也必须随之发展。然而,数据库管理员很难预测公司未来究竟需要多大的数据容量,尤其是在采用本地部署数据库的情况下。
  • 确保满足数据驻留、数据主权或延迟要求。某些企业的使用场景更适合使用本地部署应用。对此,理想方案是使用预配置、预优化的集成系统来运行数据库。

应对这些挑战是一项极耗时的任务,甚至可能会阻碍数据库管理员开展更具战略性的工作。

自治技术如何改进数据库管理?

自治驾驶数据库是未来的潮流,它让企业可以轻松使用先进的数据库技术而不必费心费力地去运行数据库技术和进行复杂操作。

自治数据库利用云技术和机器学习,自动执行管理数据库所需的各种日常任务,例如调优、安全性、备份、更新和其他日常管理任务。通过自动执行这些繁琐的任务,数据库管理员可以腾出时间去开展更具战略性的工作。自治数据库的自治驱动、自治安全和自治修复功能有望彻底改变数据的管理和保护方式,助力企业提升性能、降低成本、提高安全性。

数据库和自治数据库的未来

2017 年底,甲骨文公司宣布推出革新性的自治数据库。这一技术及其在计算领域的前景很快赢得了多家独立行业分析机构的认可。

Wikibon 2021 年报告 (PDF) 称赞了自治数据库技术。该报告指出,“Oracle 拥有迄今为止最出色的云数据库平台……。Wikibon 认为 Oracle 拥有行业领先的超强云数据库平台和自治数据库。”

KuppingerCole 2021 年领导力指南 (PDF) 指出,“Oracle Autonomous Database 可在不停机的情况下完全自动供应、管理、调优和升级数据库实例,不仅大幅提高了存储在 Oracle Database 中的敏感数据的安全性和合规性,而且还提供了将数据迁移至 Oracle Cloud 的有力论据。” 由于 Oracle Autonomous Database 基于高度可用和可扩展的 Oracle Exadata 架构而构建,因此用户可根据需求增长轻松扩展数据库部署。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。