Top Banner
60

分布式数据库系统及其应用

Jan 03, 2016

Download

Documents

cheyenne-kirk

分布式数据库系统及其应用. 课 程 目 标. 通过本课程的学习,使得同学们对分布式数据库学科的重要技术不仅知其然,更要知其所以然。 掌握分布式数据库系统的理论、结构、技术和方法。 了解实现分布式数据库的关键和难点。 认清数据库学科的发展趋势和前景。 能够设计和开发简单的分布式数据库系统。 为今后从事分布式数据库研究和应用打下良好的专业基础。. 课 程 内 容( 1 ). 教材: 邵佩英: 《 分布式数据库系统及其应用 》 (第 2 版),科学出版社,北京, 2005. ● 课程讲授( 32 学时). 第 1 章 分布式数据库系统概述 - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 分布式数据库系统及其应用
Page 2: 分布式数据库系统及其应用

• 通过本课程的学习,使得同学们对分布式数据库学科的重要技术不仅知其然,更要知其所以然。

• 掌握分布式数据库系统的理论、结构、技术和方法。

• 了解实现分布式数据库的关键和难点。• 认清数据库学科的发展趋势和前景。• 能够设计和开发简单的分布式数据库系统。• 为今后从事分布式数据库研究和应用打下良好的

专业基础。

课 程 目 标课 程 目 标

Page 3: 分布式数据库系统及其应用

课 程 内 容(课 程 内 容( 11 ))

• 第 1 章 分布式数据库系统概述• 第 2 章 分布式数据库系统的设计• 第 3 章 分布式数据库中的查询处理和优化• 第 4 章 分布式数据库中的事务管理和恢复• 第 5 章 分布式数据库中的并发控制• 第 6 章 分布式数据库中的可靠性 • 第 7 章 分布式数据库的安全性与目录管理 • 第 8 章 分布式数据库与客户机 / 服务器模式• 第 9 章 分布式数据库与 WWW 数据库和移动数据库• 第 10 章分布式数据库系统的发展趋势

● 课程讲授(课程讲授( 3232 学时)学时)

教材:教材:邵佩英:邵佩英:《《分布式数据库系统及其应用分布式数据库系统及其应用》》(第(第 22 版),科学出版社,北京,版),科学出版社,北京, 20052005

Page 4: 分布式数据库系统及其应用

课 程 内 容(课 程 内 容( 22 ))

● 集体上机操作(约 10 学时)

•练习 Oracle 10g 数据库基本操作• 大作业之实验项目的分析和编程实验

Page 5: 分布式数据库系统及其应用

参 考 书 籍(参 考 书 籍( 11 ))

Oracle 相关图书与资料……

Principles of Distributed Database Systems

(分布式数据库原理(第 2 版)) M.Tamer Ozsu,Patrick Valduriez

Prentice Hall & Tsinghua University Press,2002.

……

Page 6: 分布式数据库系统及其应用

考核方式考核方式

1. 大作业之实验项目( 20% )2. 最后闭卷考试( 80% )

Page 7: 分布式数据库系统及其应用

1.数据库系统知识回顾

2.计算机网络知识回顾

3.分布式数据库系统的由来和发展

4.分布式数据库系统的定义和分类

5.分布式数据库系统的体系结构和组成部分

6.分布式数据库系统中数据的独立性与分布透明性

7.分布式数据库系统的优点和存在的技术问题

分布式数据库系统概述 第 1 章

Page 8: 分布式数据库系统及其应用

数据库系统知识回顾

数据库(DB:DataBase)

长期储存在计算机内的有组织的、可共享的相关数据的集合。

数据库管理系统(DBMS:DataBase Management System)

DBMS 是介于用户与操作系统之间的一层数据管理软件。为用户或应用程序提供访问 DB 的方法,包括 DB 的建立、查询、更新及各种数据控制。 DBMS 基于某种数据模型。

数据库系统(DBS:DataBase System)

数据库系统(数据库系统( DBSDBS )通常是指带有数据库的计算机应用系统。)通常是指带有数据库的计算机应用系统。包括数据库、相应的硬件、软件和各类人员。包括数据库、相应的硬件、软件和各类人员。

数据库技术 硬件操

作 系统

D

BM

S

用软 件

用 程序

数据库系统软硬件层次关系

数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科;是一门综合性较强的学科。

1

基本概念1.1

Page 9: 分布式数据库系统及其应用

1 数据库系统知识回顾

DBMSDBMS

数 数 据 据

库库

系统分析员系统分析员

应用程序员应用程序员

最终用户 最终用户 22

最终用户 最终用户 11

最终用户 最终用户 33

应用程序员应用程序员 应用程序员。存取数据库中的大量数据,或编写程序应用程序员。存取数据库中的大量数据,或编写程序来存取并处理数据库中的数据。来存取并处理数据库中的数据。

最终用户 最终用户 通过终端设备,使用简便的查询命令来存取数据库中通过终端设备,使用简便的查询命令来存取数据库中的数据。的数据。

数据库管理员 数据库管理员 全面负责建立、维护和管理数据库系统全面负责建立、维护和管理数据库系统

数据库管理员数据库管理员

DBMSDBMS 设计和实现者设计和实现者 数据库系统工具开发者数据库系统工具开发者 操作员和系统维护人员操作员和系统维护人员

数据库设计者数据库设计者 数据库系统用户1.2

Page 10: 分布式数据库系统及其应用

1 数据库系统知识回顾数据抽象1.3

1. 视图抽象——外模式

2. 概念抽象——概念模式

3. 物理抽象——内模式

概念模式概念模式

内模式内模式

现实世界现实世界视图抽象视图抽象

概念抽象概念抽象

物理抽象物理抽象

外模式 视图视图 22视图视图 11 视图视图 33……

Page 11: 分布式数据库系统及其应用

1. 数据库系统知识回顾数据间的联系1.4

• 一对一的联系,记为 1 1﹕

• 一对多的联系,记为 1 n﹕

• 多对多的联系,记为 m n﹕

实体联系类型实体联系类型

1. 实体内部联系

2. 实体之间的联系 同一实体型的实体之间的联系 不同实体型的实体之间的联系

Page 12: 分布式数据库系统及其应用

E-R 模型模型 实体联系模型( Entity Relationship Model )。该模型直接从现实世界中抽象出实体类型及实体间联系,然后用 E-R 图表示的数据模型。

在信息世界中建立的,完全不涉及信息在计算机系统中的表示(独立 子计算机系统)的数据模型,称为概念数据模型,简称概念模型。 最典型的是“实体联系模型”即 E-R 模型。

实体名实体名

属性名属性名

E-R 图的四个基本成分:

矩形框表示实体型

椭圆形表示属性

菱形表示联系联系名联系名

连接实体型与联系类型,也可用于表示实体与属性的联系并注明种类;对构成码的属性,在属性名下画一横线表示。

nn

课 程课 程

成 绩成 绩选 选

修 修

mm

学号学号

姓名姓名

学 生学 生

1 数据库系统知识回顾1.5 E-R 模型

Page 13: 分布式数据库系统及其应用

例:学生选修课程

学生 课程选修

姓名 学号 系别 课程号 课程名 学分

成绩

用矩形表

示实体

用椭圆表示实体的属性

用无向边把实体与其属性连接起来

用菱形表示实体间的联系

实体与联系用线段连接并注明类型

m n

1 数据库系统知识回顾1.6 E-R 模型示例

Page 14: 分布式数据库系统及其应用

数据库系统知识回顾数据模型 (Data Model)

1

1.7

● ● 数据结构 ● ● 数据操作 ● ● 完整性约束

用于描述系统的静态特性;是所研究的对象类型( Object type )的集合,包括:数据的类型、内容和性质的对象(事物);数据之间联系的对象(联系)。

数据模型的三要素

1. 数据结构:

是一组完整性规则(条件)的集合。给出数据及其联系所具有的制约、依赖和存储规则,用于限定数据库的状态和状态变化,保证数据库中的数据的正确、有效、完全和相容。

3. 完整性约束( Integrity Constraint ):

用于描述系统的动态特性,是对数据库中的各种对象的实例(值)允许执行的操作的集合。主要有查询和更新(插入、删除、修改)两类操作。

2. 数据操作( Data Manipulation ) :

Page 15: 分布式数据库系统及其应用

3. SQL( Structured Query Language )

是一种综合 DDL和 DML 的数据库语言

用来表示用户对数据库的操作请求,主要有以下操作:查询、插入、删除和修改。包括两类语言:过程性语言( 数据库中什么数据,如何搜索这些数据都要说明)和非过程性语言(只说明数据库中的什么数据)。

2. 数据操纵子语言( Data Manipulation Language )

数据库语言1.8

包括数据库模式定义和数据库存储结构与存取方法定义两个方面,相应的程序也包括两部分:一部分是数据库模式定义处理程序,一部分是存储结构和存储方法定义处理程序。

1. 数据定义子语言( Data Description Language )

数据库系统知识回顾1

Page 16: 分布式数据库系统及其应用

1.9

数据库系统结构

数数 库库据据

应用程序应用程序 应用程序应用程序 应用程序应用程序

外模式 外模式 AA 外模式 外模式 BB

外模式 外模式 / / 模式 模式

概念模式 概念模式

模式 模式 / / 内模式内模式

用户级数据库用户级数据库

概念级数据库概念级数据库

物理级数据库物理级数据库

DBMDBMSS

OSOS 内模式 内模式

数据库系统知识回顾1

Page 17: 分布式数据库系统及其应用

1.模式: 也称为概念模式,是数据库全体数据的全局逻辑结构和特征的描述。

2.外模式: 是关于用户数据的局部逻辑结构和特征的描述,是模式的逻辑子集。

3.内模式: 是数据库数据的物理结构和存储结构的描述。

4.模式 / 内模式映象: 该映象存在于模式与内模式之间,用于定义模式与内模 式之间的对应性。本映象一般在内模式中描述。5.外模式 / 模式映象: 该映象存在于外模式与模式之间,用于定义外模式和模 式之间的对应性。本映象一般在外模式中描述。

在数据库系统的三级模式结构中,存在模式 / 内模式的映 象,当内模式发生变化时,只要修改模式 / 内模式的映象,就可以保持模式不变,从而保证程序与数据的物理独立性。

6.物理独立性:

在数据库系统的三级模式结构中,存在外模式 / 模式的映象,当模式发生变化时,只要修改外模式 / 模式的映象,即可保持外模式不变,从而保证程序和数据的逻辑独立性。

7.逻辑独立性:

1.9

数据库系统结构数据库系统知识回顾1

Page 18: 分布式数据库系统及其应用

传统的集合运算

1.10 关系代数

• 并运算• 差运算• 交运算• 广义笛卡尔积

cba

agb

dbc

fad

R S∪

fad

R∩S

dbc

cba

R-S

dbc

fad

cba

CBA

fad

agb

FEDR S

CBA

fad

cba

cba

dbc

dbc

fad

FED

fad

fad

agb

agb

fad

agb

R x S

数据库系统知识回顾1

Page 19: 分布式数据库系统及其应用

选择运算是从关系中选取使公式为真的元组。这是从行的角度进行的运算。

在关系 R 中选择满足给定条件的元组,记做: σF (R) ={ r | r R ∈ Λ F(r)=‘ 真’ } F 是一个公式,表示形式为由逻辑运算符(∧ , ,∨ ٦)连接各算术表达式组成。算术表达式的基本形式为: XθY. θ ={>, ≥ ,<, ≤ ,=, ≠} .X,Y 是属性名或常量或简单函数。

例 1 求计算机科学系 CS 的学生σ SD=‘CS’ (S)

学号 学生姓名 所属系名 学生年龄 S# SN SD SA S1 A CS 20 S2 B CS 21 S3 C MA 19 S4 D CI 19 S5 E MA 20 S6 F CS 22

(a)

(S)(S’)

S# SN SD SA S1 A CS 20 S2 B CS 21 S6 F CS 22

σ SD=‘CS’ (S)

• 选择运算

Page 20: 分布式数据库系统及其应用

• 投影运算

这是从列的角度进行的运算。

例 2 πSN,SD (S) 即求得学生关系 S 在学生姓名和所在系这两个属性上的投影结果。

πSN,SD (S)学号 学生姓名 所属系名 学生年龄 S# SN SD SA S1 A CS 20 S2 B CS 21 S3 C MA 19 S4 D CI 19 S5 E MA 20 S6 F CS 22

(a)

(S)

SN SD A CS B CSC MAD CIE MAF CS

关系 R 上的投影是从 R 中选择若干属性组 A 组成新的关系。记做: πA (R) ={ r[A] | r R∈ }投影之后不仅取消了某些列,还可能取消某些元组。

πSA (S)

SA202119

Page 21: 分布式数据库系统及其应用

连接运算是从两个关系的笛卡尔积中选取属性间满足一定条件的元组。记做: R S. 其中, F 是条件表达式,它涉及到对两个关系中的属性的比较。如果 F仅仅是一个相等条件,即等值连接。

• 连接运算

∞ F

例 3 设关系 R、 S如下图:

2b5

2b3

10b3

7b2

3b1

EBS

12b4a2

8b3a2

6b2a1

5b1a1

CBAR

R S ∞ C<E

10b38b3a2

10b36b2a1

7b26b2a1

10b35b1a1

7b25b1a1

ES.BCR.BA

A B C Ea1 b1 5 3 a1 b2 6 7a2 b3 8 10a2 b3 8 2

R S ∞

Page 22: 分布式数据库系统及其应用

DATABASE TABLE

CREATE VIEW INDEX

SQL DDL :ALTERDROP

SQL QUERY: SELECT … FROM …INSERT …

SQL SQL DML : UPDATE …DELETE …GRANT

SQL DCL : REVOKEAUDIT

嵌入式 SQL :

1.11 SQL 组成(分类)数据库系统知识回顾1

Page 23: 分布式数据库系统及其应用

数据库系统知识回顾

1. 数据库建设是硬件、软件和干件 ( 技术与管理的界面称为干件 ) 的结合。“三分技术,七分管理,十二分基础数据”是数据库建设的基本规律

2. 结构(数据)设计应该和行为(处理)设计密切结合,也就是说,整个设计过程中要把数据库结构设计和对数据的处理设计(应用系统功能设计)密切结合起来。

1

数据库设计 应用系统设计

现实世界

数据分析

概念模型设计

逻辑数据库设计

物理数据库设计

子模式设计

建立数据

功能分析

功能模型 功能说明

事务设计

程序说明

应用程序设计

程序编码调试

结构和行为分离的设计

1.12 数据库设计

Page 24: 分布式数据库系统及其应用

1. 1NF

• 定义 如果一个关系模式的所有属性都是不可分的基本数据项,则R 1NF∈ 。

• 任何一个关系模式都是 1NF ,不满足第一范式的数据库模式不能称为关系数据库。

2. 2NF

• 定义 若关系模式 R lNF∈ ,并且每一个非主属性都完全函数依赖于 R的键(或码),则 R 2NF∈ 。

• 2NF 就是不允许关系模式的属性之间有这样的函数依赖 X→Y ,其中 X 是键的真子集, Y 是非主属性。显然,键只包含一个属性的关系模式如果属于 1NF ,那么它一定属于 2NF 。

3. 3NF

• 定义 如果关系模式 R 中不存在候选键 X 、属性组 Y 以及非主属性 Z( ZY ),使得 X→Y, Y→Z, Y→X 成立,则 R 3NF∈ 。

数据库系统知识回顾1

1.13 关系模式范式

Page 25: 分布式数据库系统及其应用

2.1 基本概念2 计算机网络知识回顾

计算机网络:定义为相互联接、彼此独立的计算机系统的集合。相互联接指两台或多台计算机通过信道互连,从而可进行通信;彼此独立则强调在网络中,计算机之间不存在明显的主从关系,即网络中的计算机不具备控制其他计算机的能力,每台计算机都具有独立的操作系统。

H1

H4

H3

H2

R

通信子网

链路H:主机R:路由器

计算机网络的组成:通信子网和资源子网

计算机网络的功能:1.数据通信 ( 1 )传输文件 ( 2 )使用电子邮件( E-mail ) 2.资源共享 ( 1 )共享硬件资源 ( 2 )共享软件资源 ( 3 )共享数据资源。 3.提高计算机系统的可靠性和可用性4.易于进行分布处理

Page 26: 分布式数据库系统及其应用

2.2 计算机网络分类2 计算机网络知识回顾

一、按地理范围分类 1.局域网( Local Area Network ) 特点 :(1) 采用的传输介质类型相对较少。 (2) 数据传输速率快。 (3) 传输延迟小,且误码率较低。 (4) 组网比较灵活、方便、成本较低。

2.城域网( Metropolitan Area Network 一般不超过几十公里) 特点: (1) 采用的传输介质相对要复杂。 (2) 数据传输速率次于局域网。 (3) 数据传输距离相对局域网要长,信号容易受到干扰。 (4) 组网比较复杂,成本较高。

3. 广域网( Wide Area Network, 最常见的就是 Internet ) 特点: (1) 传输介质复杂 (2) 数据传输速率较低 (3) 采用的技术比较复杂 (4) 是一个公共的网络,即不属于一个机构或国家。

Page 27: 分布式数据库系统及其应用

2.2 计算机网络分类2 计算机网络知识回顾

二 . 按通信介质分1. 有线网络:网络中的通信介质全部为有线介质的网络,常见的介质有同轴电缆、双绞线、光缆、电话线等。其特点是:

(1)技术成熟;(2)产品较多;(3)实施方便;(4)成本较低;(5)受气候环境的影响较小。

2. 无线网络:采用无线电波、卫星、微波、红外线、激光等无线形式来传输数据的网络,即网络中的节点之间没有线缆的连接。

优点:( 1 )高移动性;( 2 )保密性强;( 3 )抗干扰性好;( 4 )架设与维护容易;( 5 )支持移动计算机

缺点:( 1 )技术发展较慢;( 2 )费用较高;( 3 )易受环境因素的影响;( 4 )安装实施要求的技术高。

Page 28: 分布式数据库系统及其应用

三 . 其他分类方法

1.按使用网络的对象来分 公用网络它是为全社会所有的人提供服务的网络。 专用网络它只为拥有者提供服务,一般不向本系统以外的人提供服务。2.按网络的连接方式来分 (1) 全连通型网络 全连通型网络是指所有节点之间的相互通信均可通过相邻的节点实现,

可靠性最好。 (2) 交换型网络 交换型网络两个端节点之间可以通过中间节点(即转接节点)实现连

接。 ( 3 )广播型网络。 3.按照通信子网的交换方式 按照通信子网的交换方式不同,网络可分为公用电路交换网、报文交换网、分组交换网、 ATM交换网等。

2.2 计算机网络分类2 计算机网络知识回顾

Page 29: 分布式数据库系统及其应用

2.3 计算机网络拓扑结构2 计算机网络知识回顾

1.星型结构 星型拓扑结构即任何两节点之间的通信都要通过中心节点进行转发,中心节点通常是集线器。

特点:(1) 结构简单、便于集中控制和管理(2)网络易于扩展(3)故障检测和隔离方便(4)延迟时间小(5)传输误码率低⑹中心节点负担重 ⑺网络脆弱

Page 30: 分布式数据库系统及其应用

2. 总线型结构 总线型网络是将若干个节点平等地连接到一条高速公用总线上的网络。

特点: (1) 结构简单灵活,便于扩充。 (2) 可靠性高 (3) 网络节点响应速度快 (4) 易于布线,成本较低。 (5) 实时性差 ⑹ 物理安全性差 ⑺ 故障诊断困难

2.3 计算机网络拓扑结构2 计算机网络知识回顾

Page 31: 分布式数据库系统及其应用

3 环型结构 环型结构的网络指网络中的每个节点均与下一个节点连接,最后一个节点 与第一个节点连接,构成一个闭合的环路

特点: (1) 网络结构简单(2)路径选择的控制得到简化(3) 扩充不方便 (4) 环上节点过多时,传输效率严重

下降。(5) 当环中某一节点出现故障时整个网络将瘫痪,查找故障点不易。

2.3 计算机网络拓扑结构2 计算机网络知识回顾

Page 32: 分布式数据库系统及其应用

4. 树型结构 树形结构是由星型结构演变而来的。其实质是星型结构的层次堆叠特点: (1) 扩展方便。 (2) 故障隔离容易。 (3) 高层节点性能要求高。

2.3 计算机网络拓扑结构2 计算机网络知识回顾

Page 33: 分布式数据库系统及其应用

5. 网状结构 网状结构是由星型、总线型、环型演变而来的,是前三种基本拓扑混合应用

的结果。

2.3 计算机网络拓扑结构2 计算机网络知识回顾

Page 34: 分布式数据库系统及其应用

分类 缩写 分布距离(近似)

典型覆盖地域 传输速率

局域网 LAN

数十米 房间

4Mbps~ 2Gbps数百米 楼宇

数千米 校园

城域网 MAN 数 10千米 城市 50Kbps~100Mbps

广域网 WAN—

城市、国家、洲或全球

9.6Kbps~45Mbps

因特网 Internet

2.4 计算机网络工作模式2 计算机网络知识回顾

Page 35: 分布式数据库系统及其应用

Intranet提供的服务主要有:1.WWW 服务WWW即World Wide Web ,又称“万维网”它是互联网上集文本、声音、图像、视频等多种媒体信息于一身的信息服务系统。

2.电子邮件服务即 E-mail ,以电子方式传递。只要通信双方都有电子邮件地址,便可以交互往返邮件。

3.DNS 服务DNS 服务用来解析域名与 IP地址之间的转换工作4.FTP 服务文件传输协议 FTP( File Transfer Protocol )把客户的请求告诉服务器,并将服务器发回的结果显示出来。

5. 数据库服务传统的数据库分为集中式数据库和分布式数据库两种。( 1 )集中式数据库集中式数据库是以系统共享主存储器为特征。(2)分布式数据库分布式数据库主要用于网络系统,特别适合于网络管理信息系统

2.5 Intranet/Internet服务2 计算机网络知识回顾

Page 36: 分布式数据库系统及其应用

3.1 分布式数据库的由来3 分布式数据库的由来和发展

1. 计算机平台环境的改变( P.1 )• 卫星通信• 蜂窝通信• 局域网• 广域网• Intranet

• Internet

2. 信息系统应用需求( P.1 )• 地域上分散、管理集中的企业越来越多• 既要求实现本地数据管理,就要求存取异地的数据

• 既要有各部门的局部控制和分散管理;又要有整个组织的全局控制和高层次的协同管理

Page 37: 分布式数据库系统及其应用

3.2 分布式数据库的发展3 分布式数据库的由来和发展

1. 分布式数据库发展阶段( P.2 )• 20 世纪 70年代末期——产生• 20 世纪 80年代——成长阶段• 20 世纪 90年代——商品化应用阶段• 21 世纪——大规模应用阶段

2. 分布式数据库系统的 12条规则( P.2 )• 本地自治性• 不依赖于中心节点• 可连续操作性• 位置独立性• 数据分片独立性• 数据复制独立性

• 分布式查询处理• 分布式事务处理• 硬件独立性• 操作系统独立性• 网络独立性• 数据库管理系统独立性

Page 38: 分布式数据库系统及其应用

4.1 分布式数据库的定义和特点4 分布式数据库系统的定义和分类

1. 分布式数据库定义( P.4 ):物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。

2. 分布式数据库系统的特点( P.4~5 )• 物理分布性:数据不是存放在一个站点上• 逻辑整体性:是与分散式数据库系统的区别• 站点自治性:是与多处理机系统的区别• 数据分布透明性• 集中与自治相结合• 存在适当的数据冗余度• 事务管理的分布性

Page 39: 分布式数据库系统及其应用

4.1 分布式数据库的定义和特点4 分布式数据库系统的定义和分类

DB1 DB2

DB3

全局用户 1

局部用户 1

全局用户 2

局部用户 2

全局用户 3

局部用户 3

网络

DDBMS DBMS1

DDBMS DBMS2

DDBMS DBMS3

分布式数据库系统示意图( P.6 )

Page 40: 分布式数据库系统及其应用

4.2 分布式数据库的分类4 分布式数据库系统的定义和分类

1. 按局部 DBMS 的数据模型分类( P.7 )

• 同构型 DDBS

• 同构同质型

• 同构异质型

• 异构型 DDBS

2. 按 DDBS 的全局控制类型分类( P.8 )• 全局控制集中型 DDBS :全局控制机制和全局数据词典位于中心站点• 全局控制分散型 DDBS :全局控制机制和全局数据词典分散在网络的

各个站点上。• 全局控制可变型 DDBS :也称主从型 DDBS 。分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。

Page 41: 分布式数据库系统及其应用

5.1 分布式数据库系统的体系结构5 分布式数据库系统的体系结构和组成成分

分布式数据库系统的体系结构( P.9 )

GDBMS

LDBMS

LDD

全局用户

局部用户网络

CM

LDB

GDD GDB

全局用户

GDD GDB

局部用户

GDBMS

LDBMS

LDD

CM

LDB

GDBMS

LDBMS

CM全局用户

GDD GDB

局部用户

LDD LDB

Page 42: 分布式数据库系统及其应用

1. 数据( P.9 )

分布式数据库的主体

• 局部数据:只提供本站点的局部应用所需要的数据。

• 全局数据:虽然物理上存储在个站点上,但是参与全局应用。

2. 数据目录( P.9 )

数据结构的定义、全局数据的分片、分布、授权、事务恢复等描述• 局部数据目录:局部站点上的数据词典• 全局数据目录:提供全局数据的描述和管理相关信息

5.2 分布式数据库系统的组成成分5 分布式数据库系统的体系结构和组成成分

Page 43: 分布式数据库系统及其应用

1. 数据分片( P.10 )

又称数据分割、数据分段,局部数据库是由全局数据库分割而成

• 水平分片(对全局关系施加选择运算)

• 垂直分片(对全局关系施加投影运算)

• 混合分片(两种方法的混合)

数据分片要准守的原则:

• 完备性原则:要把所有的数据映射到各个片断中

• 可重构原则:关系分片后的各个片断可重构整个关系

• 不相交原则:关系分片后的各个片断不能重叠

5.3 DDBS 中数据的分片与分布5 分布式数据库系统的体系结构和组成成分

Page 44: 分布式数据库系统及其应用

2. 数据分布( P.11 )

根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上

• 集中式(安排在同一站点上)

• 分割式(分布在不同站点上)

• 复制式(每个站点都有一个副本)

• 混合式(分割和复制式的混合)

5.3 DDBS 中数据的分片与分布5 分布式数据库系统的体系结构和组成成分

Page 45: 分布式数据库系统及其应用

分布式数据库是多层的,国内分为四层:

• 全局外层:全局外模式

• 全局概念层:全局概念模式、分片模式和分配模式

• 局部概念层:局部概念模式(例 1.4, p14 )

• 局部内层:局部内模式

5.4 分布式数据库的模式结构5 分布式数据库系统的体系结构和组成成分

Page 46: 分布式数据库系统及其应用
Page 47: 分布式数据库系统及其应用

分布式数据库

的模式结构( P.12 )

5.4 分布式数据库的模式结构5 分布式数据库系统的体系结构和组成成分

全局外模式

全局概念模式

分片模式

分配模式

局部概念模式

局部内模式

DB

局部概念模式

局部内模式

DB

全局外模式 全局外模式

全局DBMS

局部DBMS

分布式数据库特有的

集中式数据库也有的

映象 1

映象 3

映象 2

映象 4

Page 48: 分布式数据库系统及其应用

联邦数据库系统

Page 49: 分布式数据库系统及其应用

多数据库系统

Page 50: 分布式数据库系统及其应用

除集中式数据库的基本功能, DDBMS必须提供的附加功能:

• 数据跟踪:利用日志记录数据分布、分片和复制的能力

• 分布式查询处理:通过网络查询远程站点数据,站点间传送数据和请求

• 分布式事务处理:为分布式查询和更新等操作设计执行策略

• 复制数据的管理:故障后数据恢复的管理

• 安全性:用户授权 / 存取权限的安全管理

• 分布式目录管理

DDBMS功能模块 : 查询处理、完整性处理、调度处理、可靠性处理

5.5 分布式数据库管理系统的功能5 分布式数据库系统的体系结构和组成成分

Page 51: 分布式数据库系统及其应用

DDBMS 的一般功能结构( P.17 )

5.5 分布式数据库管理系统的功能5 分布式数据库系统的体系结构和组成成分

用户查询

查询分析

优化算法

查询处理模块

调度处理模块

CM

LDBMS

DB

可靠性处理模块

完整性处理模块

系统DD

网络

分布策略

需要的数据

实际的数据

数据定位

错误

对网络的监视信息

局部处理命令

数据

Page 52: 分布式数据库系统及其应用

DDBMS 的

一种参考模型( P.18 )

5.6 DDBMS 的一种参考模型5 分布式数据库系统的体系结构和组成成分

全局数据库控制和通讯系统

数据处理器 1

数据库 1

数据处理器 n

数据库 n

用户处理器 1 用户处理器 n

用户结果 用户命令 用户结果 用户命令

规范化数据 规范化命令 规范化数据 规范化命令

规范化数据 规范化命令 规范化数据 规范化命令

用户 用户

Page 53: 分布式数据库系统及其应用

用户处理器的组成( P.19 )

5.6 DDBMS 的一种参考模型5 分布式数据库系统的体系结构和组成成分

用户结果格式化器

用户命令翻译器

约束实施器

用户结果 用户命令

规范化数据 规范化命令

外部模式

概念模式

规范化命令

用户处理器

Page 54: 分布式数据库系统及其应用

数据处理器的组成( P.20 )

5.6 DDBMS 的一种参考模型5 分布式数据库系统的体系结构和组成成分

规范化结果格式器

规范化命令翻译器

运行时支持处理器

物理数据 物理命令

规范化数据 规范化命令

概念模式

内部模式

数据处理器

数据库

Page 55: 分布式数据库系统及其应用

全局数据库控制和通信子系统的组成( P.22 )

5.6 DDBMS 的一种参考模型5 分布式数据库系统的体系结构和组成成分

合并器 分布模式

分解器 合并器 分解器

分布式执行策略

分布式执行策略

规范化命令 规范化数据 规范化数据 规范化命令

规范化数据 规范化命令 规范化数据 规范化命令

全局数据库控制和通信系统

分布式执行监视器

通信子系统

本地执行监视器

分布模式

Page 56: 分布式数据库系统及其应用

1. 集中式数据库中的数据独立性( P.25 )

• 逻辑独立性

• 物理独立性

2. 分布式数据库中的数据独立性( P.25 )

• 逻辑独立性

• 物理独立性

• 分布独立性(分布透明性) , 分三个层次(图 1.3 中的映像):

分片透明性(完全分布透明性):映像 2

位置透明性(中级分布透明性):映像 3

局部数据模型透明性(低级分布透明性):映像 4

无分布透明性:异构数据

6.1 概述6 DDBMS 中数据的独立性与分布透明性

Page 57: 分布式数据库系统及其应用

6.2 DDBMS 简单查询分布透明性示例6 DDBMS 中数据的独立性与分布透明性

SUPPLIER(SNO,SNAME,CITY)

SUPPLIER1

SUPPLIER2

SUPPLIER2

SUPPLIER1

SUPPLIER2

SUPPLIER2

SUPPLIER1

SUPPLIER2

站点 1

站点 2

站点 3

站点 1

站点 2

站点 3

站点 1

站点 3

DDBMS

DDBMS

DDBMS

Read (terminal, $SNO);Select SNAME into $SNAMEFrom SUPPLIERWhere SNO=$SNO;Write (terminal, $SNAME).(a) 分段透明性 (级别 1)

Read (terminal, $SNO);Select SNAME into $SNAMEFrom SUPPLIER1

Where SNO=$SNO;If not # FOUND thenSelect SNAME into $SNAMEFrom SUPPLIER2

Where SNO=$SNO;Write (terminal $SNAME).(b) 位置透明性 (级别 2)

Read (terminal, $SNO);Select SNAME into $SNAMEFrom SUPPLIER1 AT SITE1Where SNO=$SNO;If not # FOUND thenSelect SNAME into $SNAMEFrom SUPPLIER2 AT SITE3

Where SNO=$SNO;Write (terminal $SNAME). (c) 本地映射透明性 (级别 3)

Page 58: 分布式数据库系统及其应用

1. 良好的可靠性和可用性( P.34 )

2. 提高系统效率,降低通信费用( P.34 )

3. 较大的灵活性和可伸缩性( P.35 )

4. 经济性和保护投资( P.35 )

5. 适应组织的分布式管理和控制( P.35 )

6. 数据分布具有透明性和站点具有较好的自治性( P.35 )

7.1 DDBS 的优点7 DDBS 的优点和存在的技术问题

Page 59: 分布式数据库系统及其应用

最重要的问题是通信网络速度问题

• 如何控制数据的分片、分布与冗余度( P.35 )

• 如何实现异构数据库的互联( P.36 )

• 如何优化分布式数据库的查询处理( P.36 )

• 如何更好地实现分布式数据库的更新处理( P.36 )

• 如何实现分布式数据库的并发控制机制( P.36 )

• 如何实现分布式数据库的恢复控制机制( P.36 )

• 如何实现目录管理( P.36 )

7.2 DDBS 中存在的技术问题7 DDBS 的优点和存在的技术问题

Page 60: 分布式数据库系统及其应用

总 结

• 数据库知识回顾

• 计算机网络知识回顾

• DDBS 由来和发展

• DDBS 基本概念和分类

• DDBS 体系结构和组成

• DDMS 中数据独立性和分布透明性

• DDMS 的优点和技术问题