武汉大学空间数据库复习

    xiaoxiao2023-11-18  143

    第一章

    1.1 为什么使用空间数据库?

    它是适用于某些应用程序的通用技术 地理信息系统(地理/地理参考数据)CAD/CAMVLSLI设计(几何数据)复杂现象的建模(空间数据)管理相对简单的空间对象的大型集合的需要空间数据库 vs 图像/图片数据库 空间数据库在空间中包含对象图像数据库中包含空间(图片、图像、…光栅图像)的表示形式空间数据库提供存储和分析空间数据的结构空间数据是由多维空间中的对象组成在标准数据库中存储空间数据将需要过多的空间从标准数据库检索和分析空间数据的查询将是冗长和繁杂的,会留下很大的出错空间空间数据库提供了更有效的空间数据存储、检索和分析

    数据库系统--在数据库管理系统(DBMS)控制下的一组相互关联的文件

    空间数据库系统

    是一个数据库系统 具有额外空间数据处理能力的数据库管理系统在其数据模型和查询语言中提供空间数据类型(SDTs)支持SDT,至少提供 空间索引(在不扫描整个空间的情况下检索特定区域内的对象)空间连接的有效算法(不是简单的过滤笛卡儿积)

    SDBMS的价值

    传统(非空间)数据库管理系统提供: 跨故障的持久性允许并发访问数据在不适合计算机主内存的超大型数据集上搜索查询的可伸缩性对非空间查询十分有效率,但对空间查询效率很低

    DBMS

    DBMS是数据的操作系统特定的关系型数据库管理系统包括一个层级架构

    三层架构

    SDBMS在前端是空间软件,在后端是数据库管理系统SDBMS含有三层: 空间处理软件的接口核心的空间处理函数DBMS的接口

    1.3 什么是SDBMS?

    SDBMS是一个软件模块: 可以使用底层DBMS支持空间数据模型、空间抽象数据类型和可从中调用这些ADT的查询语言支持空间索引、处理空间操作的高效算法以及用于查询优化的特定于域的规则

    1.4 SDBMS和GIS

    GIS是一种利用空间分析功能可视化和分析空间数据,如 搜索位置分析地形分析流动分析分布空间分析/统计测量GIS使用SDBMS 存储、查询、分享大型数据集SDBMS注重于 高效的存储、查询、分享大型数据集提供更简单的基于集合的查询操作操作示例:区域查询、叠置分析、最邻近算法、邻接算法使用空间索引和优化查询加速在大数据集中的查询GIS以外的使用SDBMS的软件 天文学、基因组学、多媒体信息系统

    1.5 SDBMS的组件

    包含以下组件 空间数据模型、空间数据类型和操作符空间查询语言、查询处理和查询优化空间数据挖掘

    1.5.1 空间分类、数据模型

    空间分类学 可用于组织空间的大量描述拓扑模型同胚关系,例如重叠欧几里得空间模型在平面上的距离和方向图的连通性模型,最短路径空间数据模型 识别可识别物体和空间属性的规则对象模型有助于管理可识别的事物场模型有助于管理连续和无定形现象

    1.5.2 空间查询语言

    空间查询语言 空间数据类型,如:点、线、面空间操作,如重叠,距离,最近邻可以从底层的DBMS的查询语言中调用标准 SQL3是查询语言的标准OGIS是空间数据类型和运算符的标准

    1.5.4 文件组织和索引

    GIS和SDBMS假设的区别 地理信息系统算法:数据集加载到主存储器中SDBMS:数据集位于辅助存储上SDBMS使用空间填充曲线和空间索引 有效搜索驻留在磁盘上的大型空间数据集

    1.5.6 数据挖掘

    空间数据的分析有多种类型 演绎查询,如搜索、排序、覆盖归纳查询,如统计、相关、聚类、分类数据挖掘是在大型空间数据库中对有趣的非重要模式进行的一种系统的半自动搜索

    第二章

    2.1 基础

    数据集 逻辑上值或者数据库对象的集合数据库 作为一个单元相互关联、管理和存储的信息的逻辑集合。用于多个数据集的存储。数据模型 被表示在数据库中对数据元素/对象和它们之间关系的概念性的描述

    数据模型包括符号以用于表达:

    数据结构完整性约束 约束表达了数据结构无法单独表达的规则操作 提供改变和检索数据的接口 数据字典 数据库内容的描述,包括数据实体和属性代码定义。是元数据的一个重要元素数据是透明的 透明意味着数据结构和其关系是被隐藏在数据库软件后的当结构、关系或者媒介变化时,对软件应用的影响是最小的不同的数据库使用需要不同类型的数据类型、结构和访问机制DBMS 提供对数据的输入、存储、操作、查询和恢复,用于多个数据库的存储DBMS的特征 安全、可靠、数据库完整性、标准、减少冗余、对存储和数据处理的有效性、并发性、与分布式系统的连接、与基础结构的独立性或透明度、可链接到数据库中的其他信息、创建用户视图的灵活性、用户友好性、访问元数据基础的DBMS组件 查询语言/接口查询编译器/优化器数据库处理机系统目录存储管理器系统工具(备份、加载、监测)结构化或标准查询语言 源于SEQUEL事务管理 事务是用户与DBMS交互的基本单元 插入更新删除检索恢复的控制与并发问题 同时事务的可能问题原子性-所有的操作要么都有作用,要么都没有作用独立性-操作不受其他同步事务的影响数据库提交-事务完成的信号回滚-恢复数据库的事务前状态数据库设计和实现 需求分析概念数据模型逻辑模型-考虑DBMS和底层的数据模型物理模型或实现-考虑物理存储和运算环境建模方法和数据库模型 关系模型面向对象模型网状模型层次模型演绎模型

    2.2 概念数据模型

    概念数据模型 结构、数据类型和关系的表达,一幅静态的图像动态或操作行为的表达数据库完整性约束的表达系统元数据的来源一种向用户描述系统的工具模型方法 实体关系模型 Entity-relationship diagrams:即ER图,用于描不同实体类型的关系关系类型将一个或多个实体类型与某些属性连接起来关系表中包含数据(一个关系即一张表)关系模式中定义关系数据库模式是一组关系模式(关系模式:关系名(属性1,属性2,…)关系型数据库是关系的集合元组的顺序不重要(元组即关系表中的一行)关系中的每个数据应该是不可分割的-原子性当所有的数据都满足原子性的时候,我们即称此关系被归一化,归一化使得数据库能够向理想的设计靠近,如简单和无冗余E-R图被广泛使用 表达模型之间联系的优秀的方法容易转变成为关系逻辑模型模型组织方面还存在着一些不足 简单与复杂利用E-R对空间信息进行建模 实体:节点、弧段、区域属性:节点、弧段、区域id联系:束缚、开始、结束子类型SQL语言-数据定义 允许创建、更改和删除模式允许定义域 字符串、整数,…默认值允许值的限制或范围标识符(实体完整性)参照完整性SQL语言-数据操纵 允许填充、更新、检索和删除数据库中的记录总结 关系的大小和数量之间的权衡 大型的关系需要较少的连接,但可能包含冗余的信息冗余信息可能会导致完整性问题且浪费空间正确构造所需的规范化 规范化可将关系分解为可管理和有意义的组件规范化程度越高,信息完整性越好,但也会导致额外的开销经验法则是,每个实体和关系都应该是自己的关系简单正式定义广泛使用并不是所有数据库应用的解决方法扩展的实体关系模型面向对象的模型 基础 既有静态的数据表达形式又有动态的 E-R图只是静态的对象的动态行为由对象上允许的操作(或方法)表示对象 = 属性 + 功能对象通过消息彼此请求服务具有类似行为的对象被分为一类对象类型的实现(以数据结构和方法的形式)称为类

     

     

     

    最新回复(0)