NoSQL

    xiaoxiao2022-07-02  127

    NoSQL数据

    简介 NoSQL(NoSQL=Not Only SQL),意即反SQL运动,指的是非关系型的数据库,是一项全新的数据库革命性运动 随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。

    优点 可以处理超大量的数据 可以运行在便宜的PC服务器集群上 4打破了性能的瓶颈 NoSQL的支持者称,通过NoSQL架构可以省去将Web或Java应用和数据转换成SQL友好格式的时间,执行速度变得更快。 “sQL并非适用于所有的程序代码,”对于那些繁重的重复操作的数据,sQL值得花钱。但是当数据库结构非常简单时,SQL可能没有太大用处。 没有过多的操作 Bootstrap支持 因为NoSQL项目都是开源的,因此它们缺乏供应商提供的正式支持。这一点它们与大多数开源项目一样,不得不从社区中寻求支持。 缺点 没有正式的官方支持,万一出了差错会是可怕的 nosql并未形成一定标准,各种产品层出不穷,内部混乱,各种项目还需时间来检验

    二、NoSQL数据库开源软件

    1.MongoDB: 简介 MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

    特点 它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有:

    面向集合存储,易存储对象类型的数据 “面向集合”(Collenction-Orented),意思是数据被分组存储在数据集中,被称为一个集合(Collenction)。每个集合在数据库中都有一个唯一的标识名,并且可以包含无限数目的文档。集合的概念类似关系型数据库(RDBMS)里的表(table),不同的是它不需要定义在何模式(schema)。

    模式自由 模式自由(schema-free),意味着对于存储在mongodb数据库中的文件,我们不需要知道它的在何结构定义。如果需要的话,你完全可以把不同结构的文件存储在同一个数据库里。 支持动态查询 支持完全索引,包含内部对象 支持查询 支持复制和故障恢复 是使用高效的二进制数据存储,包括大型对象(如视频等) 自动处理碎片,以支持云计算层次的扩展性 支持RUBY,PYTHON,JAVA,C++,PHPC#等多种语言 文件存储格式为BSON(一种JSON的扩展) BSON(Binary Serialized dOcument Format)存储形式是指:存储在集合中的文档,被存储为怨值对的形式。键用于唯一标识一个文档,为字符串类型,而值则可以是各中复杂的文件类型。 可通过网络访问 MongoDB服务端可运行在Linux、Windows或OSX平台,支持32位和64位应月,歉认端口为27017。推荐运行在64位平台,因为MongoDB在32位模式运行时支持的最大文件尺寸为2G8

    2.Google Big Table

    简介 BigTable是非关系的数据库,是一个稀疏的、分布式的、持久化存储的多维度排序Map。Bigtable的设计目的是可靠的处理PB级别的数据,并且能够部署到上千台机器上。Bigtable已经实现了下面的几个目标:适用性广泛、可扩展、高性能和高可用性。

    Bigtable已经在超过60个Google的产品和项目上得到了应用,包括Google Analytics、GoogleFinance、Orkut、Personalized Search、Writely和GoogleEarth。这些产品对Bigtable提出了迥异的需求,有的需要高吞吐量的批处理,有的则需要及时响应,快速返回数据给最终用户。它们使用的Bigtable集群的配置也有很大的差异,有的集群只有几台服务器,而有的则需要上千台服务器、存储几百TB的数据。

    功能 在很多方面,Bigtable和数据库很类似:它使用了很多数据库的实现策略。并行数据库和内存数据库已经具备可扩展性和高性能,但是Bigtable提供了一个和这些系统完全不同的接口。Bigtable不支持完整的关系数据模型;与之相反,Bigtable为客户提供了简单的数据模型,利用这个模型,客户可以动态控制数据的分布和格式(alex注:也就是对BigTable而言,数据是没有格式的,用数据库领域的术语说,就是数据没有Schema,用户自己去定义Schema),用户也可以自己推测(alex注:reasonabout)底层存储数据的位置相关性(alex注:位置相关性可以这样理解,比如树状结构,具有相同前缀的数据的存放位置接近。在读取的时候,可以把这些数据一次读取出来)。数据的下标是行和列的名字,名字可以是任意的字符串。Bigtable将存储的数据都视为字符串,但是Bigtable本身不去解析这些字符串,客户程序通常会在把各种结构化或者半结构化的数据串行化到这些字符串里。通过仔细选择数据的模式,客户可以控制数据的位置相关性。最后,可以通过BigTable的模式参数来控制数据是存放在内存中、还是硬盘上。

    特点 适合大规模海量数据,PB级数据分布式、并发数据处理,效率极高 易于扩展,支持动态伸缩 适用于廉价设备 适合于读操作,不适合写操作 不适用于传统关系数据库 应用 BigTable为谷歌旗下的搜索、地图、财经、打印、以及社交网站Orkut、视频共享网站YouTube和博客网站Blogger等业务提供技术支持。 2010年9月,Google宣布将放弃MapReduce新索引系统将迁移至BigTable平台。 新平台基于Colossus,也被称为GFS2。

    最新回复(0)