资源描述:
《NoSQL数据库探讨之一.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、NoSQL数据库探讨之——为什么要用非关系数据库?随着互联网web2.0网站的兴起,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。而传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴霸了很多难以克服的问题,例如:1、Highperformance-对数据库高并发读写的需求web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载1F•常高,往往要达到每秒上万次读写请求。关系数据库应付上万次SQL查询还勉
2、强顶得住,但是应付上万次SQL写数据请求,硬盘I0就已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求,例如像JavaEye网站的实时统计在线用户状态,记录热门帖了的点击次数,投票计数等,因此这是一个相当普遍的需求。2、HugeStorage-对海量数据的高效率存储和访问的需求类似Facebook,twitter,Friendfeed这样的SNS网站,每天用户产生海量的用户动态,以Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下乃至不可忍受的。再例如大型we
3、b网站的用户登录系统,例如腾讯,盛大,动辄数以亿计的帐号,关系数据库也很难应付。3、HighScalability&&HighAvailability-对数据库的高可扩展性和高可用性的需求在基于web的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与口俱增的时候,你的数据库却没冇办法像webserver和appserver那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常病苦的爭情,往往需要停机维护和数据迁移,为什么数据库不能通过不断的添加服务器节点来实现扩展
4、呢?在上面提到的“三高”需求面前,关系数据库遇到了难以克服的障碍,而对于web2.0网站來说,关系数据库的很多主要特性却往往无用武之地,例如:1、数据库事务一致性需求很多web实时系统并不要求严格的数据库爭务,对读一致性的要求很低,冇些场合对绢一致性要求也不高。因此数据库爭务管理成了数据库高负载下一个沉重的负担。2、数据库的写实时性和读实时性需求对关系数据库来说,插入一条数据Z后立刻査询,是肯定可以读出来这条数据的,但是对于很多web应用来说,并不要求这么高的实时性,比方说我(JavaEye的robbin)发一条消息Z后,过儿秒乃至十儿秒Z后,我的订阅者才看到这条动态
5、是完全可以接受的。3、对复杂的SQL查询,特别是多表关联查询的需求任何大数据量的web系统,都非常忌讳多个大表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询,特别是SNS类型的网站,从需求以及产品设计角度,就避免了这种情况的产生。往往更多的只是单表的主键查询,以及单表的简单条件分页查询,SQL的功能被极大的弱化了。因此,关系数据库在这些越来越多的应用场景下显得不那么合适了,为了解决这类问题的非关系数据库应运而生,现在这两年,各种各样非关系数据库,特别是键值数据/^(Key-ValueStoreDB)风起云涌,多得讣人眼花缭乱。前不久国外刚刚举NoSQLConf
6、erence,各路NoSQL数据炸纷纷亮相,加上未亮相但是名声在外的,起码有超过10个开源的NoSQLDB,例如:Redis,TokyoCabinet,Cassandra,Voldemort,MongoDB,Dynomite,HBase,CouchDB,Hypertable,Riak,Tin,Flare,Lightcloud,KiokuDB,Scalaris,Kai,ThruDB,这些NoSQL数据弄,有的是用Q6+编写的,冇的是用Java编写的,还有的是用Erlang编写的,每个都有H己的独到之处,看都看不过来了,我(robbin)也只能从中挑选一些比较右時色,看起
7、来更有前景的产品学习和了解一下。这些NoSQL数据库大致可以分为以下的三类:一、满足极高读写性能需求的Kye-Value数据库:Ftedis,TokyoCabinet,Rare高性能Key-Value数据炸的主要特点就是具仃极高的并发读写性能,Redis,TokyoCabinet,Fare,这3个Key-ValueDB都是用C编写的,他们的性能都相当出色,但,11Till色的性能,他们还有自己独特的功能:仁RedisRedis是一个很新的项目,刚刚发布了1.0版木。Redis木质上是一个Key-Value类型的内存数据库,很像memcached,整个