`

从运维角度看NoSQL数据库是否适用于非互联网行业?

阅读更多

 

 
       这几年,NoSQL数据库可以说是风头强劲,甚至有专家和牛人撰文,说关系型数据库已经走到头了,对此,我本人持怀疑态度。并且,花了几个星期时间,研究了一点这方面的东西,把自己的心得记录在下面。

NoSQL数据库的特征:

  • 开源、自由使用,有问题到社区寻求帮助;
  • 无Scheme限制,使用灵活;
  • 分布式支持,易于横向扩展,总体成本低;
  • 事务支持不好,数据读写一致性差;
  • 对复杂数据结构和复杂SQL的支持不好
 
从这些特征来看,NoSQL技术应该是关系数据库的完善和补充,而不是代替者。这个问题要从几个方面说起。

第一、开源软件的特征。
 
     开源软件的特征就是由社区这样的非盈利组织维护。对传统行业来讲,最大的问题是开源软件不能给予一个商业承诺,而自己的业务连续性需要得到最大限度的保证。对于一些行业来讲,甚至停电、火灾、地震(甚至战争),都要有业务连续性保证的预案,如果因为使用的基础软件总出问题,而导致数据库停止服务,业务中断,是绝对接受不了的。
 
     对运维来讲,最关心的问题就是出了问题谁负责,谁来快速解决问题保证业务连续性。采用了开源软件,是否意味着只要出问题了,都要运维自己负责(不知是否负得起,如果能负得起,当然很好),都要运维解决?
 
     我之前看到过很多大客户那里,都有数据库厂商(Oracle、DB2)的人常驻在哪里,以备不时的咨询和问题处理。Oracle和IBM在DBA培训上也做得非常好,可以培养出很多专业的数据库维护的工程师和专家,来解决客户的问题,进行例行检查、维护工作。
 
 
第二、事务性和读写一致性的需求
 
     当然,现代互联网应用,的确很多场景不需要那么强的事务性和读写一致性,但是并不是所有的应用都如此,比如银行应用,比如和钱有关的财务、OA等等,都有很强的事务性要求,否则,造成的损失由谁来负责呢?
 
     例如,银行转账一定要在事务里从支付方扣钱,增加到向收款方账户,如果事务得不到保障,意味着什么?
 
     反而,复杂SQL还好说一些。可以从设计层面尽量避免。
 
     当初,也就是有这方面的需求,才会有关系型数据库的产生;显著,仍然有这方面的需求,所以,关系型数据库依然是一些关键性应用的基础;在同时,因为有了很多互联网应用对事务性和读写议执行要求不那么强烈,只是要求水平扩展、低成本这一需求,所以,才出现了NoSQL数据库。
 
        基于上面的因素,我认为,NoSQL数据库现在最适合的场景是还是互联网应用和非关键应用,其优势是低成本、大数据量、在廉价硬件上更加容易水平扩展。在这个场景下,出现问题不会造成多大的影响;或者,一些网站之类的,可以基于NoSQL数据库来运营,有了问题从网上找资料解决;再有,就是有足够的资源和技术力量的情况下,培养自己NoSQL方面的工程师,来维护(当然这样最好)自己的数据库。
 
       而非互联网行业(例如金融、财务等等),还是使用商用的关系型数据库稳妥。NoSQL非常适合在传统行业中记录各种日志和数据挖掘这两个场景。原因是:
 
(1)记录日志一般不是业务流程的关键因素,即便这部分因为各种原因出现问题,不会阻断正常的业务,造成大的问题和社会影响;
 
(2)一般来讲,日志是一种不需要和其他数据进行较多关联的数据,而且多是松散结构的数据,因此,使用关系型数据库处理,也不能更好的利用关系型数据库的特性。
 
(3)日志数据量非常大,使用关系型数据库的总体成本很高。
 
(4)数据挖掘是离线数据,使用分布式的数据库分析有天生的优势(例如使用Hadoop的MapReduce)。
 
       最后,我觉得NoSQL技术的发展,基本都是开源软件在推动,但是如果想有更多的应用使用,还是需要有大厂商的支持,形成开源产品和商业产品并行这种局面。
      从我个人的兴趣来讲,非常希望能有更好的NoSQL数据库产品可用。在我自己接触过的这类产品来看,HBase/Hadoop非常不错,问题是版本之间兼容性不好,网上关于HBase/Hadoop的资料满天飞,说哪个版本的都有,基本上都不能通用,害的我折腾好长时间。希望Apache能够对这个东西有足够长远的计划,在设计时能再多考虑一些版本之间的兼容性,那就很不错了。
 
 
 
 
 
 
 
 
 

  

6
1
分享到:
评论
17 楼 windshome 2013-06-17  
cuishuangjia 写道
windshome 写道
到这里来做广告啦?我记得有个国外的工具叫做DBTools,非常不错,非常好用,你发的这个广告不是这个吧?

你好,你说的那个DBTOOLS是什么?
我是自己做的小工具而已。
你说的那个DBTOOLS你有安装文件或是下载网址吗?有的话给我发一份,我学习学习,可以吗?

记不得了,是个国外的数据库工具,好像功能非常丰富的。你可以搜一下看看。
16 楼 cuishuangjia 2013-06-14  
windshome 写道
到这里来做广告啦?我记得有个国外的工具叫做DBTools,非常不错,非常好用,你发的这个广告不是这个吧?

你好,你说的那个DBTOOLS是什么?
我是自己做的小工具而已。
你说的那个DBTOOLS你有安装文件或是下载网址吗?有的话给我发一份,我学习学习,可以吗?
15 楼 windshome 2013-06-13  
到这里来做广告啦?我记得有个国外的工具叫做DBTools,非常不错,非常好用,你发的这个广告不是这个吧?
14 楼 windshome 2013-04-26  
说起开源社区,想起2007年那会儿有一个开源的工具SQLExplorer不错,当时我下载了使用,发现有bug:

一次是SQLExplorer在查询的返回记录集比较大的情况下会崩溃
第二次是查询数字列的时候显示会出错,所有行的数据都显示成了第一行的。

于是我在sf.net上给提出bug和修改的建议,因为的确是bug,所以两次提bug,作者很快做出了反应并发出了新的版本,并对我的支持表示感激。

当时我也是马上下载新的版本去试,发现问题得到了修正,赶紧反馈给作者。

我觉得这个真的是开源社区和用户的良性互动。而有时候使用开源软件的时候,则是非常不爽,例如一个Java NIO框架,当时是一个韩国人自己在开发和维护,我在邮件组里边问什么问题,基本上都得不到答复。。。提意见更是白扯。还有当年sun负责grizzly的那个Alexander,我们互相通了N多的Email,结果我的问题他回答不出所以然,对grizzly的修正和改善也无从谈起。

如果所有的开源软件都像SQLExplorer一样,我想,我也会更多的时候愿意使用开源产品,愿意自己也投入到开源社区奉献一点力量。
当然,我有这些印象是几年前的事情了,也说不定现在这些开源社区和从事开源的人们都改变了很多呢。

13 楼 windshome 2013-04-26  
回复  mike.liu ,是的,我双手赞成,一概而论肯定是不行的。的确我看到过一些客户,像IBM和Oracle和微软对他们支持都很到位,当然服务都是要花钱的,他们也没有那么在乎花钱买服务,他们更在乎业务稳定性。

不花钱让人提供支持基本上是不可能的。当然,如果可能的话,花钱培养自己的技术人员,或者基于商业软件,或者基于开源软件自然也可以,哪个成本/收益更好,得具体情况具体分析了。
12 楼 mike.liu 2013-04-26  
windshome 写道
mike.liu说的那个,实际上是开源软件和商业软件的不同带来的问题。你给你的客户的承诺是商业承诺,你所用的产品对你没有任何承诺,自己技术力量又弱。

理想的情况是,商业软件给你承诺,在运维过程中解决所有由商业软件带来的问题,商业软件公司收取服务费用。这种理想情况是没有问题的。
但是实际情况是,商业软件的支持人员一般都很烂,绝大多数问题还是得自己解决。等商业软件支持人员解决问题的话,长时间问题得不到解决,恐怕损失更大。所以基于实际考虑,当然如您所述,也要考虑自身技术能力,选择开源或是商业软件,并不能仅仅根据所处行业来做决定。如果你对某开源软件非常熟悉,技术上有保证,也可以用在一些关键项目上。反之,如果对商业软件本身技术能力很弱,指望商业软件的支持人员,风险也非常大。(当然,可能某些商业软件公司会推出各种不同等级的支持力度。但是我上面所说是就总体而言。)
11 楼 windshome 2013-04-26  
dacoolbaby 写道
NOSQL干嘛非要和互联网扯上关系呢?
再说,大并发量下,RDBMS+读写分离也是撑不住的,前面再要做一层缓存。

那么事务也变成不在数据库里面直接处理了。


是不是要在数据库控制事务,是由业务类型决定的,不是完全由技术决定。我们之前的产品,也使用缓存,也使用数据库事务。

至于为什么要和互联网扯上关系,是因为NoSQL本身就是随着互联网应用的兴起而出现的,比起传统的关系数据库,它更适合这样应用的数据存储。
10 楼 dacoolbaby 2013-04-26  
NOSQL干嘛非要和互联网扯上关系呢?
再说,大并发量下,RDBMS+读写分离也是撑不住的,前面再要做一层缓存。

那么事务也变成不在数据库里面直接处理了。
9 楼 windshome 2013-04-25  
mike.liu说的那个,实际上是开源软件和商业软件的不同带来的问题。你给你的客户的承诺是商业承诺,你所用的产品对你没有任何承诺,自己技术力量又弱。
8 楼 windshome 2013-04-25  
kjj朋友,如果你真的那么想,一定是我的表述有问题,我的本意也是这样,只是不同意'关系数据库已死'这个说法。
7 楼 kjj 2013-04-25  
mike.liu 写道
对于第一点,如果事故导致金钱方面的问题,并且同时能够证明是商业软件的问题,是有可能找商用软件提供者的;但是对于大多数平时的维护排错,基本上还得应用软件开发人员自己解决。

NoSQL的特性就是通过降低约束,满足最紧迫的需求,即,性能和可扩展性。如果应用不循序一致性问题存在,NoSQL的确是不适合的。但是你不能指责汽车没有自行车环保,因为本身的应用场景就不一样。


楼主有对立nosql和sql的倾向,二nosql\真正的目的如这位所说,实际上是增强和补充!
6 楼 laibin1320 2013-04-25  
平常的系统我是不敢用弄上去了的,只有对一致性要求不高的我只用在了日志中心系统中的
5 楼 niweiwei 2013-04-25  
适合自己的才是最好的,NoSQL和关系数据库各有各的优势,就看应用在什么领域了
4 楼 windshome 2013-04-25  
我给两位单独回复了一篇,又兴趣可以看一下 http://windshome.iteye.com/blog/1853690
3 楼 liqingyuan 2013-04-25  
NOSQL和是不是互联网没什么关系,而是和数据有关。它只是在处理非结构化数据上存在优势,只要业务上存在大量非结构化数据,用NOSQL就是合适的。
2 楼 mike.liu 2013-04-25  
对于第一点,如果事故导致金钱方面的问题,并且同时能够证明是商业软件的问题,是有可能找商用软件提供者的;但是对于大多数平时的维护排错,基本上还得应用软件开发人员自己解决。

NoSQL的特性就是通过降低约束,满足最紧迫的需求,即,性能和可扩展性。如果应用不循序一致性问题存在,NoSQL的确是不适合的。但是你不能指责汽车没有自行车环保,因为本身的应用场景就不一样。
1 楼 windshome 2013-04-25  
怎么没有不同的意见啊?再次呼吁看文章的朋友们,大家各抒己见,提出自己的看法:)技术问题,愈辩愈明。

相关推荐

Global site tag (gtag.js) - Google Analytics