网上有很多教程把Replica Sets和Auto Sharding(或者是Sharding)写在了一起,对于初学者可能会觉得有些莫名,之所以这样做是因为,一个较好的Auto Sharding解决方案是将每个一shard(分片)定为一个Replica Sets(复制集)。一个Replica Sets由若干个mongod instance组成,在这个集合中,所有的instance的数据相同,这使得即使有某一台机子当掉了,其它机子还是可以正常运行,而且这部分的控制是由Mongo自动完成的,因而尽可能地减少了因当机而产生的错误及人工处理的部分。而Sharding是可以将庞大的数据库拆分为几个部分分别发放到每一个shard,一来降低了单一一台服务器的压力,同时通过减少潜在的损失比例来提高效率。也就是说一个基于Replica Sets的Auto Sharding结构,可以把一个完整而且庞大的数据库根据个人定制,拆分到若干个服务器集合,每个服务器集合中的服务器群又相互保持数据同步,所以除非一个服务器集合中的所有服务器都当掉了,否则某台或几台的当机对数据库的影响是微忽其微的。关于这两个部分,其实在Mongo的官方文档里有详细的说明,所以此文是以总结归纳为目的而写。

(图片来源:http://www.mongodb.org/display/DOCS/Sharding+Introduction

  1.一个完整的Auto Sharding功能的实现需要用到mongod和mongos,其中mongos作为真正的应用接口,数据的输入输出都应经过它。然后还需要一个config server,它是mongod,但它不会用来存储应用程序的数据库,通俗的来说而是存放了这整个结构的配置属性,mongos会从config server中读取配置来进行工作。最后是真正会存储数据的mongod们,它们按组分为若干个Replica Sets,用来存放mongos拆分下来的各个sharding。

  2.配置推荐从配置各个Replica Sets开始,一个Replica Set包含若干个mongod instance,基础命令是:mongod --replSet %SETNAME%  --shardsvr,同属一个Replica Set的instance都使用同一个%SETNAME%,比如一个名为“set1”的Replica Set中有三台服务器,分别名为“server1”,“server2”,“server3”,则在这三台服务器上需要分别运行命令:

    server1: mongod --replSet set1 --shardsvr

    server2: mongod --replSet set1 --shardsvr

    server2: mongod --replSet set1 --shardsvr

   启动mongod包含多个参数,这个可以通过命令:mongod --help来查询,根据自己的需求修改,上面的为必要部分。

   每个服务器都启动好mongod后,开始进行Replica Sets的初始化,初始化的方法有多种,以下介绍比较方便的两种:

    (1)initiate(cfg),其中cfg由用户编写;

    (2)initiate->add;

  3.然后是启动config serve;

  4.最后是启动mongs;

  

时间有限,具体配置步骤与配图后一篇再做喽:P

作者: 才happy 发表于 2011-08-24 14:52 原文链接

推荐.NET配套的通用数据层ORM框架:CYQ.Data 通用数据层框架
新浪微博粉丝精灵,刷粉丝、刷评论、刷转发、企业商家微博营销必备工具"