当前位置：首页 > 资讯 > 计算机/互联网 > 互联网

复制策略与复制的方式

时间：2019-01-23 18:35 编辑：2KB 来源：2KB.COM 阅读：307
扫一扫，手机访问

分享
扫描二维码，分享到微信打开微信
使用"扫一扫"
再点击微信界面右上角三个点标志
分享到微信朋友和朋友圈。

摘要：

RavenDB 英文原文：On replication strategies, or the return of the long article

注意: 我写一些短篇的博客已经有些日子了. 我认为是时候改变下了.我不确定这篇博客会带来什么影响，但应该会是很大的影响.请让我知道你觉得更好的方法和理由。

这个问题我已经想了几天了. 我试图想找出通用的复制解决方案能够应用到其他解决方案上去. 如果这个问题解决了，我们就能提供更多的功能组到更多的场景上.

但在之前，我们要谈谈怎么去实现复制, 哪些类型的复制. 我们假设有一个单独的数据库 (没分片,在不同的节点). 普通情况下, 将有下面的选项:

主/从 (Master/slaves)
主/次 (Primary/secondaries)
多重可写组合(Multi write partners)
多重主(Multi master)

上面的是我接下来博客要谈的内容.对于这些内容的目的，他们是完全不想关的。

主/从模式是指这样一种情况，你只有一个主写节点和一个或多个从节点。这一模式的一大特点是你永远无法（至少在正常操作的情况下）对从节点做任何形式的更改。它们纯粹是用来读的，即使冒着损坏数据的风险切断它们与主节点的联系它们也不能变成可写的。

这种方法的一个常见的例子是日志传送。我将在后面详细讨论它，但是你可以看看其他类似系统的文档，将一个从节点变更为可写是一个绝对不凡的经历。得有一个很好的理由。

主/次级模式与主/从模式很类似，但在这种模式里我们可以选择一个次级节点成为主节点。只能有一个主服务器，但好处是允许有一种简单的方法来变更主节点。MongoDB就使用这样一个系统。

多重可写组合系统允许任何节点接受写操作，并且它会留意将变更分发到其他节点。它也需要处理冲突，不像目前提到的其他选择。拥有使两个用户在多个节点同时写入相同值的能力。然而，多重可写组合通常会对同伴节点进行假设。例如，它们会在同步时比较，并有一个单独的协议用来将新的在线节点加入到常规复制组合中。

多重主系统允许、接受并鼓励节点按需添加删除，它们假设会有写冲突，并有在运行的基础上解决冲突的需求。其他节点间没有相互同步的需求，它们通常“重新找主”到一个新的节点并开始复制它，这意味着你需要从一开始就复制所有数据。通常很希望到一个节点挂掉了，希望它在挂掉时已经完成所有变更，然后将它摘除。

让我们看看每一个实际执行的细节，包括一些例子，希望这能让我说得更清楚。

日志泊运（Log Shipping）

主/从通常是通过日志泊运来实现的。理解日志泊运的最简单方法是，主数据库会发送（很神奇，我们真的不太在乎这一点是怎样的）如何直接修改数据库文件的指令给从数据库。换句话说，从概念上讲，它会发送类似以下内容：

   1: writep(fd1, 1024, new[]{ 17,85,124,13,86}, 5);

   2: writep(fd1, 18432, new[]{ 12,95,34,83,76,32,59}, 7);b

如你所想，这些是非常底层的修改。这个好处是非常易于捕捉和回放那些改变，而劣势是，你真地不能做任何其它事情。因为改变发生在堆栈的最底部，没有机会去运行任何各类的逻辑。我们只是写入到文件，如同主服务器所做的。

这就是为什么允许从节点写很难的最关键原因。当它产生任何独立的写操作时，它便冒着主节点也在写的风险，这样会产生数据冲突。这就是为什么如果你想切换主从你必需做一系列事情。你必须处理完这些麻烦来保证你不会有两端都写的场景发生。

一旦发生这种情况，你永远不不能再使两端同步了。这发生的几率很低。

增加一个新节点，反过来，这很容易。请务必保留过程，做一个完整的数据库备份并将它移动到另一个节点。然后开始传递日志。因为只有它们在同一个点开始时一切才能安全实施。

请注意，备份的这个版本在处理版本问题上很敏感。你不能在使用最底层存储的版本上做一丁点改变，因为那样可能会丢失一切。这个方法用于生成读复制很好用。事实上，这是大多数情况下使用的方法。

理论上你甚至可以用它来做故障转移，因为如果主节点宕掉了，从节点可以接受写。问题是你如何处理从节点以为主节点宕掉了，而主节点以为一切都正常这种情形。这种情况下你可能让两端都可写，而这将导致不能合并地情况。

理论上讲，因为它们有一个共同的根节点，你或许会觉得有一个引领者，并这样做了，但是这样会导致掉线服务器数据的丢失，或者你会没有可行方法取回的数据。这里我们记录的变化非常小，并且粒度太小以至于不允许你在提取变化信息方面做什么有用工作。

Oplog

这实际上与日志传送方法非常类似，只是不发送底层的文件I/O操作，我们实际上发送的是更高层的命令。这就我们而言有相当多的好处。主服务器可以像如下一样发送日志：

set("users/1", {"name": "oren" });
set("users/2", {"name": "ayende" });
del("users/1");

在次级节点上执行这套指令将导致次级上结果相同的状态。不像日志传送那样，这实际上需要次级服务器进行工作，所以相比应用已经计算过的文件更新这样的代价更昂贵。

然而，这样做的好处是，你可以有一个更可读的日志。它也使把副服务器转为主服务器变得容易很多。最主要的是，如果你不傻的话：它们实际的操作完全是相同的一回事，但因为你是在协议层上工作，而不是文件级，所以你可以得到一些感兴趣的好处。

让我们假设你有相同的“大脑分裂”问题，即主副服务器都认为它自己是主服务器。在用 Log Shipping 的情况下，我们无法调和这个分歧。而在用 Oplog 的情况下，我们却可以做到。这里的关键是，我们可以：

对拒绝操作的服务器之一dump为可恢复状态。
尝试应用两个服务器上的日志，希望它们不是同时工作在同一个文档上。

这就是MongoDB采用的复制模式。并且它采取的处理这种冲突的第一种方法。事实上，这几乎是能够安全解决的唯一选择。当然，当两台服务器上更改相同对象是总是需要手动解决。而且最好是提前预防而不是认为“这样有时奏效”。

你可以在这里看到一些MongoDB如何合并交叉写的讨论。事实上，如果继续使用相同的源数据，你可以在这里看到MongoDB内部的oplog ：

   1: // Operations

2:

   3: > use test

   4: switched to db test

   5: > db.foo.insert({x:1})

   6: > db.foo.update({x:1}, {$set : {y:1}})

   7: > db.foo.update({x:2}, {$set : {y:1}}, true)

   8: > db.foo.remove({x:1})

9:

  10: // Op log view

11:

  12: > use local

  13: switched to db local

  14: > db.oplog.rs.find()

  15: { "ts" : { "t" : 1286821527000, "i" : 1 }, "h" : NumberLong(0), "op" : "n", "ns" : "", "o" : { "msg" : "initiating set" } }

  16: { "ts" : { "t" : 1286821977000, "i" : 1 }, "h" : NumberLong("1722870850266333201"), "op" : "i", "ns" : "test.foo", "o" : { "_id" : ObjectId("4cb35859007cc1f4f9f7f85d"), "x" : 1 } }

  17: { "ts" : { "t" : 1286821984000, "i" : 1 }, "h" : NumberLong("1633487572904743924"), "op" : "u", "ns" : "test.foo", "o2" : { "_id" : ObjectId("4cb35859007cc1f4f9f7f85d") }, "o" : { "$set" : { "y" : 1 } } }

  18: { "ts" : { "t" : 1286821993000, "i" : 1 }, "h" : NumberLong("5491114356580488109"), "op" : "i", "ns" : "test.foo", "o" : { "_id" : ObjectId("4cb3586928ce78a2245fbd57"), "x" : 2, "y" : 1 } }

  19: { "ts" : { "t" : 1286821996000, "i" : 1 }, "h" : NumberLong("243223472855067144"), "op" : "d", "ns" : "test.foo", "b" : true, "o" : { "_id" : ObjectId("4cb35859007cc1f4f9f7f85d") } }

你可以通过在oplog实体上的命令查看链。例如，上面命令的第7行被变成18行的一个插入。这样似乎也要做很多的工作来避免做任何计算工作，更倾向于用一个简单操作来解决问题。

比如，你有一个看起来像{counter:1}的文档，你在主节点上做了一个类似{$inc:{counter:1}}的更新，结果是{counter:2}，而oplog将储存{$set:{counter:2}}。次级节点将这样复制而不是使用$inc。

其它翻译版本 (1) 加载中

这是一个非常不错的特性，因为你可以多次操作这样的变更，但是返回的结果是一样的。但是这样会导致一个恶劣的结果，那就是你不能将多次的变更合并处理，当然，你可以采用更好的一些方式来处理这个问题，但是。。我并不喜欢这种方案。

Multi write partners

在这种模式下，我们存在一个服务器的集群，每一个服务器都很类似。所有的写操作都被处理并记录下来。当从源服务器复制到所有的目标服务器的时候，就会问目标服务器：你上次从我这儿操作了多少啦，这里就是从上次到现在的所有的变更哦。在这一点，我们可以从已经复制到所有的目标服务器的日志来看看。

本文中的所有译文仅用于学习和交流目的，转载请务必注明文章译者、出处、和本文链接。 2KB翻译工作遵照 CC 协议，如果我们的工作有侵犯到您的权益，请及时联系我们。

2KB项目（www.2kb.com，源码交易平台）,提供担保交易、源码交易、虚拟商品、在家创业、在线创业、任务交易、网站设计、软件设计、网络兼职、站长交易、域名交易、链接买卖、网站交易、广告买卖、站长培训、建站美工等服务

全部评论(0)

上一篇：写给精明 Java 开辟者的顶级测试技能
下一篇：使用 Countly 来分析 Apple Watch 统计数据

最新发布的资讯信息
【计算机/互联网|】Nginx出现502错误(2020-01-20 21:02)
【计算机/互联网|】网站运营全智能软手V0.1版发布(2020-01-20 12:16)
【计算机/互联网|】淘宝这是怎么了？(2020-01-19 19:15)
【行业动态|】谷歌关闭小米智能摄像头，因为窃听器显示了陌生人家中的照片(2020-01-15 09:42)
【行业动态|】据报道谷歌新闻终止了数字杂志，退还主动订阅(2020-01-15 09:39)
【行业动态|】康佳将OLED电视带到美国与LG和索尼竞争(2020-01-15 09:38)
【行业动态|】2020年最佳AV接收机(2020-01-15 09:35)
【行业动态|】2020年最佳流媒体设备：Roku，Apple TV，Firebar，Chromecast等(2020-01-15 09:31)
【行业动态|】CES 2020预览：更多的流媒体服务和订阅即将到来(2020-01-08 21:41)
【行业动态|】从埃隆·马斯克到杰夫·贝佐斯，这30位人物定义了2010年代(2020-01-01 15:14)

商品推荐
友价商城交易源代码插件-自动生成sitemap插件
￥30.00
百度链接主动推送和熊掌号推送通用版 - 支持任意网站无需插件
￥15.00
2KB网站地图助手/一键生成Sitemap/过滤全站死链/生成全站外链
￥10.00
网站SEO优化分析/死链检测/外链检测/Sitemap生成/抓取分析
￥100.00
YSZI.COM - 新闻自媒体导航平台项目众筹
￥1000.00

资讯排行榜
更多>>