微信号:infoqchina

介绍:有内容的技术社区媒体

Chord:结构化P2P网络中的一个DHT算法

2014-12-03 18:41 InfoQ


DHT即分布式哈希表(Distributed Hash Table),它通常是为了拥有极大节点数量的系统,而且在系统的节点常常会加入或退出节点而设计的。DHT具有良好的扩展性、鲁棒性、结点ID分配的均匀性和自组织能力。DHT可以用以建立复杂的服务,例如分散式档案系统、点对点技术档案分享系统、网页快取、缓存系统、任意点传输、网域名称系统以及即时通讯等。Chord由麻省理工学院(MIT)在2001年提出,其目的是提供一种能在P2P网络快速定位资源的的算法,它并不关心资源是如何存储的,只是从算法层面研究资源的取得,因此,Chord的API就简单到只有一个set、get。Chord在一致性哈希的基础上提供了优化的路由算法,优化后的算法具有负载平衡、分布性、可扩展性、可用性、命名的灵活性等优点。它可用于全球文件系统、命名服务、数据库请求处理、互联网级别的数据结构、通信服务、事件通知、文件共享等应用中。


Chord要实现的其实就是给定一个关键字Key,并能够将其映射到某个节点。Chord采用一致性哈希为每个节点和关键字产生一个m位的ID,并按照ID的大小构成环形拓扑。另外,为了路由的需要,Chord还维护了一张最多m项的路由表即Finger表。如下图所示的就是m为 6的一个Chord拓扑环和Finger表。


对于节点的查询的处理,Chord采用了幂次逼近查询法;对于新节点加入的处理,Chord需要环形拓扑中的任意一个节点来协助完成,且加入过程包括新节点本身的Join操作和被其他节点发现两个阶段;对于节点失效的处理,Chord需要周期性对节点的前继节点和后继节点进行探测,并按照节点加入时的算法重建Finger表;对于节点退出的处理,Chord采取了将节点的退出当作为失效来处理的方式。有关Chord及Chord对节点的查询、加入、失效等具体是如何处理的,请读者参考论文《结构化P2P网络chord算法研究与分析》。


另外,请读者们注意,DHT只是一个概念、一种网络模型,读者还可以阅读freedomlayer上的一篇介绍以加深对DHT的理解。除了Chord算法外,基于DHT实现的算法还包括加州大学伯克利分校提出的内容寻址网络算法CAN、英国剑桥的微软研究院和莱斯大学提出的Pastry、加州大学伯克利分校提出的一种新型P2P网络定位和路由算法Tapestry等。目前,DHT算法的发展方向非常多,且随着科学技术的发展以及人们的不断探索与研究,将会有新的改进算法不断被提出来。



 
InfoQ 更多文章 Facebook如何实现PB级别数据库自动化备份 学术派Google软件工程师Matt Welsh谈移动开发趋势 Spotify为什么要使用一些“无聊”的技术? 妹纸们放假了,汉纸们做啥? 大多数重构可以避免
猜您喜欢 职场里,情商是对付贱人的第一利器! perl单行命令[03]-awk 腾讯TMQ在线沙龙|精准测试介绍 2016年APP大全 在创业公司当好工程师,你得具备这7个特质