本文介绍了P2P分布式网络存储服务的背景和关键问题,对比分析了Napster的目录定位、Gnutella的洪泛查询以及Chord的一致性哈希定位机制,探讨了它们的优缺点和解决的单点失效、网络资源消耗等问题。
用户向Napster服务器上传文件列表
服务器记录文件信息及其所在的网络位置IP地址
对等(
P2P
)计算是近年来兴起的一种重要
网络
计算技术,在很多领域都有着
大量的研究与应用。利用
P2P
计算技术,构建大规模
分布式
存储
系统,可以支持
海量用户和海量数据的数据共享和
存储
需求,是当前
P2P
计算研究和应用的一大
热点。数据复制是实现海量数据管理的关键技术之一,可以提高系统可用性和数
据访问的性能,但是数据复制不可避免地引发数据一致性维护的问题。与传统的
分布式
系统不同,
P2P
系统的规模巨大、分布性强和动态性强等特点给
P2P
分布
存储
系统中的数据一致性维护带来挑战。本文针对海量数据和
P2P
分布
存储
系统
的特点,对
P2P
分布
存储
系统中海量数据的数据~致性维护技术进行深入研究。
本文简短回顾下
P2P
网络
发展的一些重要标志性事件。
ARPANET,1969年
ARPANET,中文称为阿帕网,一开始只是连接加州大学洛杉矶分校,斯坦福研究所,加州大学-圣塔芭芭拉和犹他大学,彼此间视为对等的计算机节点,而不非 C/S 结构。阿帕网为美国国防部高级研究计划署开发的世界上第一个运营的封包交换
网络
,它是全球互联网的始祖。
早期...
借鉴Avalanche。
只是假设,一个100k的文件,被拆分成10个10k的文件b1,b2...b10。
每一次被请求都取随机系数c1,c2...c10,发送包E1=b1c1+b2c2+...+b10c10。
当一个节点收到E1,E...