本文介绍了P2P分布式网络存储服务的背景和关键问题,对比分析了Napster的目录定位、Gnutella的洪泛查询以及Chord的一致性哈希定位机制,探讨了它们的优缺点和解决的单点失效、网络资源消耗等问题。 摘要由CSDN通过智能技术生成

什么是分布式网络存储?

分布式存储是一种数据存储技术,通过网络使用企业中的每台机器上的磁盘空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在企业的各个角落。

名词解释:

P2P: 对等网络 Peer to Peer,每个节点,既是服务端,也是客户端
peer: n.同辈,同龄人

传统C/S架构有哪些问题?

资源存储在服务端,对服务器存储空间、服务器IO性能要求高,客户端的网络资源没有得到充分利用。

分布式网络存储系统以及关键问题

定位问题:寻找节点上的文件

什么是定位问题

(分布式网络存储系统中的成员/节点)如何存取一个文件
存文件:存在哪个计算机上
取文件:怎么定位该文件

分布式环境下存储文件有哪些定位方案

  • 基于目录/索引的定位机制
  • 基于洪泛查询的定位机制
  • 基于哈希的分布式映射定位机制
  • 基于目录的定位机制—— Napster 1999年首次提出

  • 索引存放在集中式服务器上
    索引包括文件名、网络地址
    用户在服务器上注册,并且提供共享的文件列表
  • 文件存储在各个节点(用户)中
  • Napster文件分享过程
  • 用户向Napster服务器上传文件列表
  • 服务器记录文件信息及其所在的网络位置IP地址
  • 对等( P2P )计算是近年来兴起的一种重要 网络 计算技术,在很多领域都有着 大量的研究与应用。利用 P2P 计算技术,构建大规模 分布式 存储 系统,可以支持 海量用户和海量数据的数据共享和 存储 需求,是当前 P2P 计算研究和应用的一大 热点。数据复制是实现海量数据管理的关键技术之一,可以提高系统可用性和数 据访问的性能,但是数据复制不可避免地引发数据一致性维护的问题。与传统的 分布式 系统不同, P2P 系统的规模巨大、分布性强和动态性强等特点给 P2P 分布 存储 系统中的数据一致性维护带来挑战。本文针对海量数据和 P2P 分布 存储 系统 的特点,对 P2P 分布 存储 系统中海量数据的数据~致性维护技术进行深入研究。
    本文简短回顾下 P2P 网络 发展的一些重要标志性事件。 ARPANET,1969年 ARPANET,中文称为阿帕网,一开始只是连接加州大学洛杉矶分校,斯坦福研究所,加州大学-圣塔芭芭拉和犹他大学,彼此间视为对等的计算机节点,而不非 C/S 结构。阿帕网为美国国防部高级研究计划署开发的世界上第一个运营的封包交换 网络 ,它是全球互联网的始祖。 早期...
    借鉴Avalanche。 只是假设,一个100k的文件,被拆分成10个10k的文件b1,b2...b10。 每一次被请求都取随机系数c1,c2...c10,发送包E1=b1c1+b2c2+...+b10c10。 当一个节点收到E1,E...