传统存储存在的问题
1、性能瓶颈
集中存储都是使用的专用的存储设备,而专用存储设备主要有控制单元和存储单元组成;控制单元中直接与外界交流的机头,会有数据吞吐量的限制,影响性能瓶颈;存储单元中RAID卡或总线的带宽都有一个上限,这个上限在一定程度上也会影响集中存储的性能瓶颈 2、不同厂家传统存储之间具有差异性,不方便同一管理
3、专用存储设备的成本高(远高于x86服务器价格)
4、传统的SAN、NAS扩展能力受限,不能满足大规模存储应用的需要
分布式存储基本概念--存储资源虚拟化
分布式存储是通过在服务器(称之为存储服务器)上安装相应软件(例如FusionStorage),将各个服务器上的HDD、SSD等存储介质资源虚拟成一个大的存储资源池,将分散的存储资源整合到一起,在保证可靠性的同时提供多种存储服务;在使用分布式存储时一般都会配合使用存储虚拟化
分布式存储组网架构
主要分为前端业务网络、管理网络和后端存储网络
前端业务/租户组网:用于分布式网络与用户网络对接,提供给租户使用
后端存储组网: 用于后端存储连接
管理网络: 与用户维护网络对接
分布式存储后端网络一般采用10GE,25GE和IB网络;前端网络一般采用GE,10GE,25GE网络
分布式存储如何保证数据的可靠性
传统的RAID在分布式存储中遇到了瓶颈,因此提出了多副本和纠错码等新的数据保护方式
1、多副本
多副本就是创建多个副本,也就是在保存数据时,会将一个数据拷贝多份完全一样的副本,然后分别存放在多个不同的节点上;当某个副本丢失时,可以通过另一个副本复制来恢复数据
一般创建双副本和三副本
2、纠错码(nDxP)
纠删码就是一种纠正数据丢失的校验码,通过校验的方式来恢复数据
nDxP:n个数据盘和x个校验盘
4D2P:4块存储数据,2块做校验
双副本三副本纠删码(2D1P)存储空间利用率50%33.33%D/D+P整体IO效率50%33%D/D+P最低配置要求23D+P可靠性允许1块坏允许2块坏P块盘
特点
分布式存储通过存储虚拟化将存储设备进行抽象,以逻辑资源的方式呈现,统一提供全面的存储服务
可以在不同的存储形态或者设备类型之间提供统一的功能(即物理资源可以是服务器存储资源、专用存储设备的存储资源等,将其虚拟为统一的逻辑资源)
成本降低、横向扩展能力强、资源部利用率更高、管理方便