中华电信(文件存储CephFS)

1 项目概述
中华电信某一大数据计算场景现采用Hadoop HDFS文件系统进行数据存储,系统现状:
1) 存储绑定在运算节点内,扩充存储的同时必须扩充运算节点
2) 只能使用复制方式来保护数据,对于大量数据的存储成本太高
3) 外部新进数据需要先暂存在 stage server中,再复制到HDFS
4) 据无法依据使用的频繁度,自动分成冷热数据分层存储
 


标准的Hadoop 架构
本项目通过使用Hippo100-ARM存储服务器集群方式,采用NAS文件存储模式,以CephFS服务直接对接前端应用,无需前置机支持,同时支持计算服务器访问ARM存储集群中数据进行计算分析。
2 解决方案
 


                                                                                    以Hippo 100 取代 HDFS
2.1软件环境
1) 存储软件:基于Ceph的Hippo100集群、3个MON、20个OSD、1个MDS,采用纠删码数据备份方式
2) Hadoop 软件: CDH 5.10
2.2硬件环境
1) 3台Hippo100 ARM存储服务器集群:Marvell 385双核 ARM * 8,20 x Seagate enterprise 8TB HDD, 3x MON, x1 MDS(元数据服务器),  网络 2x 10Gb each ARM100.
2) Server: 2 x Xeon E2650 CPU, memory 32GB, 10Gb 网卡, 4x DAS 1TB HDD 虚拟机 x 4:2 core, 4GB memory
2.3读写速率
测试HDFS使用DAS HDD 与 CephFS当作local file system之 throughput 比较结果显示使用CephFS相较于HDFS Write: CephFS 快 19%。
3 项目效果
本项目应用为用户节省大量成本,主要体现在以下方面:
1) 使用纠删码方式进行数据备份Erasure Code (K8+M2),节省存储成本58%,Hippo 100 的 1PB原始容量 = HDFS 的 2.4PB原始容量;
2) 降低服务器数量;
3) 节省Hadoop授权费;
4) 节省电费80%;
5) 降低更换硬盘时间,节省维运成本。
 

服务热线:029-83456318 83456319      陕ICP备17015418号
友情链接: 央采供货商 | 陕西省政府采购供货商