当前位置:首页 > 知识 >

创业榜样:上海储迅联合创始人

2021年9月17日,在深圳中洲万豪酒店举办了一场名为“赋能·共赢——2021信维Web3.0分布式存储行业峰会”的活动,由上市公司信维股份主办。峰会特邀上海储迅联合创始人兼CTO冷波他发表了主题为“从硬盘到分布式存储”的演讲。

冷波首先介绍自己是一位从事存储行业近20年的老兵,他简单解释了一下数据存储的一些概念。他提到上海储迅是一家专门开发企业存储系统的公司,目前也提供关于web3.0去中心化存储的解决方案。他还介绍了他们公司运行的存储集群总容量超过500PiB。

随着技术的不断发展,冷波指出电脑主要存储设备从软盘发展到硬盘,容量也越来越大,速度也更快。然而,硬盘长时间使用后可能会出现各种错误,对于数据量庞大的企业来说,这可能会带来影响。因此,类似RAID的磁盘技术应运而生,通过将多个硬盘组合在一起,提供更大的容量和更好的通用性。

冷波提到了RAID6,它可以在任意损坏一个或两个硬盘的情况下,通过数据校验值计算出原始数据,并且可以同时进行多个硬盘的读写操作,提高性能。因此,相当长一段时间,RAID成为企业存储数据的主要技术。

然而,随着数据量的增加和对数据要求的提高,RAID可能无法满足需求。因此,类似SAN或NAS的网络存储应运而生,它支持在一台服务器上插入多个硬盘,并通过网络提供服务和共享访问。这种存储方式可以让多台机器、多个客户端和多个业务主机同时访问存储,提高数据的利用价值,并且扩展容量更加方便。

然而,单机网络存储也存在一些弊端。它的扩展级别有限,只支持纵向级联扩展,并且所有数据都需要通过主机传输,难以提高性能。在可靠性方面,它不支持节点故障,一旦主机损坏,所有存储都无法访问。因此,行业推出了可以横向扩展的分布式存储,冷波将其称为分布式存储1.0,主要运行在局域网内。

分布式存储1.0的优势在于横向扩展,每个存储服务器可以独立接入网络,当容量或性能不足时,可以动态增加节点。每台机器独立接入网络,一台机器的损坏不会影响其他机器,可以提供统一的命名空间,所有人都可以通过单一数据卷进行访问。性能可以叠加,避免传统存储的性能瓶颈。如果有大量数据请求,数据可以通过网络在不同机器间传输,实现性能叠加和负载平衡。在冗余性方面,即使损坏一台或多台存储,数据仍可正常读取,业务系统不会中断,卷的划分也更加灵活和方便。

目前有许多分布式存储系统,其中两个典型的是GlusterFS和Ceph,在这两个系统中,冷波公司都参与了一些深度研究,许多企业级系统也基于它们提供服务。GlusterFS是一种主流的分布式文件存储系统,稳定可靠,没有元数据架构,扩展性也很好,但小文件性能较差,适合非结构化数据存储。Ceph目前是最流行的开源分布式存储解决方案,提供了块、对象、文件等多种接口,功能丰富,活跃的社区开发了许多商业解决方案。然而,Ceph对硬件配置有较高要求,在生产环境中文件存储不太稳定,对运维的要求也较高。

总结起来,传统分布式存储存在一些缺陷,其中之一是中心化的缺陷。由于设备集中在一个局域网中,它的安全性和可靠性依赖于中心化的强运维。如果想要

猜你喜欢

关注我们

微信二维码

微信