Filecoin项目致力于存储世界上最有价值的信息。
在现今的信息社会中,信息的增长处于爆炸的势头,据统计全球每天有将近2.5?x字节的数据产生。
如此海量的数据并非每一个都有那么重要的意义需要被永久存储,但它们中一定有一些是人类在科学、数学、艺术等方面产生的非常重要的数据,需要被永久存储。
Filecoin是个基于区块链技术的去中心化存储项目。它有自己的区块链机制,同时有自己的代币。它的区块链机制提供了安全存储的保障,它的代币机制则催生了活跃的交易市场。
Filecoin团队曾经讨论过Filecoin的加密经济机制,在讨论中曾经提到当用户要处理海量的数据时,如何通过互联网在保证数据存储安全的情况下还要做到快速、廉价是个很大的挑战。
对于PB级甚至更大规模的数据存储,通常比较可行的方案是先用硬盘存储数据然后通过线下快递硬盘。
Filecoin项目也提供了相关的工具以支持这类线下通过物理设备传输数据的方式。
那什么情况下用户可以考虑采用线下传输数据的方式呢?通常考虑的因素有两个:成本和耗时。
我们先看成本,我们可以把存储系统看作一个网络---当数据从网络中的一个节点迁移到另一个节点时,有可能通过很高的成本获得很快的传输速度。
比如有一批海量数据(比如博物馆或图书馆)要上传、存储到某个去中心化网站(dweb)上,为了做到这一点,我们可以通过互联网传输数据,也可以通过物理设备线下传输数据。
当我们用互联网传输数据时,传输的成本会迅速增加。比如用今天的云存储服务,传输PB级数据要经过多次路由,产生大量网络流量费,如果在某些情况下我们为了快速存储而选择专线服务,那费用将更高。
根据计算,如果传输2.5PB数据,仅带宽费就需要14万美元,如果数据的存储会跨越不同区域,则所需的费用会更高。
现在档案馆、博物馆等这类数据信息已经超过了90TB,预计到2025年,会达到1.2PB。
比如英文版的百科全书包含了超过六百万文章、36亿单词。欧洲核子研究组织(CERN)公开的数据库包含1PB粒子物理实验的数据。伦敦自然历史博物馆包含了四百万件历史标本。国家档案馆的电子记录分馆包含500TB数据。这些都是及其重要的数据信息。
当我们考虑用硬盘存储和传输时(也即是用物理介质存储和转运数据),一个服务器级别的8TB硬盘价格大概在200美元。如果用它来传输2.5PB的数据,大概需要315个这样的硬盘,总价格大概为6.3万美元,即便再加上其它一些附加费用比如运费,关税等,总费用也远远低于用互联网传输的费用。
我们再看耗时,我们假设国家档案馆要将其电子记录迁移到另一台服务器上。如果用100Mbps的带宽传输500TB数据大概要花一年时间。
如果用硬盘进行这项工作,就只需要下载数据和快递硬盘,而这只需要1周时间就可以了。
很明显,在某些情况下,用物理设备传输数据更高效,更省成本。因此使用线下物理设备进行存储和传输数据在某些情况下是有很大优势的。
我是IPFS/Filecoin社区发起人晓熙(加入社区,联系v号:liandaoxixi),IPFS/Filecoin是全球共识最大的去中心化存储项目,我会定期在社区分享专业的资讯,为IPFS/Filecoin爱好者建设一个共赢的学习社区。
参考链接:https://filecoin.io/blog/offline-data-transfer-for-large-scale-data/