当前位置:首页 > 知识 >

IPFS/Filecoin矿机集群与调度系统简介

星际云存CTO梅森

IPFS/Filecoin挖矿跟其它前辈币不一样,挖前辈币矿工随便找个地方就可以参与挖矿,但Filecoin区块链已经进入商业用途,如果想获得稳定挖矿收益,就必须通过专业的技术运维团队和基础设施,保持系统高效、安全和稳定。

给大家分享一下我们服务客户的挖矿集群方案和DevOps系统产品线路。

挖矿集群方案中:

1.Lotus-Node用于创建钱包和矿工,同步公链数据。钱包以冷钱包方式存入密钥管理中心管理。密钥管理中心的密钥通过军工加密机加密。

2.Lotus-Miner就像包工头,专注负责于执行WindowPoST和WinningPoST并将其提交给链,避免产生任务拥堵影响算力。此Miner矿工有主备配置,当主Miner出现故障,备份Miner自动接替主Miner工作。同时对Miner的配置和原数据需要做3-2-1规则的备份,即至少一份要在异地备份。

3.Lotus-Worker挖矿的繁重任务都是在这里执行的,包括:

AddPiece,PreCommit1(PC1),PreCommit2(PC2),Commit,Unseal

这个密封扇区的过程很消耗时间,我在Zk-Snark零知识证明中有讲解,这里主要是通过StackedDRG和Zk-Snark算法生成扇区和扇区证明。官方已经对这里做了优化。我们根据Miner和自己想封装的容量和时间,计算应该需要几名Worker工人即可。

4.MMU存储单元管理,根据Filecoin经济模型,客户挖矿(提供存储空间)需要先质押Fil币,1T质押约11Fil,如果系统不稳定,质押的币会被罚没。

存储主要需要解决三个问题:1存储弹性扩容,2支持高IO操作,3存储稳定性以及故障快速修恢复。

我们为客户提供的方案有SSD+RAID、分布式文件系统(如Ceph)和存储柜供客户选择。我们自研的系统能自动处理故障和错误修复,保障矿工算力稳定,避免惩罚和罚没。

总之保障集群保持系统高效、安全和稳定才能保证客户的投资回报率。

由于上面的系统指标和要求,我们自研开发了一套DevOps系统—-ISPx-Ops,目前基本已完成:

1.服务器自动安装和优化配置:使用PXE+Kickstart+TFTP+DHCP+FTP实现无人值守安装服务器。一套客户集群15台以上,在IDC机房只需要连接好设备节点网线,剩下的工作就交给ISPx-Ops系统的这个模块来完成,节省大量人力和上架时间。

2.CI/CD持续集成、持续交付和持续部署:Filecoin系统在持续升级和bug修复,系统优化和错误自动处理升级,公司业务系统上线升级,客户每隔一段时间会添加算力等这些繁重易错的工作,仅需要在ISPx-Ops系统后台点击几个按钮安全稳定完成。

3.错误处理中心:ISPx-Ops一直持续监控挖矿系统的日志,当监控道系统出现故障,会根据故障类型和编号,自动执行相应处理,比如监控到扇区出现封装故障,堵塞其它进程,ISPx-Ops错误处理中心会做出相应的修复工作。如果出现错误处理中心无法处理的故障,系统会通知相关维护人员,记录故障场景交给人工处理。工程师处理完毕后,编写自动处理预案,下次错误处理中心即可自动处理此问题。

4.安全管理中心:客户的挖矿钱包,质押的Fil币,产生的收益,Fil币的转入转出等,系统安全变得至关重要。防火墙区域划分、DMZ代理、VPN连接、登录审计等,严格按照金融级安全要求保护系统安全。客户挖矿钱包密钥存入离线密钥管理中心,配备军工级加密机对密钥管理中心加密。

5.监控中心:7x24小时监控系统性能、网络流量、磁盘容量、Socket连接等200多项监控指标,监控数据存入时序数据库(TSDB),同时集成Prometheus以防警报漏报,通过Grafana可视化监控和分析。

6.异地备份:天灾人祸在所难免,异地备份IDC越远越好,当主机房出现灾难,异地系统接管继续提供服务。ISPx-Ops会通过专线自动同步主机房到备份机房。

ISPx-Ops系统先简单介绍到这里,后面会持续提供Dfinity(ICP)、Mina、矿池挖矿业务、DeFi、NFT和Web3.0的技术服务,立足去中心化对ToC/B客户做最好的链云(云2.0)服务。

来源:星际云存

猜你喜欢

微信二维码

微信