· Slingshot & Filecoin Discover 接下来我们要说的是一个非常特别的项目,它有两个部分,一部分被称为Slingshot,另一部分称为Filecoin Discover,而这两个部分都是有协议实验室启动的,slingshot一个社区竞赛,动员你身边的人,将数据存储在Filecoin网络上,它更像是一个开放的市场,存储提供商可以在其中购买他们想要存储的数据集并保留在Filecoin网络上。在这两个板块中,我们存储了超过42PB的数据,这是Filecoin真正实现全球化的一个优势,因为我们可以存储来自全球各地的数据,正如上图所示,其中一些数据集已经存储在十多个国家。 当你考虑社区拥有的数据时,对于某些数据集,例如社区将构建的本地镜像,希望该数据集的副本离他们更近。这是Filecoin网络启用的功能。所以它只是让数据更多,高度可用,访问速度更快,且更具弹性。这就像你有10份副本而不是一份副本,这就使得你的数据从互联网上消失的可能性大大降低。 另外值得一提的是,我们一直在与由数百名社区成员组成的真正庞大的社区合作,这些社区成员共同努力保护这些数据集,因此我们还开发了类似关于如何保存这些数据集的文档库,与大型数据集交互,实现处理和载入PB规模数据在Filecoin网络上真的很容易。 · The Internet Archive 我们最近合作的一个项目是The Internet Archive-互联网档案馆。它是一个非营利的图书馆,包含数百万免费书籍、电影、软件和网站。现在,我们正在与互联网存档合作的目的是存档所谓的网络数据集。所以互联网档案所做的基本上是在每个总统任期结束时,他们会浏览并抓取美国的所有政府网站,并对所有这些网站进行快照。这样我们就可以保留这个记录,即我们的政府对其所从事的工作、使命和所做的事情的看法、如何从不同的管理变化到另一行管理等。目前有超过60,000个网站是该档案的一部分,而这些网站正在加入Filecoin,我们已经获得70+PB的互联网档案。 如果是这些将数据存储在几台服务器中确实没有意义,他们需要一个非常强大的基础设施,其中具有良好的机制、弹性和自愈特性,以便在未来千年发生的不可预见的情况下,这些数据可以继续存在。因此,Filecoin设计方式确实旨在长期保存数据,去中心化性质以及其中自我修复等特性也成为这些数据的选择它的理由。 · Columbia University & Max Planck Institute 这是我要说的最后一个案例是Columbia university & max planck institute。他们正在为气候数据集构建一个新的数据共享解决方案,他们都希望将这些数据贡献给一个类似的共享池,这样他们就可以对自己生成的数据以及来自其他研究人员的数据进行分析。目前有超过1.5PB的气候数据集、40多个研究机构参与到类似共享池和研究合作项目中。 (责任编辑:admin) |