要充分释放开放数据的潜力,并降低大型语言模型(LLM)训练成本、促进研究数据共享及支持不可阻挡的 DApp 托管,数据基础设施必须从中心化向去中心化过渡。
当前,开放数据驱动着新兴技术经济,市场估值超过 3,500 亿美元。然而,许多数据源仍依赖中心化平台,与 Web3 追求的自治性和抗审查性理念相悖。去中心化架构不仅能解决用户应用的安全漏洞,还能在多个领域带来效率提升,包括 DApp 托管、交易机器人运行、研究数据共享及 LLM 训练等。
LLM 训练成本降低
开源 AI 项目 DeepSeek 影响巨大,曾引发美国科技股市值蒸发 1 万亿美元,凸显了开放数据的价值。相比 OpenAI 的 GPT-4 训练成本超 1 亿美元,DeepSeek R1 仅需 550 万美元,表明去中心化基础设施能够降低 AI 训练成本。此外,去中心化节点运行者可充当 AI 端点,以更低门槛提供计算服务。例如,去中心化计算协议 Akash 提供的计算资源成本比中心化云服务低 85%。
研究数据共享更可及
传统学术期刊存在高昂的订阅费用,阻碍数据共享。而基于区块链的零知识(ZK)机器学习模型,可在保护隐私的前提下实现无需信任的数据计算。去中心化基础设施还能为数据贡献者提供激励,确保科学数据远离昂贵期刊的封锁,促进开放研究。
DApp 托管更可靠
AWS、Google Cloud 等中心化平台存在单点故障风险,曾导致 Infura 服务中断、MetaMask 限制用户访问等问题。去中心化基础设施能消除对单一提供商的依赖,提高应用可用性。例如,去中心化金融(DeFi)协议可通过 Chainlink 访问链上价格数据,而非依赖中心化 API。此外,Web3 RPC 市场需求巨大,每年潜在规模达 1 亿至 2 亿美元,随着去中心化数据层的增长,每日请求量或超 1 万亿次。
开放数据的未来在去中心化
未来,区块链客户端将进一步卸载存储和计算任务至专门的去中心化协议。例如,Solana 率先采用 Arweave 进行链上存储,展现了去中心化存储的可行性。随着中间件协议的模块化发展,数据基础设施将朝去中心化演进,提供无需信任、分布式、低成本且抗审查的解决方案,最终成为应用开发者的首选。