找回密码
 立即注册

扫一扫,登录网站

首页 区块链生态 查看内容
  • 2925
  • 0
  • 分享到

邬贺铨院士:AI时代的数据要素开发与治理

2023-11-10 08:50

来源: 国家数据局

加快数据基础设施建设


大模型的数据训练与推理都需要算力支撑,中国 2022 年算力总规模为 180Eflops,低于 2021 年美国的 200Eflops,其中智能算力 2022 年中国为 41Eflops,不及 2021 年美国的 65Eflpos,这反映了我国在大模型的数据训练和推理算力上的差距。算力的建设是市场行为,但国家统筹推进将优化资源的利用和产业的合理布局。“东数西算”作为国家战略部署具有中国特色,反映我国区域经济、地理气候特点和能源分布的格局,政府之手的作用在东西部数据资源配置与有效应用上不是可有可无的。西部不足之处是数据中心产业配套能力薄弱和人才短缺,需要同步规划布局数据清洗标注、数据机房产品及服务业的培育发展,延伸产业链上下游,在做好承接东部的温冷数据的存算的同时,还要带动起当地热数据的上云服务,使西部的数据集群发展形成良性循环。
算力的布局需要处理好几方面的关系,一是通用算力与智能算力的合理比例,通用算力以 CPU 为主,适合处理政务、智慧城市和智能客服等数据/计算密集的事务性任务;智能算力以 GPU 为主,适合做大模型的训练,注意到在数据训练过程中还需要算法工程师介入和微调,智算中心适于在数据源集中和算法工程师聚集地建设,不宜全面开花,动用财政资金支持的大型智算中心的建设应慎重规划。二是自建算力与云原生算力,很多单位有自建算力的积极性,但麦肯锡报告显示,商用和企业数据中心的服务器很少超过 6% 的利用率,通常高达 30% 的服务器带电闲置。需要鼓励中小企业从自购 AI 服务器搭建数据中心向采购云服务转变,既降低成本又提高利用率,增强抗 DDoS 的能力及减碳;需要引导县级地方政府使用省地集中建设的政务云代替独立采购 IT 基础设施。三是存算比例,存力与算力需配合,内存与算力合理比例是 GB/Gflops 为 1,避免因存力短缺造成算力等待而影响处理效率,据华为/罗兰贝格报告,2020 年美国为 1:0.9,中国为 1:2.4。四是灾备容量与主用数据中心存储容量之比,数据中心需异地双容灾备份,关键数据实现本地双活,2020 年当年数据灾备保护占数据中心存储投资的比例全球平均为 27.4%,而我国只有 7.8%,需重视改进。

版权申明:本内容来自于互联网,属第三方汇集推荐平台。本文的版权归原作者所有,文章言论不代表链门户的观点,链门户不承担任何法律责任。如有侵权请联系QQ:3341927519进行反馈。
相关新闻
发表评论

请先 注册/登录 后参与评论

    回顶部