您现在所在的位置:首页>>科技服务>>工作动态
计算中心数据成果入选北京市人工智能大模型高质量数据集
发布时间:2023-09-01 16:17

论坛现场

北京市人工智能大模型高质量数据集发布

在8月28日北京市石景山区举行的2023中国国际服务贸易交易会分论坛“通用人工智能算力论坛”上,北京市计算中心有限公司(以下简称“计算中心”)“小分子药物数据库、多肽药物库”入选了第二批北京市人工智能大模型高质量数据集。

现场发布了16家单位41个数据集,总量规模约112TB,涵盖医学、生物、金融等多个领域,将为通用大模型和行业大模型训练及应用落地提供坚实有力的资源保障。第二批北京市人工智能大模型高质量数据集的发布,标志着北京市在人工智能领域的数据资源储备和技术实力进一步增强,为推动通用人工智能技术的发展和应用奠定了坚实的基础。

计算中心“小分子药物数据库、多肽药物库”包含用于大规模虚拟筛选的小分子结构和多肽结构和相关的参数文件。经过多年的收集与整理,数据集多达446万个数据文件,同时支撑了计算中心自己的计算机辅助药物设计、分子对接等工作。这些小分子药物结构数据库和多肽药物结构库为研究人员提供了广泛的化合物和多肽结构信息,可供大规模虚拟筛选和药物设计使用。研究人员可以利用这些数据库中的化合物或多肽进行计算筛选,以找到与目标分子相互作用的候选药物,并进一步进行追踪和验证。该数据集已经获得北京国际大数据交易所颁发的数据资产证明。

(北京市计算中心有限公司)