摘要

随着材料设计逐渐向"数据驱动"的方向发展,数据集的规模和质量实际上成为各类智能算法发挥效益的瓶颈.文献报道或尚未公布的海量实验数据是构建高质量数据集的宝库,但长期以来缺乏用于存储、整理、产生有关数据集的专门数据库或数据管理系统.本文以高温永磁合金代表体系Sm-Co基多元合金为例,介绍了本课题组构建的集成数据采集、数据标注、数据抽取与转换的一体化智能数据库及其管理系统.对材料的元素成分、物相组成、晶体结构、制备工艺、性能及其测试方法等各方面的数据建立了关系模型,实现了相关数据的逻辑关联并高度结构化,从而可根据具体的材料设计需求检索出高质量的数据集.建立的信息管理系统可实现多用户在线标注数据,具有数据录入准确高效、数据统一规范、最大程度消除冗余信息等特点.应用实践表明,建立的专用数据库及信息管理系统在数据驱动材料设计研究领域可发挥重要作用.