喵ID:ssLmek免责声明

SimXRD-4M: Big Simulated X-ray Diffraction Data Accelerate the Crystalline Symmetry Classification

SimXRD-4M:大量模拟 X 射线衍射数据加速晶体对称性分类

基本信息

DOI:
--
发表时间:
2024
期刊:
影响因子:
--
通讯作者:
Tong
中科院分区:
文献类型:
--
作者: Bin Cao;Yang Liu;Zinan Zheng;Ruifeng Tan;Jia Li;Tong研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

Spectroscopic data, particularly diffraction data, contain detailed crystal and microstructure information and thus are crucial for materials discovery. Powder X-ray diffraction (XRD) patterns are greatly effective in identifying crystals. Although machine learning (ML) has significantly advanced the analysis of powder XRD patterns, the progress is hindered by a lack of training data. To address this, we introduce SimXRD, the largest open-source simulated XRD pattern dataset so far, to accelerate the development of crystallographic informatics. SimXRD comprises 4,065,346 simulated powder X-ray diffraction patterns, representing 119,569 distinct crystal structures under 33 simulated conditions that mimic real-world variations. We find that the crystal symmetry inherently follows a long-tailed distribution and evaluate 21 sequence learning models on SimXRD. The results indicate that existing neural networks struggle with low-frequency crystal classifications. The present work highlights the academic significance and the engineering novelty of simulated XRD patterns in this interdisciplinary field.
光谱数据,特别是衍射数据,包含详细的晶体和微观结构信息,因此对于材料发现至关重要。粉末X射线衍射(XRD)图案在识别晶体方面非常有效。尽管机器学习(ML)对粉末XRD模式的分析有了显着提高,但由于缺乏训练数据而阻碍了进度。为了解决这个问题,我们介绍了迄今为止最大的开源模拟XRD模式数据集,以加速晶体学信息学的开发。 Simxrd包含4,065,346个模拟粉末X射线衍射模式,在33个模拟现实世界变化下,代表119,569个不同的晶体结构。我们发现晶体对称性固有地遵循长尾巴分布,并在Simxrd上评估了21个序列学习模型。结果表明,现有的神经网络与低频晶体分类斗争。目前的工作突出了该跨学科领域模拟XRD模式的学术意义和工程新颖性。
参考文献(2)
被引文献(0)
Modeling recurrent arrhythmias.
模拟复发性心律失常。
DOI:
10.1046/j.1540-8167.2001.00131.x
发表时间:
2001
期刊:
Journal of cardiovascular electrophysiology
影响因子:
2.7
作者:
Pritchett,EL;Wilkinson,WE
通讯作者:
Wilkinson,WE
A deep convolutional neural network for real-time full profile analysis of big powder diffraction data
DOI:
10.1038/s41524-021-00542-4
发表时间:
2021-05-21
期刊:
NPJ COMPUTATIONAL MATERIALS
影响因子:
9.7
作者:
Dong, Hongyang;Butler, Keith T.;Vamvakeros, Antonis
通讯作者:
Vamvakeros, Antonis

数据更新时间:{{ references.updateTime }}

Tong
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓