Ha Thu Hoang , Dang Thi Hong Nhan and Nguyen Thanh Tien *

* Corresponding author (nttien@ctu.edu.vn)

Abstract

In this study, we present a workflow for data-driven materials science discovery using a machine learning (ML) algorithm - an artificial neural network (ANN). The focus is on predicting the energy band gap (Egap) of materials, a key electronic property in solid-state physics. By employing supervised machine learning techniques and a large dataset, the DenseNet model is optimized to accurately predict Egap values. The effectiveness of the DenseNet model is demonstrated through evaluation metrics such as the coefficient of determination (R²), Mean Absolute Error (MAE), and Root Mean Squared Error (RMSE). The results show that the model achieves its best performance with an R² of 0.7924 on the training set and 0.6682 on the validation set. This research not only contributes to the development of efficient computational methods for materials science but also opens up new avenues in the discovery and design of novel materials.

Keywords: Energy band gap, machine learning, Artificial neural network

Tóm tắt

Nghiên cứu này trình bày một quy trình làm việc để khám phá khoa học vật liệu dựa trên dữ liệu thông qua thuật toán học máy (ML) - mạng Neural nhân tạo (ANN). Trong đó, tập trung vào việc dự đoán năng lượng vùng cấm (Egap) của vật liệu, một tính chất điện tử quan trọng trong vật lý chất rắn. Bằng cách sử dụng các kỹ thuật học máy có giám sát và tập dữ liệu lớn, mô hình DenseNet được tối ưu hóa để dự đoán chính xác giá trị Egap. Nghiên cứu đã chứng minh tính hiệu quả của mô hình DenseNet thông qua các chỉ số đánh giá như hệ số xác định (R²), sai số tuyệt đối trung bình (MAE) và sai số căn quân phương (RMSE). Kết quả cho thấy mô hình đạt hiệu suất tốt nhất với R² là 0.7924 trên tập huấn luyện và 0.6682 trên tập kiểm định. Nghiên cứu này không chỉ đóng góp vào việc phát triển các phương pháp tính toán hiệu quả cho khoa học vật liệu mà còn mở ra những hướng nghiên cứu mới trong việc khám phá và thiết kế vật liệu mới.

Từ khóa: Năng lượng vùng cấm, máy học, mạng Neural nhân tạo

Article Details

References

Askanazi, E., & Grinberg, I. (2023). Distance-based Analysis of Machine Learning Prediction Reliability for Datasets in Materials Science and Other Fields. arXiv.
https://doi.org/10.48550/arXiv.2304.01146

Askanazi, E. M., Lazar, E. A., & Grinberg, I. (2023). Identification of high-reliability regions of machine learning predictions in materials science using transparent conducting oxides and perovskites as examples. arXiv. https://doi.org/10.48550/arXiv.2304.02218

Chowdhury, S., Hill, H. M., Rigosi, A. F., Vora, P. M., Walker, A. R. H., & Tavazza, F. (2022). Review of Theoretical and Computational Methods for 2D Materials Exhibiting Charge Density Waves. arXiv.
https://doi.org/10.48550/arXiv.2201.06615

Cole, J. M. (2020). A Design-to-Device Pipeline for Data-Driven Materials Discovery. Accounts of Chemical Research, 53(3), 599–610.
https://doi.org/10.1021/acs.accounts.9b00470

Cui, J., Li, X., Zhao, H., Wang, H., Li, B., & Li, X. (2022). Epoch-Evolving Gaussian Process Guided Learning for Classification. IEEE Transactions on Neural Networks and Learning Systems, 35(1), 326-337. https://doi.org/10.1109/TNNLS.2022.3174207

Faber, F. A., Lindmaa, A., Von Lilienfeld, O. A., & Armiento, R. (2017). Machine Learning Energies of 2 Million Elpasolite (ABC2D6) Crystals. Physical Review Letters, 117(13), 135502. https://doi.org/10.1103/PhysRevLett.117.135502

Hu, Z., Li, Y., Lyu, J., Gao, D., & Vasconcelos, N. (2023). Dense network expansion for class incremental learning. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 11858-11867). https://doi.org/10.48550/arXiv.2303.12696

Irawan, A., Putra, A. M., & Ramadhan, H. (2022, July). A DenseNet Model for Joint Activity Recognition and Indoor Localization. In 2022 IEEE International Conference on Industry 4.0, Artificial Intelligence, and Communications Technology (IAICT) (pp. 61-65). IEEE.
https://doi.org/10.1109/IAICT55358.2022.9887407

Lin, G., Chen, F., Zhang, Z., Zhang, A., Wang, X., & Zhou, C. (2023, May). DenseNeXt: An Efficient Backbone for Image Classification. In 2023 15th International Conference on Advanced Computational Intelligence (ICACI) (pp. 1-6).
https://doi.org/10.1109/ICACI58115.2023.10146197

Liu, H., Xu, L., Ma, Z., Li, Z., Li, H., Zhang, Y., ... & Wang, L. L. (2023). Accurate prediction of semiconductor bandgaps based on machine learning and prediction of bandgaps for two-dimensional heterojunctions. Materials Today Communications, 36, 106578. https://doi.org/10.1016/j.mtcomm.2023.106578

Manzotti, P., Schiavi, F., Nosenzo, F., Pitra, P., & Ballèvre, M. (2022). A journey towards the forbidden zone: a new, cold, UHP unit in the Dora-Maira Massif (Western Alps). Contributions to Mineralogy and Petrology, 177(6), 59.
https://doi.org/10.1007/s00410-022-01923-8

Mondal, B., Kröner, M., Hepp, T., Volz, K., & Tonner-Zech, R. (2023). Accurate first principles band gap predictions in strain engineered ternary III-V semiconductors. Physical Review B, 108(3), 035202.
https://doi.org/10.1103/PhysRevB.108.035202

Niharika, D., S., D. (2023). Epoch and accuracy based empirical study for cardiac MRI segmentation using deep learning technique. PeerJ, 11, e14939.
https://doi.org/10.7717/peerj.14939

Saahil, A., Smitha, R. (2020). Significance Of Epochs On Training A Neural Network. International Journal of Scientific & Technology Research. 9(06), 485-488.
https://www.ijstr.org/final-print/jun2020/
Significance-Of-Epochs-On-Training-A-Neural-Network.pdf

Smith, J. (2023). Effects of Machine Learning Algorithms for Predicting and Optimizing the Properties of New Materials in the United States. European Journal of Physical Sciences, 6(1), 23-34.
https://doi.org/10.47672/ejps.1444

Wang, S., Luo, L., & Guo, Y. (2022). Wider transmission forbidden gaps and tamm state in a complex optoelectronic superlattice based on monolayer MoS2. Micro and Nanostructures, 170, 207378. https://doi.org/10.1016/j.micrna.2022.207378

Yadav, L. (2024). Atoms as words: A novel approach to deciphering material properties using NLP-inspired machine learning on crystallographic information files (CIFs). AIP Advances, 14(4). https://doi.org/10.1063/5.0187741