Ha Thu Hoang , Dang Thi Hong Nhan and Nguyen Thanh Tien *

* Corresponding author (nttien@ctu.edu.vn)


In this study, we present a workflow for data-driven materials science discovery using a machine learning (ML) algorithm - an artificial neural network (ANN). The focus is on predicting the energy band gap (Egap) of materials, a key electronic property in solid-state physics. By employing supervised machine learning techniques and a large dataset, the DenseNet model is optimized to accurately predict Egap values. The effectiveness of the DenseNet model is demonstrated through evaluation metrics such as the coefficient of determination (R²), Mean Absolute Error (MAE), and Root Mean Squared Error (RMSE). The results show that the model achieves its best performance with an R² of 0.7924 on the training set and 0.6682 on the validation set. This research not only contributes to the development of efficient computational methods for materials science but also opens up new avenues in the discovery and design of novel materials.

Keywords: Energy band gap, machine learning, Artificial neural network

Tóm tắt

Nghiên cứu này trình bày một quy trình làm việc để khám phá khoa học vật liệu dựa trên dữ liệu thông qua thuật toán học máy (ML) - mạng Neural nhân tạo (ANN). Trong đó, tập trung vào việc dự đoán năng lượng vùng cấm (Egap) của vật liệu, một tính chất điện tử quan trọng trong vật lý chất rắn. Bằng cách sử dụng các kỹ thuật học máy có giám sát và tập dữ liệu lớn, mô hình DenseNet được tối ưu hóa để dự đoán chính xác giá trị Egap. Nghiên cứu đã chứng minh tính hiệu quả của mô hình DenseNet thông qua các chỉ số đánh giá như hệ số xác định (R²), sai số tuyệt đối trung bình (MAE) và sai số căn quân phương (RMSE). Kết quả cho thấy mô hình đạt hiệu suất tốt nhất với R² là 0.7924 trên tập huấn luyện và 0.6682 trên tập kiểm định. Nghiên cứu này không chỉ đóng góp vào việc phát triển các phương pháp tính toán hiệu quả cho khoa học vật liệu mà còn mở ra những hướng nghiên cứu mới trong việc khám phá và thiết kế vật liệu mới.

Từ khóa: Năng lượng vùng cấm, máy học, mạng Neural nhân tạo

