DS200.M21-Phân Tích Dữ Liệu Lớn
Học kỳ 2 Năm 3 Năm học 2021-2022
Giảng Viên:
- TS Đỗ Trọng Hợp
Nhóm SVTH:
- Phạm Đức Thể
- Võ Minh Trí
- Trần Triệu Vũ
- Thu thâp, xây dựng và phân tích bộ dữ liệu
- Hướng tiếp cận: Để tạo ra mô hình dự đoán độ trễ chuyến bay, chúng tôi tiến hành xây dựng các mô hình Máy Học (Machine Learning) như: Logistic Regression, Decision Tree Classifier, Random Forest Classifier, Naive Bayes được hỗ trợ bởi Machine Learning Library (MLlib) là một thư viện máy học của Spark. Để đánh giá mô hình chúng tôi sử dụng 4 độ đo là: Precision, Recall, Accuracy và F1–score.
- Kết quả: Kết quả cao nhất mà chúng tôi đạt được là F1-macro = 45.27% sử dụng DecisionTree.
Phạm Đức Thể
Thể ~/~