Skip to content

Phân tích dữ liệu điểm thi THPT Quốc Gia 2018 (Analysis of VNHSGE 2018 Results)

Notifications You must be signed in to change notification settings

tapdoanhonguyen/vnhsge-2018

 
 

Repository files navigation

Phân tích điểm thi THPT Quốc Gia 2018

I. ✅

II.
a) Phương pháp lọc dữ liệu điểm môn thi tốt nghiệp & môn thi xét tuyển

  • Bước 1: Xác định các khối thi (Tổ hợp các môn thi) phổ biến.
  • Bước 2: Tính và xếp hạng điểm các khối thi của từng thí sinh (Đảm bảo tham gia đầy đủ 3 môn thi).
  • Bước 3: Chọn khối thi có tổng điểm cao nhất là khối thi chính và 3 môn trong khối thi đó là môn thi xét tuyển, các môn còn lại là môn thi tốt nghiệp.

Important

Tránh Data Bias: Theo thống kê, có khoảng 90% thí sinh lựa chọn các tổ hợp A00, A01, B00, C00, D011. Nếu sử dụng toàn bộ tổ hợp hiện có để xét thì sẽ không đánh giá chính xác và hiệu quả nếu xảy ra đồng thời 2 yếu tố sau:

  • Có một môn thi nằm trong tổ hợp khối thi mà thí sinh kỳ vọng đạt điểm cao có điểm thi thấp hơn một môn thi khác do yếu tố đề thi.
  • Tổng điểm của 3 môn thi có khối thi không nằm trong tổ hợp xét tuyển yêu cầu của ngành/nhóm ngành mà thí sinh xác định ban đầu.

Do đó, lựa chọn các khối thi phổ biến giúp đảm bảo giảm được Selection Bias.

b)

III. Phân bố điểm thi lý tưởng cho kỳ thi THPT Quốc Gia:

Yếu tố khách quan

  • Trọng số của bài thi THPT dùng để xét tốt nghiệp: Giai đoạn 2015 - 2018, bài thi THPT Quốc gia chiếm 50% (Từ năm 2019, chiếm 70%). Tương đương với mức độ phân hóa giữa việc thi dùng để tốt nghiệp và thi dùng để xét tuyển Cao Đẳng, Đại Học.
  • Tính chất của bài thi: Phân bố điểm thi của nhóm thí sinh thi để tốt nghiệp tương tự phổ điểm bài thi Criterion-Referenced Test (CRT) và có đỉnh ở điểm phân hóa (từ nhận biết - thông hiểu sang vận dụng - vận dụng cao). Còn đối với phân bố điểm thi của nhóm thí sinh thi xét tuyển sẽ có dạng hình chuông phân phối chuẩn nằm phía bên phải của thang điểm tương tự phổ điểm bài thi Norm-Referenced Test (NRT).

Yếu tố chủ quan

  • Khác biệt yêu cầu về điểm số: Đối với các thí sinh thi tốt nghiệp, điểm số đủ điểm để tốt nghiệp là khác nhau giữa các thí sinh và phần lớn là ở mức dưới trung bình, do đó điểm số của nhóm thí sinh này khó để đại diện đánh giá kết quả học tập THPT. Trường hợp này phổ điểm có xu hướng lệch dương (Positive Skewed Distribution)
  • Chất lượng giáo dục không đồng đều: Vì kỳ thi có quy mô toàn Quốc nên số lượng và chất lượng thí sinh cũng sẽ khác nhau ở các khu vực, do sẽ phổ điểm có thể lệch âm (Negative Skewed Distribution).

a) Mô phỏng phân bố điểm thi sử dụng phân phối nhị thức (Binomial Distribution) với đề thi trắc nghiệm 40 câu (Đối với phần tốt nghiệp, từ mức điểm 5.25 trở đi sẽ được cộng thêm xác suất ngẫu nhiên chọn đúng 1/4 đáp án cho 20 câu tiếp theo và sau đó chuẩn hóa lại cho khớp với giả thuyết)

image

b) Trường hợp đề thi chưa chuẩn (phổ điểm của môn thi có dạng phân phối nhị thức tương tự như khi các thí sinh chọn đáp án ngẫu nhiên):

  • TH1: Nếu điểm thi có

image

III. Phân tích:

  1. Về số lượng
    a) Thí sinh dự thi theo môn
STT Môn thi Tổng số thí sinh Thi để tốt nghiệp % Thi để xét tuyển % Khối
1 Toán 916515 433399 47 483116 53 A00,A01,B00
2 Ngữ Văn 901626 250481 28 651145 72 C00,D01
3 Tiếng Anh 816202 543966 67 272236 33 A01,D01
4 Vật Lí 386731 206978 54 179753 46 A00,A01
5 Hóa Học 389276 175752 45 213524 55 A00,B00
6 Sinh Học 383298 295904 77 87394 23 B00
7 Lịch Sử 565242 142076 25 423166 75 C00
8 Địa Lý 548808 125642 23 423166 77 C00
9 GDCD 479104 479104 100

Note

Môn Tiếng AnhSinh Học là các môn có tỉ lệ thí sinh lựa chọn để xét tuyển Đại học thấp, do đó đây là môn sẽ có phân phối điểm thi khác biệt rõ nhất khi tách 2 phần điểm. Môn Lịch SửĐịa Lý do chỉ có một khối thi duy nhất nên sẽ không có khác biệt nhiều so với phổ điểm gốc (toàn bộ thí sinh).

b) Thí sinh dự thi theo khối

STT Khối Tổng số thí sinh có hình thành điểm Là khối thi có điểm cao nhất % % of Total
1 A00 382694 133927 35 15
2 A01 368370 46574 12 5
3 B00 381817 87394 22 9
4 C00 548411 423166 77 46
5 D01 811757 230924 28 25
STT Khối Số nguyện vọng %
1 A00 848444 30.83
2 D01 743246 27.01
3 A01 352149 12.8
4 C00 279742 10.17
5 B00 259317 9.42
6 Khác 10.49

Note

Đối chiếu giữa số lượng thí sinh (mỗi thí sinh/ một khối thi) và số lượng nguyên vọng. Khối C00 có số lượng thí sinh thi để xét tuyển cao hơn so với thực tế ≥ 143,000 thí sinh (Tổng số nguyện vọng/Tổng số thí sinh có điểm khối C00 cao nhất < 1).

Important

Các môn Lịch Sử, Địa Lýkhối C00 sẽ không được phân tích chính xác do không thể xác định số lượng thí sinh thực tế sử dụng điểm thi các môn và khối thi này để xét tuyển.

  1. Phân tích chi tiết các môn thi
    Môn Toán: image

Môn Ngữ Văn: image

Môn tiếng Anh: image

Môn Vật Lí: image

Môn Hóa Học: image

Môn Sinh Học: image

Note

Điểm thi của cả hai nhóm thí sinh đều lệch sang trái so với phổ điểm kỳ vọng khoảng 1.5-2.0 điểm.

**Môn Lịch Sử **: image

Note

Điểm thi của cả hai nhóm thí sinh đều lệch sang trái so với phổ điểm kỳ vọng khoảng 1.5-2.0 điểm.

Môn Địa Lý: image

Note

Điểm thi của cả hai nhóm thí sinh đều lệch sang trái so với phổ điểm kỳ vọng khoảng 1.5-2.0 điểm.

Môn Giáo dục Công Dân: image

Note

Điểm thi của cả hai nhóm thí sinh đều lệch sang trái so với phổ điểm kỳ vọng khoảng 1.5-2.0 điểm.

Khối thi: image

Note

Điểm thi của cả hai nhóm thí sinh đều lệch sang trái so với phổ điểm kỳ vọng khoảng 1.5-2.0 điểm.

Footnotes

  1. My reference.

About

Phân tích dữ liệu điểm thi THPT Quốc Gia 2018 (Analysis of VNHSGE 2018 Results)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 98.9%
  • Python 1.1%