Wednesday, January 14, 2009

Phân tích kết quả thi cử THPT 2006-2008

Hôm nay thấy VNN có đăng bài về tỉ lệ tốt nghiệp thi THPT 2007-2008 (nhưng có cả số liệu từ 2006) có kèm theo các số liệu cho từng tỉnh thành trong nước. Số liệu này bao gồm: tỉ lệ tốt nghiệp 2008 lần 1 (không hiểu sao có lần 1”), 2007 lần 1, và 2006. Ngoài ra, còn có tỉ lệ tốt nghiệp “khá giỏi”.

Như bao nhiêu chuyện khác, số liệu được trình bày không đầy đủ! Nhưng có còn hơn không. Tôi download số liệu về máy tính và làm thử vài phân tích nhanh để trả lời 4 câu hỏi như sau:

1. Độ khác biệt (hay dao động – variation) về tỉ lệ tốt nghiệp giữa các tỉnh thành và độ dao động trong mỗi tỉnh thành khác nhau như thế nào?

2. Có sự nhất quán nào giữa tỉ lệ tốt nghiệp qua các năm? Nói cách khác, những tỉnh thành có tỉ lệ tốt nghiệp cao có duy trì tỉ lệ này qua 3 năm hay không?

3. Có mối tương quan nào giữa tỉ lệ tốt nghiệp và tỉ lệ khá giỏi giữa các tỉnh thành?

4. Làm sao sử dụng những số liệu này để xếp hạng các tỉnh thành? Hiện nay Bộ GDĐT (Cục khảo thí gì đó) họ xếp hạng rất hời hợt và ở trình độ thấp. Cần phải làm tốt hơn và khách quan hơn.

Để trả lời câu hỏi 1, tôi sử dụng mô hình mixed-effects để ước tính phương sai (variance) về tỉ lệ tốt nghiệp (TLTN) và tỉ lệ khá giỏi (TLKG) giữa các tỉnh và trong mỗi tỉnh thành. Thuật ngữ thống kê gọi là “between-provinces variance” (B) và “within-province variance” (W). Kết quả như sau:

TLTN: B = 11.8, W = 296.5
TLKG: B = 16.7, W = 19.8

Thật thú vị! Đối với tỉ lệ tốt nghiệp, phần lớn dao động là trong mỗi tỉnh qua các năm, chứ không phải giữa các tỉnh thành! Tổng phương sai là 11.8 + 296.5 = 308.3, nhưng 96% là do dao động qua 3 năm trong mỗi tỉnh thành. Điều này cũng nói lên rằng độ tin cậy của tỉ lệ tốt nghiệp quá thấp.

Tuy nhiên, đối với tỉ lệ học sinh khá giỏi thì độ dao động giữa các tỉnh thành và trong mỗi tỉnh thành tương đương nhau. Hệ số tin cậy (reliability) chỉ 16.7/(16.7+19.8) = 0.46. Điều này một lần nữa cho thấy tỉ lệ học sinh khá giỏi cũng không phải là một chỉ số đáng tin cậy!

Để trả lời câu hỏi thứ hai tôi thử dùng R để tìm hệ số tương quan về tỉ lệ tốt nghiệp (viết tắt là pcgrad) 3 năm. Kết quả có thể xem qua biểu đồ sau đây. Hệ số tương quan giữa năm 2008 và 2007 khá tốt (0.87), nhưng giữa năm 2008 và 2006 (0.37) hay 2007 và 2006 (0.24) thì thấp quá. Chưa biết kết quả này nói lên điều gì, nhưng có lẽ từ ngày ông Nguyễn Thiện Nhân nhậm chức bộ trưởng và phát động “phong trào 3 không” thì tỉ lệ tốt nghiệp có vẻ ổn định hơn.

Tính chung cho tất cả tỉnh thành thì tôi thấy như sau: tỉ lệ tốt nghiệp năm 2006 là 92.1% (SD 6.3), đến năm 2007 giảm xuống còn 63.5% (SD 17.8), và năm 2008 thì còn 73.4% (SD 12.2). Chú ý SD của năm 2006 rất thấp, nhưng sau khi ông Nhân phát động phong trào 3K thì SD tăng lên rõ nhưng chỉ số trung bình giảm xuống. Điều này cho thấy có lẽ cho thấy kết quả thi cử hai năm gần đây phản ảnh chính xác hơn khả năng của học sinh.

Trả lời câu hỏi 3 thì biểu đồ dưới đây cho thấy hệ số tương quan giữa TLTN và TLKG thấp. Nói cách khác, tỉnh thành có TLTN cao không có nghĩa là có nhiều học sinh khá giỏi. Ngoài ra, một điều thú vị là hệ số tương quan giữa TLTN và TLKG dao động khá lớn giữa các năm: 2008 là 0.66, 2007 và 2006 là 0.49.

Câu trả lời cho câu hỏi số 4 thì cần phải làm phân tích thêm. Tôi đang tìm cách sử dụng R để làm cho gọn và nhẹ, nhưng phải cần thời gian. Nói chung, số liệu này cần khai thác thêm nữa thì cũng có khối chuyện hay đấy.

Tất cả các phân tích sơ khởi (chơi chơi) trên đây cho thấy thi cử trong năm qua có vẻ phản ảnh chính xác hơn (xin nhấn mạnh “chính xác hơn”, chứ không phải “chính xác”) khả năng của học sinh. Nhưng cả hai tỉ lệ tốt nghiệp và tỉ lệ học sinh khá giỏi đều không đáng tin cậy. Điều này có nghĩa là những xếp hạng của Cục khảo thí của Bộ GDĐT là vô nghĩa.

NVT


2 comments:

Anonymous said...

Bac oi bac co dinh gui bai nay cho Bo giao duc hay bao chi nao de ho dang khong bac?

Nguyễn Văn Tuấn said...

Chưa hài lòng mấy, nên chưa gửi đi. Mấy số liệu của cục khảo thí tôi phát hiện ra là không phù hợp với số liệu của Tổng cục thống kê! Chẳng hiểu họ làm ăn ra sao mà số liệu lộn xộn quá.

Tôi đã có một phương pháp xếp hạng dựa vào các số liệu này, nhưng cần phải có thì giờ ngồi xuống phân tích thì mới có kết quả được.

NVT