Sunday, March 8, 2015

“6200 người nhập viện vì đánh nhau là bình thường”: một nhận xét bất bình thường

Đó là nhận định của Bộ Y tế về con số hơn 6200 người bị nhập viện vì ẩu đả nhau trong 9 ngày nghỉ Tết (1). Chưa nói đến ngôn ngữ chính trị (vốn rất dở), chỉ cần xem qua dữ liệu tôi thấy đây là một nhận định rất sai. Không thể xem hàng ngàn trường hợp đánh nhau đến nhập viện là bình thường được. Trong cái note này tôi sẽ chỉ ra rằng đó là một “hiện tượng” bất bình thường bằng cách dùng chính con số của của Bộ Y tế.


Cách mà Bộ Y tế lí giải con số đó là “bình thường” có thể xem là một cách ngụy biện thống kê. Họ lí giải như sau: "Nếu chia cụ thể con số gần 100 trường hợp trong 9 ngày thì trung bình mỗi ngày mỗi địa phương chỉ xảy ra khoảng 11 trường hợp nhập viện vì đánh nhau. Con số này không có gì bất thường" (1).

Có cái gì đó buồn cười trong lí giải trên! Con số 11 trên là họ lấy 6207 trường hợp ẩu đả chia cho 63 [tỉnh thành], rồi chia cho 9 ngày [thời gian nghỉ Tết]. Tức là mỗi tỉnh chỉ có 11 ca nhập viện mỗi ngày. Có lẽ các bạn tự hỏi sao họ không chia cho 24 giờ để con số trung bình chỉ còn 0.46, tức là mỗi giờ [trong thời gian nghỉ Tết] ở mỗi tỉnh thành chỉ có 0.46 người nhập viện vì đánh nhau! Muốn làm cho sự kiện lớn thì tính trên mỗi ngày cho cả nước; muốn làm cho sự kiện nhỏ thì chia cho số giờ, thậm chí phút! Cách minh họa đó cho thấy “nói dóc bằng thống kê” nó trơ trẽn và vô duyên như thế nào. Thật ra đó là một ngụy biện mà giới khoa học gọi là “fallacy of average”, khi nào có dịp tôi sẽ quay lại khái niệm này. Nhưng cách dùng con số thống kê của Bộ Y tế làm tôi nhớ đến câu nói nổi tiếng của Nhà thơ Andrew Lang "Some individuals use statistics as a drunk man uses lamp posts - for support rather than for illumination" (tạm dịch "Vài người dùng con số thống kê như là một gã say rượu dùng cái đèn đường -- họ dùng để tìm điểm tựa hơn là để soi sáng vấn đề).  

Quay lại nhận xét “bình thường”, câu hỏi đặt ra là thế nào là bình thường? Xin chú ý chữ “bình thường” tôi để trong ngoặc kép (bởi vì theo chuẩn mực đạo đức, đánh nhau đến nhập viện là không bình thường). Cách hợp lí nhất là so sánh số ca nhập viện trung bình mỗi ngày trong thời gian nghỉ Tết với thời gian ngoài Tết.

Tính trung bình mỗi ngày trong thời gian nghỉ Tết vừa qua có ~690 người nhập viện vì đánh nhau. Nhưng chúng ta không biết trong thời gian ngoài Tết, có bao nhiêu ca nhập viện mỗi ngày vì đánh nhau. Do đó, tôi nghĩ đến 2 cách để so sánh: thứ nhất là so số ca nhập viện vì ẩu đả với số ca tai nạn giao thông ngày thường. Thứ hai là so sánh với cùng thời gian những ngày nghỉ Tết các năm trước. Hai so sánh này sẽ giúp chúng ta có một nhận xét đúng đắn và có bằng chứng hơn.

So với số ca tai nạn giao thông

Tuy nhiên, chúng ta biết rằng trong năm 2013 có 32266 người bị thương tích vì tai nạn giao thông (2). Tính trung bình mỗi ngày có 88 người bị thương vì tai nạn giao thông. Nếu tính cả 9805 người chết vì tai nạn giao thông, thì mỗi ngày có 115 người bị thương và tử vong do tai nạn giao thông.

Nhưng trong thời gian nghỉ Tết, mỗi ngày có đến 690 người nhập viện vì ẩu đả nhau. Như vậy, tính trung bình tỉ suất nhập viện vì ẩu đả trong ngày Tết tăng gấp 6 lần so với tỉ suất thương vong vì tai nạn giao thông. Xin nhắc lại: cao gấp 6 lần. Có thể xem sự chênh lệch đó là “bình thường” không? Tôi nghĩ chỉ có người có suy nghĩ bất bình thường mới nói đó là “bình thường”.

So với kì nghỉ Tết năm 2012 và 2013

Một cách khác để đánh giá bình thường hay không là so sánh tỉ suất năm 2014 với các năm trước. Bài báo trên Vietnamnet cho biết số ca nhập viện vì đánh nhau trong ngày Tết qua các năm như sau:

Năm 2014: 6702 ca 
Năm 2013: 4737 ca 
Năm 2012: 3995 ca

Như vậy, so với năm 2012, số ca ẩu đả và nhập viện năm 2014 tăng đến 55%! Rõ ràng có sự gia tăng về số ca ẩu đả đến nỗi phải nhập viện. Nhưng so sánh đó chưa công bằng vì chúng ta phải tính đến dân số, mà dân số thì tăng trưởng mỗi năm. Dân số của VN qua 2012-2014 là như sau:

Năm 2014: 92.55 triệu người
Năm 2013: 89.71 triệu người
Năm 2012: 88.77 triệu người

Vấn đề đặt ra là sự gia tăng số ca nhập viện là do dao động thống kê hay là do yếu tố nào khác? Chúng ta phải kiểm định giả thuyết đàng hoàng. Gọi tỉ suất nhập viện vì ẩu đả trong thời gian nghỉ Tết năm 2012, 2013 và 2014 lần lượt là L12, L13, và L14. Dùng số liệu trên, chúng ta có thể ước tính L(t) cho từng năm như sau:

Năm 2014: L14 = 6702 / (92.55*9) = 8.046 trên 1 triệu; 
Năm 2013: L13 = 4737 / (89.71*9) = 5.867 trên 1 triệu; 
Năm 2012: L12 = 3995 / (88.77*9) = 5.000 trên 1 triệu;

Nếu phát biểu của Bộ Y tế là đúng (tức “bình thường”) thì chúng ta kì vọng rằng L14 = L13 = L12, hoặc có khác nhau chút ít do dao động thống kê. Nhưng kết quả tính toán trên cho thấy hình như giả thuyết này không đúng. Tuy nhiên, vẫn chưa thể kết luận được rằng L14 khác với L13 hay L12, vì chúng ta chưa xem xét đến yếu tố dao động ngẫu nhiên qua các năm.

Chúng ta cần phải tính xác suất dữ liệu xảy ra nếu L14=L13 là bao nhiêu. Nói cách khác, gọi dữ liệu là D, và giả thuyết bình thường là H0: L14=L13, chúng ta cần tính P(D | H0). Nếu xác suất này là thấp, thì chúng ta có thể bác bỏ giả thuyết “bình thường”, và kết luận rằng sự gia tăng số ca nhập viện trong dịp Tết vừa qua là không “bình thường”.

Nhưng làm sao tính xác suất đó? Phương pháp thống kê đơn giản nhất và thích hợp nhất để so sánh 2 tỉ suất là phương pháp kiểm định Poisson (3). Giả định rằng tỉ suất L14, L13 và L12 tuân theo luật phân bố Poisson. Theo luật phân bố Poisson, phương sai của số ca nhập viện cũng chính là L. Điều này dẫn đến một phương pháp kiểm định giả thuyết rất đơn giản, dựa trên khác biệt giữa 2 thời gian. Dùng ngôn ngữ R, tôi tính được xác suất như sau:

So sánh tỉ suất năm 2014 và 2013:

> poisson.test(c(6207, 4737), c(9*92.55, 9*89.71), alternative=c("two.sided"))
P-value < 2.2e-16
rate ratio: 1.27 (95 percent confidence interval: 1.22, 1.32)

Nói cách khác, tỉ suất nhập viện vì đánh nhau năm 2014 cao hơn năm 2013 là 27%, và khoảng tin cậy 95% dao động từ 22% đến 32%. Trị số P rất nhỏ (2.2e-16).
Tương tự, so sánh tỉ suất năm 2014 và 2012:

> poisson.test(c(6207, 3995), c(9*92.55, 9*88.77), alternative=c("two.sided"))
P-value < 2.2e-16
rate ratio: 1.49 (95 percent confidence interval: 1.43, 1.55)

Tỉ suất nhập viện vì đánh nhau năm 2014 cao hơn năm 2012 đến 1,49 lần, và khoảng tin cậy 95% dao động từ 1.43 đến 1.55 lần. Một lần nữa, trị số P cũng rất thấp.

Nói tóm lại, nếu giả thuyết “bình thường” là đúng thì xác suất mà chúng ta quan sát tỉ suất năm 2014 so với các năm trước là rất rất thấp. Nói cách khác, số liệu thực tế cho thấy sự khác biệt về tỉ suất số ca nhập viện vì ẩu đả nhau trong thời gian 2012-2014 là không phải do yếu tố dao động thống kê, mà có sự khác biệt thật sự. Do đó, giả thuyết “bình thường” bị loại bỏ.

Để kết luận, xét trên 2 tiêu chí (so sánh theo thời gian và so sánh với số ca tai nạn giao thông) đều cho thấy số ca nhập viện vì ẩu đả nhau trong thời gian nghỉ Tết vừa qua là quá cao. Trong 3 năm liên tiếp, số ca nhập viện vì ẩu đả liên tục gia tăng. Do đó, nhận định “6.200 người nhập viện vì đánh nhau là bình thường” chẳng những rất sai lầm mà còn rất … bất bình thường. Một Bộ chuyên lo quản lí sức khỏe của một nước mà có thể thốt lên rằng 6000 ca nhập viện vì ẩu đả là "bình thường" thì quả thật người dân cũng có lí do để quan tâm đến cảm xúc (empathy) của Bộ đó. Có lẽ Gs Trần Ngọc Thêm nói đúng, “Bởi vì hiện nay, theo cảm nhận của nhiều người có kinh nghiệm, sự sa đọa của những phẩm chất con người, của văn hóa đã xuống chạm đáy rồi,” nên một sự kiện kinh hoàng đối với thế giới thì lại bình thường ở VN.   
====



(3) Gọi biến phản ảnh số ca nhập viện là X, và x là số ca nhập viện, luật phân bố Poisson phát biểu rằng P(X = x) = e^(-m)*m^x / x! Có thể dùng rpois(n, lambda) trong R để mô phỏng số ca nhập viện rất dễ dàng.

5 comments:

PHAM VO KY, M.D said...

Gs Nguyễn Văn Tuấn phân tích rất khoa học.

Anonymous said...

một nhận xét bất bình thường trong một xã hội xem bất bình thường là bình thường thì nhận xét đó trở thành bình thường .

Anonymous said...

Cái vô trách nhiêm,vô cảm &/hoặc cái thiếu hiểu biết đã dc chỉ ra!

Econometrics Analysis. said...

Cá nhân tôi rất khâm phục những hiểu biết sâu và rộng về lĩnh vực thống kê của GS, nếu có điều kiện xin GS hướng dẫn thêm khi nào sử dụng hồi quy Poisson, khi nào sử dụng kiểm định Poisson. Cảm ơn GS đã dành thời gian đọc lời nhắn này.

hh.dh2001 said...

Kính thưa GS. Tuấn, đoạn này em thấy có lẽ thầy tính sai:
"...Năm 2014: 6702 ca
Năm 2013: 4737 ca
Năm 2012: 3995 ca
Như vậy, so với năm 2012, số ca ẩu đả và nhập viện năm 2014 tăng đến 55%!..."
Theo như em tính thì % tăng lên của số ca ẩu đả và nhập viện năm 2014 so với năm 2012 là (6702-3995)*100/3995 = 67.7%