Tuesday, June 14, 2016

Cảm tính hoá con số

Hôm nọ, nhóm chúng tôi có một cuộc tranh luận nho nhỏ về cách diễn tả một con số. Một chuyên gia truyền thông viết rằng "In Australia a bone is broken due to poor bone health every 3.4 minutes" (Ở Úc, cứ mỗi 3.4 phút thì có một người bị gãy xương). Phe khoa học thì phản đối cách diễn tả đó, vì họ cho rằng nó ... buồn cười và trẻ con. Phe truyền thông thì nói cách diễn tả đó bình thường, và họ nói chẳng có gì sai cả. Tôi thì có cảm tình với phe khoa học, dù biết rằng họ không chỉ ra được cái sai trong cách phát biểu đó, nên họ chỉ nói ... trẻ con. Đây là một cách nói rất phổ biến, nhưng cũng là một vấn đề hơi tinh vi về mặt thống kê.



Thật ra, đứng trên mặt tính toán số học thì chẳng có gì sai. Mỗi năm cả nước Úc ghi nhận khoảng 154000 ca gãy xương (tức là những người nhập viện vì gãy xương). Nhưng có lẽ con số đó hơi lớn, và nói ra thì chẳng ai quan tâm, nên người ta có cách nói sao cho gần gũi (ngắn) hơn là diễn tả trên phút. Tính ra thì cứ 3.4 phút có một người bị gãy xương. Đó là lí giải của phe truyền thông, và họ đúng khi nói rằng chẳng có gì sai về tính toán cả.

Không có gì sai về tính toán, nhưng có vấn đề về thống kê. Cách nói cứ mỗi 3.4 phút có 1 ca gãy xương hàm ý giả định rằng số ca gãy xương xảy ra một cách đồng đều -- uniform, nhưng giả định đó sai. Sai là vì trong quần thể số ca gãy xương tuân theo luật phân bố Poisson, chứ không phải uniform. Do đó, cách nói đó tuy nghe qua có vẻ ấn tượng, nhưng thật ra là một ngụy biện. Nguỵ biện cấp thấp.

Cách nói 3.4 phút có 1 ca gãy xương còn là một kiểu nói cảm tính. Cảm tính là vì người nói muốn gây ấn tượng mạnh. Nói theo tiếng Anh, đó là kiểu nói manipulative framing of the number hay hiểu nôm na là vặn vẹo con số. Tức là người nói dùng nó để cảm tính hoá vấn đề. Cảm tính hoá dĩ nhiên là điều không nên trong khoa học. Đó chính là lí do tại sao phe khoa học cảm thấy "sai", nhưng họ không nghĩ ra sai chỗ nào!

Nói tóm lại, đối với người làm khoa học, cần nên tránh cách nói theo kiểu "3.4 phút có 1 ca gãy xương" (hay tương tự), vì nó vừa cảm tính hoá vấn đề, mà lại vừa sai về mặt thống kê. Người không am hiểu thống kê nói thế thì có thể bỏ qua (vì họ ignorant) nhưng người biết chút ít về thống kê hay chút đỉnh về khoa học thì không nên nói như thế.



4 comments:

Anonymous said...

Cảm ơn Bác đã mở lại blog.

Truong Nguyen said...

GS cho hỏi vậy kiểu nói vẫn rất phổ biến là cứ XXX lại có 1 người qua đời vì tai nạn giao thông/ung thư... thì có rơi vào trường hợp này ko ạ cám ơn GS

Tuan Nguyen said...

Tôi nghĩ đó cũng là cách nói cảm tính.

Son Nghiem said...

Cách nói này đơn giản hóa để cho đại chúng dễ hiểu chứ không phải cảm tính (nói không có căn cứ, chỉ dựa theo cảm nhận). Có thể chấp nhận được khi đăng trên thông tin đại chúng. Nếu bắt bẻ thì bản thân cái câu "A bone is broken every 3.4" minutes còn tối nghĩa khi có thể được hiểu máy móc là "một cái xương cứ 3.4 phút lại gãy một lần". Chẳng có cái xương nào rủi ro như vậy ở trên đời cả. Nếu cẩn thận hơn người ta có thể đưa câu "Average" (Trung bình) lên trước. Tiêu đề, vì vậy có thể là "Trung bình, cứ 3,4 phút lại có một ca gãy xương ở Úc"