Monday, June 8, 2015

Khi niềm tin vào khoa học bị sứt mẻ

Những câu chuyện về gian dối trong khoa học càng ngày càng nhiều trên báo chí đại chúng. Xì căng đan mới nhất trong lĩnh vực khoa học xã hội, mà "diễn viên" là Michael LaCour, nghiên cứu sinh tiến sĩ chính trị học thuộc đại học UCLA, và Donald Green, giáo sư chính trị học thuộc Đại học Columbia. Cả hai đại học đều thuộc đẳng cấp elite trên thế giới. Kịch bản trong xì căng đan này khá là kinh điển: Giả tạo dữ liệu. Nhưng ở đây, sự việc thu hút công chúng vì bài báo đăng trên tập san lừng danh Science.


Trong một bài báo có tựa đề "When contact changes minds: An experiment on transmission of support for gay equality" được công bố trên Science ngày 12/12/2014 (nhưng nay đã rút xuống), tác giả báo cáo rằng họ làm một survey và một nghiên cứu RCT (randomized controlled trial), tức là một dạng nghiên cứu rất khó thực hiện. Kết quả cho thấy chỉ cần tiêu ra khoảng 20 phút đàm đạo với một người đồng tính luyến ái sẽ làm cho những người phản đối hôn nhân đồng tính thay đổi ý kiến và có cảm tình với hôn nhân đồng tính hơn (1).

Ý nghĩa của nghiên cứu này rất lớn, vì nó ám chỉ rằng chỉ cần trực tiếp đối thoại thì những khác biệt về ý thức hệ hay thù hận có thể hoá giải. Nghiên cứu trở thành một "top hit" trong giới khoa học xã hội.

Thế nhưng sau khi bài báo được công bố, nhiều nhà nghiên cứu cố gắng lặp lại nghiên cứu của LaCour và Green, nhưng tất cả đều thất bại. Trong khoa học, một khi kết quả nghiên cứu không được tái thiết lập, thì đó chính là một tín hiệu xấu đã xảy ra. Thật ra là họ đã hoài công, vì LaCour có nghiên cứu gì đâu; anh ta phịa toàn bộ dữ liệu!

Sau khi bài báo công bố khoảng 5 tháng, các tác giả David Broockman, Joshua Kalla, và Peter Aronow dùng các phương pháp thống kê hết sức đơn giản chứng minh rằng dữ liệu của LaCour và Green là "bất bình thường" (2). Các bạn có thể đọc bài phân tích này, và có thể thử ngay vì tác giả cung cấp toàn bộ mã R để lặp lại phân tích của tác giả.

Khi nhóm tác giả Broockman, Kalla, và Aronow trình bày kết quả phân tích cho Gs Donald Green (đồng tác giả bài báo), Green sốc. Lập tức, Gs Green viết thư cho Science đề nghị rút lại bài báo. Trả lời báo chí, Green biện minh rằng ông ta chỉ đóng góp viết bài báo khoa học chứ không có dính dáng vào công trình nghiên cứu! Green còn nói ông thoạt đầu cũng nghi ngờ kết quả vì thấy nó quá tốt, nhưng sau khi LaCour lặp lại kết quả qua một nghiên cứu khác thì ông yên tâm. Nhưng Green không biết rằng cái nghiên cứu thứ 2 mà LaCour lặp lại cũng là phịa, như nhóm giả Broockman, Kalla, và Aronow chứng minh một cách thuyết phục.

Vai trò của Gs Donald Green rất quan trọng. Dù ông không có tham gia vào công trình của LaCour, nhưng vì ông có uy danh rất lớn, nên LaCour có cơ hội xuất hiện trên Science. Thật vậy, ban biên tập Science cho rằng nếu bài báo chỉ có LaCour (vốn là "vô danh") thì bài báo đã bị từ chối ngay từ đầu. Nhưng vì có tên của Green nên bài báo đột nhiên tăng trọng lượng, và xuất hiện trên Science. Thú nhận của Science càng làm cho giới khoa học nghi ngờ tính công minh trong khoa học. Hoá ra, "thương hiệu" cũng đóng vai trò quan trọng trong việc tăng khả năng bài báo được chấp nhận.

Phải công nhận là LaCour thông minh. LaCour có thể giả tạo dữ liệu và qua mặt những chuyên gia bình duyệt. Khi Gs Green gọi điện cho giáo sư hướng dẫn luận án của LaCour ở UCLA để yêu câu LaCour trình bày dữ liệu gốc, nhưng LaCour không chịu tiết lộ dữ liệu. Cho đến nay, chưa ai biết LaCour giả tạo như thế nào, vì anh ta chưa tiết lộ. LaCour hứa là sẽ trả lời những cáo buộc chống anh ta và sẽ minh bạch tất cả.

Chẳng những giả tạo dữ liệu, LaCour còn phịa luôn những thông tin "bên lề" trong bài báo. Chẳng hạn như bài báo viết rằng các tác giả trả tiền mặt để khuyến khích đối tượng tham gia vào công trình nghiên cứu, nhưng trong thực tế luật sư của LaCour cho biết chẳng có trả tiền nào cả! Thêm nữa, bài báo cảm tạ một số nhà tài trợ, nhưng theo luật sư của LaCour thì phát biểu đó cũng không đúng, chẳng có ai tài trợ cả (vì có nghiên cứu đâu mà tài trợ!) LaCour đưa những tên cơ quan tài trợ như là một cách nâng cao tính hợp lí của bài báo.

Trước LaCour đã có rất nhiều trường hợp tai tiếng trên thế giới. Có lẽ tai tiếng trong giới khoa học xã hội nhất là một giáo sư Diederik Alexander Stapel, từng là một ngôi sao đang lên trong lĩnh vực tâm lí xã hội học ở Hà Lan. Stapel công bố một bài báo cũng trên tập san Science, mà trong đó ông báo cáo rằng sự kì thị chủng tộc hay xảy ra trong môi trường "slum". Nhưng không lâu sau đó, người ta phát hiện tất cả dữ liệu trong bài báo chỉ là giả tạo, chứ Stapel chẳng có nghiên cứu gì cả (3). Thật ra, người ta còn nghi ngờ hàng chục công trình khác, hay cả luận án tiến sĩ, của ông cũng là giả tạo. Có thể nói rằng Stapel đã xây dựng sự nghiệp từ giả tạo. Điều đáng chú ý là khi báo chí hỏi tại sao ông gian dối thì ông tỏ ra thành khẩn và nói rằng vì ông muốn thế giới dễ thương hơn, thân thiện hơn, ít kì thị hơn nên ông ... giả tạo nghiên cứu!

Khoa học dựa vào sự tin tưởng. Chuyên gia bình duyệt tin tưởng tác giả. Ban biên tập tin tưởng vào các chuyên gia bình duyệt. Công chúng đặt niềm tin vào nhà khoa học. Một khi sự tin tưởng bị sứt mẻ, thì nền tảng của khoa học cũng lung lay. Cái tội hiển nhiên của LaCour dĩ nhiên là giả tạo dữ liệu, nhưng hành động đó còn làm phí công và tiền bạc của nhiều nhóm khác trên thế giới cố gắng lặp lại nghiên cứu của anh ta. Hành động của anh ta làm cho niềm tin vào khoa học của công chúng bị suy giảm, và đó mới là trọng tội.

Nhưng nhìn người lại ngẫm đến ta. Ở nước ta chắc chắn cũng có tình trạng nguỵ tạo dữ liệu, dù chưa xuất hiện trên báo chí như ở Mĩ, vì chủ yếu là đăng trên các tập san trong nước với rất ít độc giả. Những câu chuyện do nghiên cứu sinh kể lại thì rất nhiều, từ giả tạo dữ liệu, chỉnh sửa dữ liệu theo ý của thầy cô, chỉnh sửa kết quả phân tích (vì họ biết rằng chẳng ai kiểm tra mã nguồn phân tích), v.v. tất cả đều có. Vì các đại học VN không có cơ chế để kiểm tra nghiên cứu, nên những gian dối được che khuất và chẳng ai quan tâm. Có trường hợp làm tôi sốc khi tôi hỏi dữ liệu gốc đâu (như scan gốc của bệnh nhân) thì người ta thản nhiên nói huỷ bỏ hết rồi! Người nói câu đó không hề hối tiếc, giống như một kẻ tội phạm không hề biết mình phạm tội. Tôi bị sốc, nhưng nghĩ lại thì do cái văn hoá khoa học chưa được chỉnh chu nên mới như thế. Ở VN cũng có nhiều LaCour, nhưng họ chưa được phát hiện mà thôi.

Kì rồi, trong cái workshop về phương pháp nghiên cứu khoa học xã hội, một vài em nghiên cứu cho biết nghiên cứu về kinh tế họ thường dựa vào dữ liệu của Nhà nước, nhưng ngay cả những người làm nghiên cứu không tin vào dữ liệu đó (do tình trạng "báo cáo láo" và bệnh thành tích). Thật ra, ngay cả ngài thủ tướng còn tỏ ra nghi ngờ dữ liệu của Nhà nước, thì nói gì đến nhà khoa học!

====



(4) Tin mi nht LaCour đã có bài tr li, nhưng anh ta vn không tr li ti sao ngu to d liu:

2 comments:

Nông dân miền Tây said...

Nghiên cứu RCT (randomized controlled trial) khó là điều tất nhiên từ thiết kế mẫu, lấy mẫu, hiểu bản chất dữ liệu đến mô hình, phương pháp ước lượng, tôi đồng cảm với suy nghĩ của GS.NguyenVanTuan. "Công chúng đặt niềm tin vào nhà khoa học. Một khi sự tin tưởng bị sứt mẻ, thì nền tảng của khoa học cũng lung lay", tôi tự hỏi rằng ở đất nước này còn mấy ai còn giữ được niềm tin vào khoa học nhỉ??

Trường Lâm said...

Tuy vậy, qua sự việc đã xảy ra ở đây (và nhiều trường hợp tương tự), phải công nhận là chỉ có khoa học mới thú nhận những sai lầm và gian dối (một khi bị phát hiện) để tự sửa chữa, cải thiện, còn các lĩnh vực khác như chính trị, triết học vv thì lập lờ, tìm cách biện minh, diễn giải vòng vo. Vẫn còn hy vọng.