Sunday, August 28, 2016

Một chút lịch sử Biểu đồ Bland-Altman

Có thể nói rằng trong y học không ai mà không biết đến một phương pháp so sánh hai đo lường có tên là "Bland-Altman plot". Nhưng ít ai biết câu chuyện đằng sau biểu đồ danh tiếng này. Thật ra, nó nên/phải có tên là "Altman-Bland plot" mới đúng. Nhân dịp cuối tuần, xin chia sẻ câu chuyện đằng sau cái biểu đồ nổi tiếng này.



Câu chuyện bắt đầu từ đầu thập niên 1980 khi một số bác sĩ tim mạch nhờ ông Douglas Altman hướng dẫn cách phân tích so sánh hai phương pháp đo lường. Cần nói thêm là trước đây, người ta hay dùng hệ số tương quan Pearson để đánh giá sự tương đồng giữa hai phương pháp đo lường, nhưng hệ số này không phản ảnh đúng ý nghĩa lâm sàng của việc so sánh. Vấn đề không chỉ là tương quan (phản ảnh qua hệ số Pearson), mà còn là mức độ khác biệt giữa hai phương pháp đo lường. Ông Altman bàn với ông Martin Bland về cách giúp các bác sĩ tim mạch, và họ đề nghị một cách phân tích đơn giản:

(a) Bước 1: Ở mỗi bệnh nhân, cộng giá trị phương pháp đo lường A với giá trị phương pháp đo lường B, và chia kết quả cho 2. Tức là tính trung bình giá trị đo lường cho mỗi bệnh nhân, tạm gọi là M;

(b) Bước 2: Ở mỗi bệnh nhân, tính hiệu số giữa A và B, tạm gọi là D;

(c) Bước 3: Vẽ biểu đồ tán xạ với M là trục hoành và D và trục tung.

 
Một ví dụ về biểu đồ Bland-Altman. Hai đường ngang đứt đoạn là khoảng tin cậy 95%

Dĩ nhiên, bề ngoài là rất đơn giản như thế, nhưng lí thuyết thống kê học đằng sau thì khá phức tạp. Năm 1981, ông Altman và Bland trình bày phương pháp này trong một hội nghị khoa học thống kê tại London. Sau đó, họ hoàn thiện bài báo và công bố trên tạp chí The Statistician vào năm 1981 (1). Trong bài báo này, ông Altman là tác giả đầu, còn Bland là tác giả thứ hai.

Chẳng mấy ai quan tâm đến bài báo! Trong khi đó, người ta vẫn tiếp tục dùng sai phương pháp (tức hệ số tương quan). Một số đồng nghiệp y khoa khuyên hai ông Altman và Bland nên viết một bài khác đăng trên một tập san y khoa, do bài báo trên tờ The Statistican hơi khó đọc, vì ngôn ngữ toán khó được giới khoa học lãnh hội. Ông Bland thấy có lí nên nhận nhiệm vụ viết lại bài báo bằng một ngôn ngữ dễ hiểu hơn, kèm theo ví dụ cụ thể, và gửi cho tập san y khoa Lancet để đăng. Ví dụ ông lấy là hai phương pháp đo lường PEFR trên 17 người do chính ông thu thập từ đồng nghiệp và người thân trong gia đình (3). Lancet là một tập san số 1 hay số 2 trên thế giới trong y khoa. Lancet chỉ nhận công bố như là một "Letter" vào năm 1983 (2). Trong bài báo này ông Bland là tác giả đầu và Altman là tác giả thứ hai.

Bài báo trên Lancet rất nhanh chóng trở nên vang dội. Cho đến nay, bài báo trên Lancet đã được trích dẫn hơn 34000 lần, còn bài báo trên The Statistician được trích dẫn 1300 lần. Ngày nay, bài báo trên Lancet trở thành một bài kinh điển (classic), và là một trong những bài báo được trích dẫn nhiều nhất trong lịch sử khoa học. Sự thành công của bài báo còn là bài học cho những ai làm khoa học. Có 3 bài học:

Thứ nhất là bài báo hay công trình nghiên cứu phải giải đáp một câu hỏi quan trọng trong chuyên ngành. Phần nhiều (có thể lên đến 99%) bài báo khoa học hiện nay chẳng giải quyết vấn đề gì quan trọng, có hay không có họ cũng chẳng gây ảnh hưởng gì. Bài báo của Bland và Altman giải quyết một vấn đề rất quan trọng trong đo lường, nên nó nhận được sự quan tâm của nhiều người trong chuyên ngành, không chỉ y khoa, mà còn ngoài y khoa.

Thứ hai là nội dung phải dễ hiểu. Đây là vấn đề khó, vì nhiều chủ đề trong khoa học về bản chất là khó hiểu. Nhưng vẫn có cách làm cho nội dung và ngôn ngữ dễ hiểu. Nhiều công thức chỉ nói lên những ý tưởng đơn giản, và những ý tưởng này có khi không cần đến công thức. Nhiều bài báo tác giả dùng cách viết rất khó hiểu, không phải vì nội dung phức tạp, mà vì chính tác giả không hiểu họ viết gì! Do đó, biến một bài báo dễ hiểu là một minh chứng cho thấy tác giả là người hiểu chuyện và đứng trên vấn đề. Đọc lại bài báo trên tờ Lancet của ông Bland thì quả thật là đơn giản hơn nhiều so với bài trên The Statistician, vì ông còn cho ví dụ cụ thể để người đọc có thể áp dụng ngay. Điều này có ý nghĩa quan trọng, vì ngày nay nhiều phương pháp được đề xướng mà không kèm theo ví dụ hay codes để kiểm tra thì sẽ chẳng có ai quan tâm.

Thứ ba là nơi công bố. Hiện nay, trên thế giới có khoảng 15000 tập san khoa học (không tính hơn 20000 tập san dỏm), nhưng không phải tập san nào cũng có giá trị như nhau. Cái chỉ số nhanh nhất và đơn giản nhất để phân biệt đẳng cấp của tập san là Impact Factor (IF). Đây là một chỉ số flawed (sai lầm), nhưng trong thực tế nó lại ... có hiệu quả. Trong bất cứ ngành nào, tập san có IF cao là tập san có uy tín cao. Bài báo có nội dung tốt không ai lại gửi cho tập san có IF thấp; họ tìm cách gửi cho tập san có uy tín nhất trong chuyên ngành. Lancet là tập san số 2 trong y khoa (có lẽ chỉ sau New England Journal of Medicine), nên công bố trên Lancet có sự tác động rất tốt không chỉ đến cộng đồng y khoa mà còn cả ngoài y khoa.

Nên nhớ rằng 2 bài báo có cùng nội dung và cùng tác giả, cái khác biệt ở đây là nơi công bố. Tóm lại, bài học là nếu muốn bài báo trở nên nổi tiếng thì nên: (a) viết sao cho nhiều người hiểu; (b) phải có một tính ứng dụng cho dù bản chất là lí thuyết cơ bản; và (c) chọn tập san danh tiếng để công bố.

Có một câu nói của Francis Darwin (con trai của Charles Darwin) mà tôi hay trích dẫn trong các lớp học về cách viết bài báo khoa học: "In science, the credit goes to the man who convinces the world, not to whom the idea first occurs." Câu đó nên hiểu là trong khoa học, công trạng thuộc về người thuyết phục thế giới, chứ không thuộc về người đầu tiên đề ra ý tưởng. Cái ý tưởng trong bài báo của Bland và Altman không mới; người ta đã đề cập đến nó từ thế kỉ 19 và ngay cả trong phương pháp Deming vào thập niên 1960, nhưng người thuyết phục thế giới lại là hai ông Altman và Bland và thế là thế giới chỉ biết đến hai ông ấy.

===

(1) Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The Statistician 1983;32: 307–317.

(2) Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet 1986;327: 307–10.

(3) Số liệu lưu lượng đỉnh, PEFR (l/min), trong bài báo gốc trên tờ Lancet do Martin Bland thu thập:

Phương pháp Wright: 494, 395, 516, 434, 476, 557, 413, 442, 650, 433, 417, 656, 267, 478, 178, 423, 427.

Phương pháp Mini: 512, 430, 520, 428, 500, 600, 364, 380, 658, 445, 432, 626, 260, 477, 259, 350, 451.

Trong R có package ggExtra và BlandAltmanLeh rất có ích để vẽ biểu đồ BA. Với số liệu trên, các bạn có thể vẽ biểu đồ Bland-Altman (hay Altman-Bland) một cách dễ dàng:

Wright = c(494, 395, 516, 434, 476, 557, 413, 442, 650, 433, 417, 656, 267, 478, 178, 423, 427);
Mini = c(512, 430, 520, 428, 500, 600, 364, 380, 658, 445, 432, 626, 260, 477, 259, 350, 451);
library(ggExtra); library(BlandAltmanLeh)
ggMarginal(bland.altman.plot(Wright, Mini, graph.sys = "ggplot2", geom_count = TRUE), type="histogram", size=5)

1 comment:

tien tai Dinh said...

Cháu cảm ơn Gs, bài viết rất thú vị ạ.