Thursday, December 21, 2017

Giới thiệu sách mới: "Phân tích dữ liệu: hỏi và đáp"

Tôi rất hân hạnh giới thiệu đến các bạn một cuốn sách mới do tôi biên soạn nằm trong chủ đề phương pháp nghiên cứu khoa học. Cuốn sách có tựa đề là "Phân tích dữ liệu: hỏi và đáp" mới được phát hành ngày hôm nay (22/12/2017). Cuốn sách này phát hành đúng lúc để dùng trong chương trình workshop về phương pháp nghiên cứu khoa học từ 25/12/2017 đến 7/1/2018. 




Cuốn sách này có một lịch sử khá lâu, từ hơn 10 năm trước. Dạo đó, tôi thường hay giúp đồng nghiệp qua trả lời những câu hỏi liên quan đến phương pháp nghiên cứu, thường là về phân tích dữ liệu (data analysis) trên ykhoa.net. Trong vòng 2 năm mà tôi đã giải thích gần 50 câu hỏi, nhưng chỉ có khoảng phân nửa là công bố trên trang web của Bs Phan Xuân Trung. Cách giải thích không phải chỉ 1-2 câu ngắn, mà thường là một ... bài giảng. Mấy năm gần đây tôi có cơ duyên giảng trong nhiều workshop về thiết kế nghiên cứu, phương pháp nghiên cứu, cách viết bài báo khoa học, y học thực chứng cho rất nhiều bệnh viện và đại học y từ Bắc chí Nam. Đã có hàng ngàn học viên theo học các workshop này, và ở mức độ khiêm tốn cũng tạo ra được một 'cộng đồng' khoa học nho nhỏ.

Qua những lớp này tôi cũng học được nhiều điều từ các bạn học viên, học qua những câu hỏi rất thực tế. Nhiều bác sĩ nói rất đúng là họ bận với công việc lâm sàng, không thể học chi tiết và chuyên sâu về phân tích dữ liệu, nên họ rất muốn học từ vấn đề (problem based learning hay PBL). Chẳng hạn như họ mới xong một thí nghiệm, một nghiên cứu, và có dữ liệu với mục đích cụ thể, họ muốn biết dùng phương pháp gì để đáp ứng mục đích đó. Tôi đã có ý định soạn một cuốn sách nhằm đáp ứng yêu cầu đó, nhưng đây là "công việc tay trái" nên không thể dành nhiều thì giờ được. Sau hơn 2 năm soạn thảo thì nay sách đã được xuất bản.

Như tựa đề cuốn sách đã nói, đây là loại sách "vấn đáp" (Q&A). Tôi chưa thấy một sách về phân tích dữ liệu ở nước ngoài được soạn theo hình thức này; do đó có thể xem đây là sách loại Q&A đầu tiên. Mỗi câu hỏi là theo sau bằng câu trả lời, chứ bạn đọc không phải chờ đợi lâu (vì ít thì giờ). Câu trả lời thường được khởi đầu bằng vài dòng ý tưởng hay lí thuyết, tiếp đến là áp dụng ý tưởng vào vấn đề thực tế, và sau cùng là mã R để giải quyết vấn đề. Chẳng hạn như nhà nghiên cứu thu thập dữ liệu Na+ của hai nhóm bệnh nhân cao huyết áp và bình thường, nhưng vấn đề là phân bố Na+ không tuân theo luật phân bố chuẩn, vậy nhà nghiên cứu phải làm gì để so sánh. Phần trả lời sẽ giới thiệu phương pháp bootstrap để giải quyết vấn đề và kèm theo mã R, cùng kết quả và quan trọng nhất là cách diễn giải kết quả. Học phân tích dữ liệu là quan trọng, nhưng tôi quan niệm rằng hiểu ý nghĩa của dữ liệu và đặt nó vào bối cảnh còn quan trọng hơn. Do đó, mỗi câu hỏi đều kèm theo một câu trả lời và diễn giải ý nghĩa của kết quả phân tích. Tôi nghĩ rằng các bạn sẽ thích hình thức này.

Sách bao gồm 17 chương chính và 2 chương bổ sung. Các chương sách bao gồm từ phân tích mô tả, phân tích so sánh hai nhóm, phân tích tương quan, mô hình hồi qui tuyến tính, mô hình hồi qui logistic, phân tích sống còn (survival analysis), phân tích đa biến, phân tích tổng hợp (meta-analysis), ước tính cỡ mẫu, và các phương pháp phân tích dịch tễ học. Nội dung sách chủ yếu là các phương pháp cơ bản, nhưng cũng có một số phương pháp chưa được đề cập đến trong sách giáo khoa ở nước ngoài, như relative importance regression, Bayesian Model Averaging. Các phân tích biểu đồ được chú ý đặc biệt để giúp các đồng nghiệp có những biểu đồ khoa học phẩm chất cao cho công bố trên các tập san khoa học quốc tế.  Ngoài ra, tôi còn bổ sung hai chương để giải thích các thuật ngữ thông dụng và những sai sót hay thiếu sót trong phân tích dữ liệu khoa học.

Nhân dịp này tôi chân thành cám ơn những người đã đóng góp vào sự ra đời của cuốn sách. Tôi cảm ơn hai bạn Bs Hà Tấn Đức (Cần Thơ) và Ts Trần Sơn Thạch (Garvan), và trước đó là Ts Nguyễn Đình Nguyên, những người đã rong rủi với tôi mấy năm qua từ Nam chí Bắc để giảng trong các workshop. Ts Trần Sơn Thạch đã đọc toàn bộ bản thảo và cho những góp ý rất thực tế. Tôi chân thành cám ơn các biên tập viên Nguyễn Thị Liên, Phạm Thị Hải Âu và Uyên Nguyễn của Nhà xuất bản Tổng Hợp đã đọc, kiểm tra tính chính xác, và biên tập bản thảo. Lúc viết lời giới thiệu tôi không có dịp viết lời cảm ơn các biên tập viên vì lúc đó đâu biết ai phụ trách bản thảo.

Dĩ nhiên, không có cuốn sách nào hoàn hảo cho dù đã được kiểm tra kĩ. Tôi nghĩ cuốn sách này cũng không phải là ngoại lệ, chắc chắn có những sai sót, thiếu sót trong đó. Nhưng như các lần trước, khi các bạn nhận ra những sai sót, các bạn báo cho tôi biết để tôi chỉnh sửa trong lần tái bản tới (hi vọng là có tái bản). Bây giờ, tôi hân hạnh giới thiệu sách "Phân tích dữ liệu: hỏi và đáp" đến các bạn và mong rằng các bạn sẽ dành cho sự ủng hộ như các bạn đã dành cho tôi trong các cuốn trước. Xin chân thành cám ơn các bạn.

===

Sách do Nhà xuất bản Tổng Hợp xuất bản, tháng 12/2017.
Số trang: 404, kích thước 18 x 25 cm.
Bìa: Nguyễn Uyên
Biên tập: Nguyễn Thị Liên, Phạm Thị Hải Âu

Có thể mua sách tại:
·       Nhà sách Tổng Hợp I, 62 Nguyễn Thị Minh Khai, Q1, ĐT: 028-3825-6804.
·       Nhà sách Tổng Hợp II, 86-88 Nguyễn Tất Thành, Q4, ĐT: 028-3943-3868.
·       Gian hàng M01, Đường Sách, TPHCM, Đường Nguyễn Văn Bình, Q1.
·       Nhà sách Minh Khai, 249 Nguyễn Thị Minh Khai, Q1, ĐT: 028-3925-0590

Danh sách chương sách:
1  Lời giới thiệu
2  Giới thiệu ngôn ngữ R
3  Giới thiệu dữ liệu
4  Hai trường phái phân tích thống kê
5  Tính toán xác suất
6  Phân tích mô tả bằng biểu đồ
7  Phân tích mô tả biến liên tục
8  Phân tích mô tả biến phân loại
9  So sánh hai nhóm: biến liên tục
10  Phân tích so sánh hai tỉ lệ
11  Phân tích phương sai
12  Mô hình hồi qui tuyến tính
13  Mô hình hồi qui logistic
14  Phân tích sống còn
15  Phân tích đa biến và "machine learning"
16  Phân tích tổng hợp (meta-analysis)
17  Một số phương pháp phân tích dịch tễ học
18  Ước tính cỡ mẫu cho nghiên cứu khoa học
19  Những sai sót và thiếu sót phổ biến trong phân tích dữ liệu

1 comment:

Anonymous said...

“Khoa học thống kê là một phương tiện khám phá: khám phá từ sự khác biệt, khám phá những nhóm có đặc điểm giống nhau, khám phá những mối tương quan, khám phá xu hướng. Tất cả những khám phá đó được định hình từ sự phân biệt giữa những cái mà chúng ta gọi là tín hiệu và những dữ liệu có thể xem là ngẫu nhiên. Đó là một khoa học rất hào hứng (vì khó có gì hào hứng hơn là khám phá cái mới).. “ (Trích từ: Phân tích dữ liệu với R Hỏi và đáp – Nguyễn Văn Tuấn) – Một kết luận trong lời giới thiệu cuốn sách QUÁ ĐẸP.