Saturday, October 4, 2014

Bài giảng phân tích dữ liệu #35: Ảnh hưởng tương tác


Hôm nay là ngày thứ Bảy, và theo chương trình, tôi lại tiếp tục upload một bài giảng mới về phương pháp phân tích dữ liệu. Bài này bàn về một chủ đề quan trọng nhưng thường bị bỏ qua: ảnh hưởng tương tác (interaction effects). Đây là bài thứ 3 trong loạt bài về mô hình hồi qui tuyến tính, và bài thứ 35 trong loạt bài giảng về phân tích dữ liệu. Địa chỉ bài giảng là:



Ảnh hưởng tương tác là một hiện tượng chúng ta thường bỏ qua khi nghiên cứu về một vấn đề. Nhưng trong thực tế, ảnh hưởng tương tác hiện diện trong hầu hết lĩnh vực nghiên cứu. Trong y khoa có những loại thuốc có tác động đến người da đen, nhưng chẳng có ảnh hưởng gì đến người da trắng. Một gen có thể có liên quan đến bệnh ở người Phi châu nhưng chẳng có dính dáng gì đến bệnh ở người Á châu. Nhạc sĩ Phạm Duy từng nói cam Bố Hạ mà trồng ở Mĩ thì nước không ngọt (ý ông nói theo tôi hiểu là khi người nghệ sĩ bỏ quê thì rất khó có sáng tác đậm tình quê hương). Tất cả các hiện tượng đó thống kê gọi ảnh hưởng tương tác hay interaction effects, hơi khác với khái niệm interaction effects trong dược học.

Các mô hình thống kê rất có ích để chúng ta điều tra và khám phá ảnh hưởng tương tác. Hi vọng sau bài này các bạn sẽ hiểu thêm về cái đẹp của mô hình hồi qui tuyến tính. 

====
Ngoài ra, tôi mới upload lên youtube.com một bài giảng mới về cách vẽ biểu đồ khoa học với R. Trong bài này tôi sẽ hướng dẫn các bạn cách dùng các hàm căn bản trong R để vẽ các biểu đồ phân bố (histogram), biểu đồ hộp (box plot), biểu đồ thanh, và biểu đồ tương quan (scatter plot). Địa chỉ bài giảng là:

Các dữ liệu tôi dùng trong bài giảng các bạn có thể đọc trực tiếp từ mạng qua trang statistics.vn. Chẳng hạn như để đọc dữ liệu "obesity data.csv ", các bạn dùng hàm (ví dụ):
ob = read.csv(http://statistics.vn/data/obesity data.csv, header=T).
hoặc có thể download về máy để thực hành.

Đây là bài thứ nhất trong loạt 7 bài hướng dẫn cách vẽ biểu đồ có chất lượng cao (tức là có thể dùng cho công bố). Sau bài này tôi sẽ bàn về cách dùng package mới có tên là ggplot2 mà tôi nghĩ rất hay và rất tốt cho các biểu đồ khoa học.


No comments: