Friday, September 11, 2015

Thông báo workshop về phân tích dữ liệu

Tôi rất hân hạnh thông báo cùng các bạn xa gần là vào cuối tháng 12 này chúng tôi sẽ tổ chức một khoá học 2 tuần về phân tích dữ liệu dùng ngôn ngữ R tại Trường ĐH Tôn Đức Thắng. TS Trần Sơn Thạch, tôi, và vài giảng viên khác sẽ phụ trách hướng dẫn các học viên. Đây là một workshop khá dài ngày, nên chúng tôi chỉ tổ chức 1-2 lần mỗi năm.


Trong lớp học "Phương pháp nghiên cứu khoa học" dành cho khối khoa học xã hội vào dịp đầu năm, chúng tôi có một cuộc thăm dò ý kiến, mà kết quả là đại đa số học viên muốn học thêm về phương pháp phân tích dữ liệu. Ngoài ra, chúng tôi cũng đã có những thăm dò khác trong giới khoa học, và kết quả cũng cho thấy phân tích dữ liệu là một nhu cầu cấp thiết. Để đáp ứng nhu cầu đó, Trường đại học Tôn Đức Thắng hân hạnh tổ chức một khóa học ngắn hạn về phương pháp phân tích dữ liệu nghiên cứu khoa học.

Dự kiến khóa học sẽ kéo dài 12 ngày, từ 20/12/2015 đến 31/12/2015. Chương trình chia làm 2 phần: basic và advanced như sau: 

• Chương trình cơ bản từ ngày 20/12/2015 đến 25/12/2015.
• Chương trình nâng cao từ ngày 26/12/2015 đến 31/12/2015.

Mục tiêu chính của khóa học là trang bị cho các học viên những kiến thức cơ bản về các mô hình phổ biến trong phân tích dữ liệu, và kĩ năng ngôn ngữ R để thực hiện những mô hình phân tích. Khóa học sẽ tập trung vào cách lên kế hoạch phân tích, cách đặt câu hỏi nghiên cứu và suy nghĩ phân tích, cách thực hiện phân tích bằng R, và quan trọng hơn hết là diễn giải kết quả phân tích. Sau khi hoàn thành khóa học, chúng tôi kì vọng học viên sẽ có khả năng:

• Học cách tạo dữ liệu, biên tập dữ liệu dùng phần mềm R;
• Dùng các hàm R để thực hiện những phân tích mô tả bằng biểu đồ chất lượng cao;
• Hiểu về ý nghĩa của giả thuyết khoa học, kiểm định thống kê (test of significance), và diễn giải trị số P;
• Hiểu lí thuyết đằng sau so sánh giữa hai nhóm và nhiều hơn 2 nhóm (như t-test, chi-squared test, binomial test) và dùng R để thực hiện kiểm định;
• Hiểu lí thuyết tương quan, và các mô hình phân tích tương quan, hồi qui tuyến tính; dùng R ước tính tham số của mô hình; và diễn giải ý nghĩa của các tham số;
• Hiểu lí thuyết phân tích đa biến (multivariate analysis, như principal component analysis, cluster analysis) và dùng R để thực hiện phân tích đa biến.
• Hiểu những lí thuyết cơ bản đằng sau thí nghiệm, và dùng hàm R để ước tính cỡ mẫu.

Khóa học được thiết kế cho các nghiên cứu sinh và các nhà nghiên cứu có nhu cầu phân tích dữ liệu. Học viên không nhất thiết đã có chuyên môn về R hay thống kê học, nhưng có kiến thức cơ bản về thống kê học là một điểm mạnh. Các giảng viên muốn có kiến thức và kĩ năng về R cho các mô hình phân tích nâng cao cũng có thể tham gia chương trình nâng cao của khóa học.

Chương trình học: Sáng học về lí thuyết, chiều thực hành trên máy tính cá nhân.

20/12/2015. Chủ đề: Ôn bài về R 
• Bài 1: Cú pháp, input và output, môi trường vận hành
• Bài 2: Mã hoá dữ liệu
• Bài 3: Biên tập dữ liệu

21/12/2015. Chủ đề: Lí thuyết kiểm định giả thuyết 
• Bài 4: Kiểm định giả thuyết và trị số P.
• Bài 5: Mục tiêu và qui trình phân tích (Giới thiệu cách viết protocol phân tích)
• Bài 6: Cách tổ chức dữ liệu cho phân tích thống kê.

22/12/2015. Chủ đề: Phân tích mô tả 
• Bài 7: Giới thiệu cách phân tích mô tả bằng biểu đồ cơ bản
• Bài 8: Giới thiệu package tables
• Bài 9: Phân tích tần số

23/12/2015. Chủ đề: Phân tích mô tả các biến liên tục
• Bài 11: Giới thiệu package tables
• Bài 12: Phân tích mean và SD, SE (lí thuyết + thực hành)
• Bài 13: So sánh hai số trung bình: Kiểm định t
24/12/2015. Chủ đề: Phân tích biểu đồ

• Bài 15: Giới thiệu ggplot2
• Bài 16: Biểu đồ phân bố
• Bài 17: Biểu đồ hộp 
• Bài 18: Biểu đồ thanh
• Bài 19: Biểu đồ tương quan

25/12/2015. Chủ đề: Phân tích tương quan
• Bài 20: Phân tích tương quan
• Bài 21: Giới thiệu mô hình hồi qui tuyến tính
• Bài 22: Ước tính tham số và diễn giải

26/12/2015. Chủ đề: Mô hình hồi qui tuyến tính đa biến 
• Bài 24: Giới thiệu mô hình hồi qui tuyến tính đa biến
• Bài 25: Mô hình hồi qui đa biến với biến phân loại

27/12/2015. Chủ đề: Mô hình hồi qui tuyến tính đa biến 
• Bài 27: Ảnh hưởng tương tác trong hồi qui tuyến tính
• Bài 28: Vấn đề đa cộng tuyến trong hồi qui tuyến tính

28/12/2015. Chủ đề: Mô hình hồi qui logistic 
• Bài 30: Odds ratio và relative risk
• Bài 31: Giới thiệu mô hình hồi qui logistic

29/12/2015. Chủ đề: Mô hình hồi qui logistic
• Bài 36: Phương pháp tìm mô hình hồi qui logistic tối ưu
• Bài 37: Chiến lược xây dựng mô hình tiên lượng

30/12/2015 Chủ đề: Mô hình đa biến (multivariate models) 
• Bài 38: Giới thiệu và khái niệm mô hình đa biến
• Bài 39: Mô hình phân tích PCA

31/12/2015. Chủ đề: Mô hình đa biến (multivariate models)• Bài 40: Mô hình phân tích nhân tố (factor analysis)
• Bài 41: Mô hình phân tích cụm (cluster analysis)
• Bài 42: Phương pháp xử lí missing values

Học viên có thể đăng ký từ ngày ra thông báo đến hết ngày 01/12/2015.Lệ phí khóa học: 3 triệu đồng cho khóa học cơ bản, và 3 triệu đồng cho khóa học nâng cao. Nếu tham dự cả hai khóa học, học phí sẽ là 5 triệu đồng.

Mọi thông tin vui lòng liên hệ: Phòng Quản lý phát triển Khoa học và Công nghệ (ThS. Nguyễn Thị Mai Hương), Phòng A303, số 19 Đường Nguyễn Hữu Thọ, P. Tân Phong, Q.7, TP. HCM.

Điện thoại: (08) 37755 037; Email: nguyenthimaihuong1@tdt.edu.vn

Thông báo chính thức có trong đường link dưới đây:

http://www.tdt.edu.vn/images/_news/tintuc/thongbaochung/2015/thongbaokhoahoc.pdf

6 comments:

hai vu said...

Chào GS Tuấn,
Không phải là nghiên cứu sinh hay nhà khoa học, chỉ là một người thích có thêm 1 kỹ năng mới. Vậy tôi có thể/ có khả năng tham gia khoá học này của GS?

Tuan Nguyen said...

Được chứ. Tôi nghĩ đây là những kĩ năng giúp cho mình suy nghĩ định lượng và cụ thể hơn. Tôi xem mấy mô hình này nọ là một cách suy nghĩ (ở VN gọi là "tư duy"). Do đó, anh có thể tham gia để biết nhà khoa học làm gì, và họ suy nghĩ ra sao.

Tuan Bui Van said...

Thầy ơi,

Về phần khóa học, năm 2012, em có tham gia 1 khóa học của thầy và BS. Đức ở ĐH Tôn Đức Thắng. Khi đó, phần kiến thức thầy dạy cao quá nên em không tiếp thu được nhiều. Vậy đợt này, em chỉ nên đăng ký phần cơ bản hay đăng ký học cả 2 phần (cơ bản - nâng cao). Thầy cho em xin lời khuyên. Năm đó, em có mua cuốn sách mới xuất bản của thầy và đọc suốt đêm khi nằm trên xe Buýt từ TP.HCM về lại Đà Nẵng. Một chặng đường đủ xa để em đọc hết cuốn sách của thầy và hiểu thêm nhiều về thầy, cũng như có thêm động lực để em tiếp tục phấn đấu.

Em đang làm công việc liên quan đến nghiên cứu khoa học và bảo tồn các loài thú quý hiếm, nguy cơ tuyệt chủng cao ở Việt Nam. Em cũng xuất thân từ nông thôn và có ý tưởng muốn đi du học từ sau khi rời khỏi vùng quê yêu dấu của mình năm 2005. Ước mơ ấy em vẫn giữ cho đến hôm nay, và kế hoạch của em là sẽ phấn đầu để đi học vào năm 2017, sau khi đã có hơn 5 năm làm việc cộng đồng với các tổ chức NGO ở Việt Nam. Theo em tìm hiểu, việc hiểu về thống kê là 1 công cụ vô cùng quan trọng đối với người làm nghiên cứu khoa học và đặc biệt trong các chương trình giáo dục ở nước ngoài. Do vậy, những khóa học như của Thầy rất là quan trọng và có ý nghĩa.

Em rất thích làm nghiên cứu khoa học, các số liệu nghiên cứu của em chủ yếu về tương quan giữa các tập tính tự nhiên của động vật, sự biến đối của thực vật đối với các yếu tố môi trường và sự tương tác với các nhóm loài khác trong cùng hệ sinh thái. Em chưa được học về thống kê sinh học nên rất yếu về lĩnh vực này, nhưng em lại rất thích làm nghiên cứu khoa học. Do đó, vấn đề em cần giải quyết là học tốt hơn, hiểu nhiều hơn về môn thống kê và ứng dụng của nó trong nghiên cứu sinh thái học.

Em nghĩ, để học tốt hơn môn học này, em cần đọc thêm một vài tài liệu cơ bản có liên quan đến R và các bài giảng của thầy trước khi đi học. Do vậy, nếu thầy có tài liệu nào cơ bản để hiểu về thống kê thầy cho em xin để em tham khảo trước.

Chúc thầy sức khỏe và luôn hạnh phúc ở quê nhà.

Em Bùi Văn Tuấn
Địa chỉ: Huyện Đại Lộc, Quảng Nam
Nơi công tác: Trung tâm bảo tồn đa dạng sinh học Nước Việt Xanh (GREENVIET).

Nguyễn Xuân Trường said...

Thầy có khóa học tương tự ngoài bắc không ạ?

ngoctu said...

Kính chào thầy,
1. Em đã xem một số video của thầy về sử dụng R trong thống kê. Tuy nhiên hiện nay em đang sd chủ yếu là SAS và SPSS. Không biết là thầy có các bài giảng hoặc sách nào về thống kê dùng SAS hoặc SPSS hoặc về lý thuyết thống kê không?
2. Thầy cho em hỏi omnibus test trong thống kê là gì ạ?
Em cảm ơn thầy.

Thanh Nguyen said...

Khi nào bên mình có lớp khai giảng nữa vậy anh?
Có thể gửi thông báo mới nhất về lớp học sắp tới cho mình qua địa chỉ Email thanh.nc22@vnp.edu.vn
Xin chân thành cảm ơn