Friday, November 6, 2015

Thông báo số 2 về khoá học "Phân tích dữ liệu với R"

Tôi rất hân hạnh thông báo cùng các bạn xa gần là khoá học 12 ngày về phân tích dữ liệu khoa học sẽ được tiến hành tại Đại học Tôn Đức Thắng, bắt đầu từ ngày 20/12/2015 đến 31/12/2015. Nếu các bạn có nhu cầu theo học, các bạn nên đăng kí ngay từ bây giờ, vì ngày hết hạn đăng kí là 1/12/2015. Cũng như năm ngoái, Trường sẽ không nhận thêm đăng kí sau ngày đó.


Lớp học này được thiết kế cho các bạn đang hay sắp làm nghiên cứu khoa học, các giảng viên có nhu cầu hiểu về các phương pháp phân tích hiện đại mà ít được mô tả trong những sách giáo khoa. Tôi cố gắng bám sát vào nhu cầu nghiên cứu như cách tính cỡ mẫu, soạn biểu đồ, và bảng số liệu phù hợp với qui định của tập san khoa học.

Do đó, nội dung khóa học lần này khá bao quát, từ các phương pháp cơ bản đến phương pháp "advanced". Chúng tôi sẽ dành 1 ngày để ôn lại những thao tác R, sau đó là các bài về phân tích bằng biểu đồ (các loại biểu đồ phẩm chất cao thích hợp cho xuất bản), phân tích mô tả, và các phương pháp suy luận cũng như kiểm định giả thuyết (như Ki bình phương, t-test, ANOVA). Sau phần I, lớp học sẽ tiếp tục với các phương pháp phân tích tương quan, hồi qui tuyến tính đơn biến và đa biến, mô hình hồi qui logistic, và các mô hình đa biến (như PCA, Factor Analysis và Cluster Analysis). Chúng tôi sẽ dành một số bài giảng để bàn về chiến lược xây dựng mô hình tiên lượng (prognostic models), và vài phương pháp hiện đại trong xử lí "missing values".

Nếu có thì giờ (không dám kì vọng), tôi sẽ nói qua một số phương pháp phân tích các Dữ liệu Lớn (còn gọi là Big Data), hiện nay khá "nóng" trong thế giới khoa học. Tôi sẽ sử dụng các nghiên cứu genomics của tôi làm ví dụ để các bạn thấy thế nào là "lớn", và những vấn đề nan giải đặt ra cho thống kê học khi đương đầu với những nghiên cứu dạng này.

Mỗi ngày  sẽ có 2 phần: buổi sáng là giảng lí thuyết, và buổi chiều là thực hành. Tôi nghĩ những bài giảng tuy mang tiếng là "lí thuyết" nhưng các bạn không nên ngại, vì tôi có cách giải thích dễ hiểu, chứ không có gì quá phức tạp đâu. (Đó là những gì các bạn học trước đây phản ảnh, chứ tôi không dám tự mình khen!) Về phần thực tập thì năm nay ngoài các dataset mà các bạn có thể thực hành, chúng tôi còn có hẳn một tập tài liệu khoảng 50 trang (như một cuốn sách nhỏ) để các bạn tự thực hành trên máy tính trong những lúc rảnh rổi. Tôi rất tâm đắc với tập tài liệu này, vì tôi đã thăm dò ý kiến của nhiều bạn trước đây, và do đó đã soạn ra nó để "gãi đúng chỗ ngứa" của các bạn.  Tôi tự tin rằng các bạn sẽ thích thú với tập tài liệu này, vì nó sẽ giúp các bạn giải trí sau giờ học :-).

Năm nay, chúng tôi sẽ tập trung ít nhất là 4 người tham gia giảng và giúp các bạn. Ngoài tôi ra, còn có Bs Trần Sơn Thạch, Bs Hà Tấn Đức, và một vài giảng viên của Đại học Tôn Đức Thắng tham gia cùng chúng ta.

Như nói trên, để tiện việc sắp xếp lớp học và tổ chức, các bạn muốn tham gia lớp học nên đăng kí ngay từ bây giờ. Ban tổ chức rất sợ khi có đăng kí trễ vì sẽ lúng túng trong việc sắp xếp. Cũng như lần trước, ban tổ chức không nhận thêm học viên sau ngày 1/12/2015. Để đảm bảo thực hành tốt, lớp học này chỉ nhận khoảng 100 học viên, chứ không hơn nữa. Chúng tôi phải báo trước như thế để "mếch lòng trước, đặng lòng sau". Đối với các học viên ở xa, tuỳ theo trường hợp, nhà trường có thể sắp xếp nhà ở (nhưng các bạn phải kiểm tra với ban tổ chức dưới đây).

Mọi thông tin vui lòng liên hệ: ThS. Nguyễn Thị Mai Hương, Phòng A303, số 19 Đường Nguyễn Hữu Thọ, P. Tân Phong, Q.7, TP. HCM. Điện thoại: 0936-999-574. Email: nguyenthimaihuong1@tdt.edu.vn.

Nếu các bạn cần thông cáo chính thức và những chi tiết hành chính và "hậu cần" thì có thể download thông báo sau đây:



1 comment:

Unknown said...

Thầy cho em hỏi là bao giờ lại có lại khóa học này ạ?