Monday, December 26, 2016

Thông báo thứ 3 (sau cùng) về lớp học Machine Learning

Chỉ còn 1 tuần nữa là đóng sổ ghi danh workshop Machine Learning ở TDTU. Các bạn nào chưa ghi danh thì nên ghi danh trước ngày 31/12 cho tiện việc in ấn bài giảng (rất nhiều). Sau ngày đó là khoá sổ (1), và cũng như năm ngoái, sẽ không có dzu dzi với ghi danh trễ, không có "tại vì bởi" sau ngày khoá sổ.


Hiện nay thì workshop đã đạt được con số lí tưởng (để chia nhóm thực hành), chưa kể học viên "nội bộ". Điều thú vị là năm nay ngoài y khoa, còn có thêm nhiều bạn từ doanh nghiệp và kinh tế. Do đó, chúng tôi phải lấy ví dụ bên kinh tế để làm bài giảng. Như các bạn biết, Trường dành ưu tiên cho nghiên cứu sinh, nên đây là cơ hội để các bạn học thêm một công nghệ mới. Sau workshop này, chúng tôi sẽ nghỉ một thời gian để suy nghĩ cách làm mới và lâu dài hơn. Do đó, sẽ không có một workshop như thế này vào năm tới.

Có vài em nghiên cứu sinh ở nước ngoài hỏi tôi có thể đưa chương trình giảng lên internet. Câu trả lời là không. Vả lại, thu hình thì rất nhiêu khê và có vấn đề về phẩm chất. Làm cho có mà phẩm chất kém thì tôi không bao giờ làm, vì có lẽ chẳng ai nghe được. Làm để cho ra một sản phẩm với âm thanh tốt thì tốn kém và Trường chưa có điều kiện để thu hình.

Mong gặp lại các bạn vào đầu tháng 1.

====
(1) Liên lạc ghi danh: ThS. Nguyễn Hoàng Nam. Điện thoại: (08) 37755 037. Điện thư: nguyenhoangnam@tdt.edu.vn.
Sau đây là danh sách bài giảng trong lớp học. Như các bạn thấy, đây là workshop được thiết kế theo motif rất khác với các lớp theo motif khoa học máy tính. Mục tiêu của chúng tôi là trang bị cho các học viên kiến thức và kĩ năng về ứng dụng Machine Learning trong khoa học và Dữ liệu Lớn trong nghiên cứu y khoa, KHXH và kinh tế:
1 Overview of Machine Learning (Tổng quan về mô hình hoá bằng máy tính)
2 Review of R language (Ôn tập về ngôn ngữ R) 
3 Data editing (Biên tập dữ liệu) 
4 Data management for analysis (Quản lí dữ liệu) 
5a Graphical analysis using R, part I (Phân tích biểu đồ, phần I) 
5b Graphical analysis using R, part II (Phân tích biểu đồ, phần II)
6 Introduction to ggplot2 (Giới thiệu chương trình ggplot2) 
6a Histogram (biểu đồ phân bố) 
6b Correlational plot (Biểu đồ tương quan) 
6c Box plot (Biểu đồ hộp)
7 Descriptive analysis (Phân tích mô tả) 
8 Correlation analysis (Phân tích tương quan) 
9 Introduction to simple linear regression (Hồi qui tuyến tính đơn giản) 
10 Interpretation of linear regression analysis (Diễn giải kết quả phân tích mô hình hồi qui tuyến tính) 
11 Model checking (Kiểm tra giả định của mô hình hồi qui tuyến tính) 
12 Interpretation of R2 (Diễn giải ý nghĩa của hệ số xác định) 
13 Multiple linear regression (Mô hình hồi qui tuyến tính đa biến) 
14 Multiple linear regression: Interaction and categorical predictors (Ảnh hưởng tương tác và biến phân loại) 
15 Problem of multicollinearity (Vấn đề đa cộng tuyến) 
16 Variable selection in multiple linear regression (Phương pháp chọn biến số liên quan trong mô hình hồi qui tuyến tính đa biến) 
16a LASSO method (Phương pháp LASSO) 
17 Introduction to logistic regression model (Giới thiệu mô hình hồi qui logistic)
18 Multivariable logistic regression (Mô hình logistic đa biến) 
19 Interpretation of logistic regression model (Diễn giải mô hình hồi qui logistic) 
20 Variable selection in logistic regression (Phương pháp chọn biến số liên quan trong mô hình hồi qui logistic đa biến) 
21 Evaluation of logistic regression model (Đánh giá mô hình logistic) 
22 Building a predictive model based on logistic regression (Xây dựng mô hình tiên lượng dựa trên hồi qui logistic) 
23 Introduction to Machine Learning approaches (Giới thiệu các phương pháp machine learning 'hiện đại') 
24 Introduction to "caret" package (Giới thiệu chương trình R "caret")
24a Using caret for linear regression and logistic regression (Sử dụng caret cho mô hình hồi qui tuyến tính và hồi qui logistic) 
25 Introduction to bootstrap methods (Giới thiệu các phương pháp tái chọn mẫu) 
26 K-nearest neighbours (Mô hình "Láng giềng gần nhất") 
27 Random forest (Phương pháp "Rừng ngẫu nhiên")
28 Support vector machines (Phương pháp đa tuyến tính)
29 Neural networks (Phương pháp "Mạng thần kinh")
30 Linear discriminant analysis (Phân tích phân định tuyến tính) 
31 Principal component analysis (Phân tích thành tố) 
32 Cluster analysis (Phân tích cụm) 
33 Factor analysis (Phân tích yếu tố) 
34 Handling of missing values (Phương pháp xử lí số liệu trống)

No comments: