Wednesday, December 28, 2016

"Over-fitting" và ý nghĩa thực tế trong đời sống

Không nói ra thì ai cũng biết chuyện hôn nhân là chuyện hệ trọng. Vì tính hệ trọng của nó nên đòi hỏi người ta phải suy nghĩ cẩn thận. Nhưng một vấn đề  trong thống kê học và machine learning có tên là "over-fitting" (1) khuyên bạn không nên suy nghĩ nhiều quá. Trong cuốn sách "Algorithms to live by" tác giả bàn về ý nghĩa của over-fitting trong việc chọn người bạn đời, thói thần tượng hoá, kĩ nghệ luyện gà đá, tiến hoá và thực phẩm, và ở đây tôi tóm lược vài ý chính như là một giải trí cuối năm cho các bạn.

Qui luật 37% (và ứng dụng cho việc tìm người yêu)

Nghĩ lại trong thống kê học có những hằng số hết sức lí thú và quan trọng. Chúng ta đã biết những con số như 0.05 (trị số P), 1.96 (hằng số của phân bố chuẩn) có ảnh hưởng đến cuộc sống như thế nào. Nhưng có lẽ ít ai biết đến qui luật 37%. Đây là một qui luật mới được tái khám phá, nhưng có nhiều ứng dụng trong y khoa, khoa học, tìm nhân viên, thậm chí ... tình yêu.

Monday, December 26, 2016

Thông báo thứ 3 (sau cùng) về lớp học Machine Learning

Chỉ còn 1 tuần nữa là đóng sổ ghi danh workshop Machine Learning ở TDTU. Các bạn nào chưa ghi danh thì nên ghi danh trước ngày 31/12 cho tiện việc in ấn bài giảng (rất nhiều). Sau ngày đó là khoá sổ (1), và cũng như năm ngoái, sẽ không có dzu dzi với ghi danh trễ, không có "tại vì bởi" sau ngày khoá sổ.

Nhạc boléro trên đài truyền hình Vĩnh Long

Tôi mới xem qua vài chương trình thi hát nhạc bolero trên đài truyền hình Vĩnh Long, và phải có lời khen. Chương trình hay từ cách dàn dựng, ca sĩ, ca khúc, hoà âm phối khí, đến người MC đều rất tốt. Hiếm thấy một chương trình nhạc ở Việt Nam nào mà hay đến như thế.

Friday, December 23, 2016

Lại bàn về PISA: khái niệm effect size

Tôi thấy một cách để hiểu đúng kết quả PISA là qua khái niệm effect size. Trong y khoa và tâm lí học thì effect size rất phổ biến, nhưng áp dụng effect size vào nghiên cứu giáo dục có thể cũng có ích vì nó nói lên đúng hơn bản chất của so sánh điểm thi giữa các nước. Và, khi đã có kết quả tính toán effect size, chúng ta sẽ thấy rằng bảng xếp hạng PISA không có ý nghĩa gì nhiều.

Thursday, December 22, 2016

"Biases" trong kiểm định giáo dục

Câu hỏi tại sao học sinh Việt Nam có điểm tương đối tốt trong kì kiểm định PISA 2012 và 2015 vẫn còn ám ảnh nhiều người. Cách hiểu đơn giản nhất là học sinh Việt Nam mình giỏi. Nhưng trước khi tự mình khen mình, tôi nghĩ đến vấn đề mà thuật ngữ khoa học hay gọi là "bias". Trong bất cứ nghiên cứu nào, trong bất cứ kiểm định đánh giá nào cũng đều có bias. Nếu chúng ta không cẩn thận với bias thì rất dễ đi đến diễn giải sai hay kết luận sai.

Tuesday, December 20, 2016

Yếu tố nào ảnh hưởng đến điểm PISA 2015?

Tôi lại có dịp "táy máy" với dữ liệu PISA 2015, và lần này tôi chỉ tập trung vào Việt Nam. Câu hỏi mà tôi muốn trả lời là yếu tố nào ảnh hưởng đến điểm kiểm định PISA 2015 ở học sinh Việt Nam? Câu trả lời cũng có vài điều ngạc nhiên và đáng chú ý ...

Monday, December 19, 2016

Kết quả PISA 2015: một cách hiểu khác


Kết quả kiểm định PISA năm nay mới vừa được công bố, và Việt Nam đứng hạng 8 trong 72 nước về khoa học, hạng 22 về toán, và hạng 32 về đọc & hiểu. Đây là những thứ hạng làm cho những người trong Bộ GDĐT có lí do để ăn mừng. Hạng của Việt Nam làm cho một giáo sư Mĩ ngạc nhiên (1). Thật ra, tôi rất ngạc nhiên khi thấy ông ấy ngạc nhiên! Nếu ai biết chút ít về cách tính đằng sau của PISA thì có lẽ sẽ dè dặt với cách diễn giải của các quan chức.

Friday, December 16, 2016

Bạn đã đọc Nguyễn Thanh Việt (Viet Thanh Nguyen) chưa?


Tác giả là một nhà văn Mĩ gốc Việt mới được trao giải thưởng văn chương Pulitzer (1). Tôi đã đọc nhiều bài luận văn (essay) của tác giả trong quá khứ, và thấy rất thích. Lúc đó, tôi nghĩ anh này là một niềm hi vọng Nobel cho văn học Việt Nam. Không còn nghi ngờ gì nữa: VTN đúng là một văn tài.

Monday, December 12, 2016

Ước tính cỡ mẫu và Machine Learning

Xin thông báo đến các bạn rằng tôi mới tải lên kênh youtube hai bài giảng về phân tích dữ liệu. Bài thứ nhất bàn về các phương pháp ước tính cỡ mẫu cho một nghiên cứu khoa học, và bài thứ hai là giới thiệu workshop về machine learning vào đầu năm 2017. Địa chỉ là:


Saturday, December 10, 2016

Hành trình đến tự do - Nhà văn Mai Thảo


Xin giới thiệu đến các bạn một bài viết của Nhà văn Ngô Thế Vinh về hành trình tị nạn của Nhà văn Mai Thảo, một trong những "đại thụ" của nền văn học miền Nam trước 1975. Bài viết có nhiều chi tiết rất thú vị và những hình ảnh quí. Mai Thảo đã từ giã cõi trần từ năm 1998, nhưng di sản văn chương của ông thì còn mãi mãi trong dòng văn học nước nhà. Tôi chỉ mong một ngày nào đó các sinh viên và học sinh Việt Nam có dịp đọc những áng văn hay của Mai Thảo. Bài viết này gợi lại những ngày đầu tôi đến Úc, cũng trải qua nhiều gian nan như ông. Nhưng tôi may mắn hơn là tôi còn trẻ (lúc đó) nên có dịp làm lại cuộc đời, còn Mai Thảo thì vì cái nghiệp văn chương đeo đuổi nên suốt đời lận đận.
NVT 

Friday, December 9, 2016

Cập nhật lớp học về "Machine Learning" tháng 1/2017

Chỉ còn khoảng 4 tuần nữa là khai mạc lớp học về "Machine Learning" (ML). Đến hôm nay thì bài giảng đã soạn xong. Có tất cả 31 bài giảng (1 bài giảng bổ sung khi có thì giờ). Hơn 1000 slides, với nhiều phương pháp và dữ liệu sẽ giúp cho các bạn rất nhiều trong tương lai. Trong cái note này tôi sẽ nói sơ qua về nội dung lớp học.

Saturday, December 3, 2016

Nghĩ lan man về "Kĩ thuật cao và tiêu hoá Hà Nội"

Nhìn danh xưng của cái trung tâm trong hình này làm tôi phân vân. Thuở đời nay tên trung tâm mà lẫn lộn giữa công nghệ và chuyên khoa: "Trung tâm kĩ thuật cao và tiêu hoá Hà Nội"! Còn phần tiếng Anh thì lại còn đáng bàn hơn: "Hanoi High Tech and Digestive Center." Xin cho tôi 2 phút giải thích ...

Cập nhật khoá học về Machine Learning 1/2017


Xin thông báo đến các bạn quan tâm là tiến trình chuẩn bị khoá học về ML sắp tới diễn ra rất ok. Phía bên Trường (ĐH Tôn Đức Thắng) cho biết đã có một số bạn ghi danh, nhưng số gọi điện tìm hiểu thì cao gấp chục lần số ghi danh. Trường định đóng sổ ghi danh vào ngày 30/12/2016.

Friday, December 2, 2016

Đánh giá khoa học

Vài tuần trước tôi có dịp nói chuyện về đề tài đánh giá khoa học trong một seminar của nhóm nghiên cứu informetrics thuộc ĐH Tôn Đức Thắng (1). Tôi bàn về 3 tiêu chí để đánh giá nghiên cứu khoa học: lượng, chất, và tác động. Đây cũng là những tiêu chí mà người ta hay dựa vào để cấp tài trợ và giải thưởng. Nhưng mỗi tiêu chí đều có cái hay và cái dở, nên việc áp dụng phải hết sức cẩn thận.