Wednesday, December 28, 2016

"Over-fitting" và ý nghĩa thực tế trong đời sống

Không nói ra thì ai cũng biết chuyện hôn nhân là chuyện hệ trọng. Vì tính hệ trọng của nó nên đòi hỏi người ta phải suy nghĩ cẩn thận. Nhưng một vấn đề  trong thống kê học và machine learning có tên là "over-fitting" (1) khuyên bạn không nên suy nghĩ nhiều quá. Trong cuốn sách "Algorithms to live by" tác giả bàn về ý nghĩa của over-fitting trong việc chọn người bạn đời, thói thần tượng hoá, kĩ nghệ luyện gà đá, tiến hoá và thực phẩm, và ở đây tôi tóm lược vài ý chính như là một giải trí cuối năm cho các bạn.

Qui luật 37% (và ứng dụng cho việc tìm người yêu)

Nghĩ lại trong thống kê học có những hằng số hết sức lí thú và quan trọng. Chúng ta đã biết những con số như 0.05 (trị số P), 1.96 (hằng số của phân bố chuẩn) có ảnh hưởng đến cuộc sống như thế nào. Nhưng có lẽ ít ai biết đến qui luật 37%. Đây là một qui luật mới được tái khám phá, nhưng có nhiều ứng dụng trong y khoa, khoa học, tìm nhân viên, thậm chí ... tình yêu.

Monday, December 26, 2016

Thông báo thứ 3 (sau cùng) về lớp học Machine Learning

Chỉ còn 1 tuần nữa là đóng sổ ghi danh workshop Machine Learning ở TDTU. Các bạn nào chưa ghi danh thì nên ghi danh trước ngày 31/12 cho tiện việc in ấn bài giảng (rất nhiều). Sau ngày đó là khoá sổ (1), và cũng như năm ngoái, sẽ không có dzu dzi với ghi danh trễ, không có "tại vì bởi" sau ngày khoá sổ.

Nhạc boléro trên đài truyền hình Vĩnh Long

Tôi mới xem qua vài chương trình thi hát nhạc bolero trên đài truyền hình Vĩnh Long, và phải có lời khen. Chương trình hay từ cách dàn dựng, ca sĩ, ca khúc, hoà âm phối khí, đến người MC đều rất tốt. Hiếm thấy một chương trình nhạc ở Việt Nam nào mà hay đến như thế.

Friday, December 23, 2016

Lại bàn về PISA: khái niệm effect size

Tôi thấy một cách để hiểu đúng kết quả PISA là qua khái niệm effect size. Trong y khoa và tâm lí học thì effect size rất phổ biến, nhưng áp dụng effect size vào nghiên cứu giáo dục có thể cũng có ích vì nó nói lên đúng hơn bản chất của so sánh điểm thi giữa các nước. Và, khi đã có kết quả tính toán effect size, chúng ta sẽ thấy rằng bảng xếp hạng PISA không có ý nghĩa gì nhiều.

Thursday, December 22, 2016

"Biases" trong kiểm định giáo dục

Câu hỏi tại sao học sinh Việt Nam có điểm tương đối tốt trong kì kiểm định PISA 2012 và 2015 vẫn còn ám ảnh nhiều người. Cách hiểu đơn giản nhất là học sinh Việt Nam mình giỏi. Nhưng trước khi tự mình khen mình, tôi nghĩ đến vấn đề mà thuật ngữ khoa học hay gọi là "bias". Trong bất cứ nghiên cứu nào, trong bất cứ kiểm định đánh giá nào cũng đều có bias. Nếu chúng ta không cẩn thận với bias thì rất dễ đi đến diễn giải sai hay kết luận sai.

Tuesday, December 20, 2016

Yếu tố nào ảnh hưởng đến điểm PISA 2015?

Tôi lại có dịp "táy máy" với dữ liệu PISA 2015, và lần này tôi chỉ tập trung vào Việt Nam. Câu hỏi mà tôi muốn trả lời là yếu tố nào ảnh hưởng đến điểm kiểm định PISA 2015 ở học sinh Việt Nam? Câu trả lời cũng có vài điều ngạc nhiên và đáng chú ý ...

Monday, December 19, 2016

Kết quả PISA 2015: một cách hiểu khác


Kết quả kiểm định PISA năm nay mới vừa được công bố, và Việt Nam đứng hạng 8 trong 72 nước về khoa học, hạng 22 về toán, và hạng 32 về đọc & hiểu. Đây là những thứ hạng làm cho những người trong Bộ GDĐT có lí do để ăn mừng. Hạng của Việt Nam làm cho một giáo sư Mĩ ngạc nhiên (1). Thật ra, tôi rất ngạc nhiên khi thấy ông ấy ngạc nhiên! Nếu ai biết chút ít về cách tính đằng sau của PISA thì có lẽ sẽ dè dặt với cách diễn giải của các quan chức.

Friday, December 16, 2016

Bạn đã đọc Nguyễn Thanh Việt (Viet Thanh Nguyen) chưa?


Tác giả là một nhà văn Mĩ gốc Việt mới được trao giải thưởng văn chương Pulitzer (1). Tôi đã đọc nhiều bài luận văn (essay) của tác giả trong quá khứ, và thấy rất thích. Lúc đó, tôi nghĩ anh này là một niềm hi vọng Nobel cho văn học Việt Nam. Không còn nghi ngờ gì nữa: VTN đúng là một văn tài.

Monday, December 12, 2016

Ước tính cỡ mẫu và Machine Learning

Xin thông báo đến các bạn rằng tôi mới tải lên kênh youtube hai bài giảng về phân tích dữ liệu. Bài thứ nhất bàn về các phương pháp ước tính cỡ mẫu cho một nghiên cứu khoa học, và bài thứ hai là giới thiệu workshop về machine learning vào đầu năm 2017. Địa chỉ là:


Saturday, December 10, 2016

Hành trình đến tự do - Nhà văn Mai Thảo


Xin giới thiệu đến các bạn một bài viết của Nhà văn Ngô Thế Vinh về hành trình tị nạn của Nhà văn Mai Thảo, một trong những "đại thụ" của nền văn học miền Nam trước 1975. Bài viết có nhiều chi tiết rất thú vị và những hình ảnh quí. Mai Thảo đã từ giã cõi trần từ năm 1998, nhưng di sản văn chương của ông thì còn mãi mãi trong dòng văn học nước nhà. Tôi chỉ mong một ngày nào đó các sinh viên và học sinh Việt Nam có dịp đọc những áng văn hay của Mai Thảo. Bài viết này gợi lại những ngày đầu tôi đến Úc, cũng trải qua nhiều gian nan như ông. Nhưng tôi may mắn hơn là tôi còn trẻ (lúc đó) nên có dịp làm lại cuộc đời, còn Mai Thảo thì vì cái nghiệp văn chương đeo đuổi nên suốt đời lận đận.
NVT 

Friday, December 9, 2016

Cập nhật lớp học về "Machine Learning" tháng 1/2017

Chỉ còn khoảng 4 tuần nữa là khai mạc lớp học về "Machine Learning" (ML). Đến hôm nay thì bài giảng đã soạn xong. Có tất cả 31 bài giảng (1 bài giảng bổ sung khi có thì giờ). Hơn 1000 slides, với nhiều phương pháp và dữ liệu sẽ giúp cho các bạn rất nhiều trong tương lai. Trong cái note này tôi sẽ nói sơ qua về nội dung lớp học.

Saturday, December 3, 2016

Nghĩ lan man về "Kĩ thuật cao và tiêu hoá Hà Nội"

Nhìn danh xưng của cái trung tâm trong hình này làm tôi phân vân. Thuở đời nay tên trung tâm mà lẫn lộn giữa công nghệ và chuyên khoa: "Trung tâm kĩ thuật cao và tiêu hoá Hà Nội"! Còn phần tiếng Anh thì lại còn đáng bàn hơn: "Hanoi High Tech and Digestive Center." Xin cho tôi 2 phút giải thích ...

Cập nhật khoá học về Machine Learning 1/2017


Xin thông báo đến các bạn quan tâm là tiến trình chuẩn bị khoá học về ML sắp tới diễn ra rất ok. Phía bên Trường (ĐH Tôn Đức Thắng) cho biết đã có một số bạn ghi danh, nhưng số gọi điện tìm hiểu thì cao gấp chục lần số ghi danh. Trường định đóng sổ ghi danh vào ngày 30/12/2016.

Friday, December 2, 2016

Đánh giá khoa học

Vài tuần trước tôi có dịp nói chuyện về đề tài đánh giá khoa học trong một seminar của nhóm nghiên cứu informetrics thuộc ĐH Tôn Đức Thắng (1). Tôi bàn về 3 tiêu chí để đánh giá nghiên cứu khoa học: lượng, chất, và tác động. Đây cũng là những tiêu chí mà người ta hay dựa vào để cấp tài trợ và giải thưởng. Nhưng mỗi tiêu chí đều có cái hay và cái dở, nên việc áp dụng phải hết sức cẩn thận.

Monday, November 28, 2016

Machine Learning là gì?

Mấy hôm nay có vài bạn viết email hỏi tôi machine learning (ML) là gì và có cần học thêm không? Tôi nghĩ câu trả lời cho câu thứ hai là "Yes" – lúc nào cũng cần phải học thêm. Hôm kia, nhân đọc một bản tin cho biết con rể ông Trump (Jared Kushner) đã sử dụng ML để giúp cho nhạc phụ đắc cử, tôi có cảm hứng viết thêm một chút về ML ...

Sunday, November 27, 2016

Fidel Castro


Hiếm thấy một người mà ngay đến cái chết cũng gây ra nhiều xúc cảm trái ngược nhau như Fidel Castro. Cái tin ông qua đời có thể làm cho nhiều người ở Cuba và Việt Nam buồn bã, nhưng lại là cái cớ để cộng đồng người Cuba xuống đường ăn mừng ở Miami. Báo chí bên nhà gọi ông là "nhà cách mạng vĩ đại, một trong những người kiệt xuất nhất của thế kỷ XX", nhưng người tị nạn Cuba ở Miami và chính em gái ông gọi ông là "El Monstruo" (tức là quái vật).

Monday, November 21, 2016

Một lời cảm ơn

Vậy là chúng ta đã xong chương trình workshop 4 ngày về viết và xuất bản khoa học (scientific writing and publication), và hội thảo 1 ngày về ứng dụng di truyền học (applied genetics) tại Đại học Y khoa Phạm Ngọc Thạch. Tôi nghĩ cái câu mà người ta hay dùng, "thành công tốt đẹp", có thể sử dụng ở đây. Xin cám ơn các bạn, các đồng nghiệp từ các miền Nam, Trung, Bắc đã tham dự một cách hào hứng và đóng góp vào sự thành công của hai chương trình tập huấn.

Wednesday, November 9, 2016

Đọc diễn văn của Donald Trump

Thế là Donald Trump trở thành tổng thống thứ 45 của Mĩ. Đúng là Donald Trump đã viết lại tất cả "rule book" chính trị. Thế là tất cả các giáo sư lừng danh chuyên ngành kinh tế, thống kê, xã hội học, hầu hết các cây bỉnh bút trứ danh đều sai bét (vì họ đều đoán rằng bà Hillary Clinton sẽ thắng). Tôi cũng sai luôn. Đọc bài diễn văn (1) khi chấp nhận kết quả đắc cử tôi thấy ông Trump là một con người khác, một người rất lịch lãm và có tri thức đáng nể.

Tuesday, November 8, 2016

Ý nghĩa của trang phục tốt nghiệp đại học

Chúng ta hay thấy trong các buổi lễ tốt nghiệp đại học ở phương Tây, các tân cử nhân, thạc sĩ, tiến sĩ mặc áo thụng khá màu mè. Tôi vẫn hay thắc mắc là tại sao họ có nhiều kiểu áo khác nhau, mũ khác nhau, và cái hood (giống như cái túi càn khôn) cũng khác nhau. Tôi thử tìm hiểu thì thấy tất cả các trang phục này có truyền thống rất thú vị ...

Monday, November 7, 2016

Một phân tích đánh giá có vấn đề


Một đồng nghiệp ở Hà Nội hỏi tôi về một cách đánh giá hiệu quả can thiệp trong cộng đồng mà anh ấy cảm thấy hình như có vấn đề, dù anh ấy không giải thích được tại sao. Chỉ là trực giác. Tôi tìm hiểu qua thì quả thật trực giác của anh bạn tôi là đúng. Trong cái note này tôi sẽ giải thích tại sao cách đánh giá này sai và có thể gây tác động đến nhiều chính sách ở qui mô lớn.

Út Bạch Lan (1935 - 2016)

Mới đọc báo và biết tin buồn: nghệ sĩ cải lương Út Bạch Lan qua đời vài ngày trước! Bà thọ 81 tuổi, nhưng tính tuổi ta là 82. Tôi vốn mê cải lương nên từng có lần viết bài về hai nghệ sĩ tôi mến mộ: Bạch Tuyết và Út Bạch Lan. Nhân dịp này, xin chia sẻ vài cảm nhận cùng các bạn nào chưa biết đến người nghệ sĩ nhân ái và tài sắc Út Bạch Lan, người đã góp công tạo nên nền nghệ thuật cải lương ở miền Nam.

Saturday, November 5, 2016

Cập nhật về workshop "viết và công bố khoa học" (11/2016)

Xin hân hạnh cập nhật về workshop về viết và công bố khoa học ở ĐH Phạm Ngọc Thạch. Hôm nay thì số học viên đăng kí đang tăng nhanh chóng và vượt ngưỡng kì vọng. Khổ nỗi là nhiều người chờ đến cận ngày mới chịu đăng kí nên làm cho ban tổ chức đau đầu.

Wednesday, November 2, 2016

Bảy trụ cột thông thái của thống kê học

Một trong những cuốn sách khoa học mà tôi rất thích trong vài tháng gần đây là cuốn "The Seven Pillars of Statistical Wisdom" của tác giả Stephen M. Stigler (1). Đây là một cuốn sách nhỏ (200 trang) cung cấp cho chúng ta những lí giải cực kì lí thú về khoa học thống kê và lịch sử đằng sau những phương pháp mà chúng ta sử dụng trong suy luận khoa học. Như tựa đề cuốn sách, tác giả Stigler tập trung vào giải thích 7 trụ cột thông thái của thống kê học, và tôi thử tóm lược theo cách hiểu của tôi dưới đây.