Friday, December 2, 2016

Đánh giá khoa học

Vài tuần trước tôi có dịp nói chuyện về đề tài đánh giá khoa học trong một seminar của nhóm nghiên cứu informetrics thuộc ĐH Tôn Đức Thắng (1). Tôi bàn về 3 tiêu chí để đánh giá nghiên cứu khoa học: lượng, chất, và tác động. Đây cũng là những tiêu chí mà người ta hay dựa vào để cấp tài trợ và giải thưởng. Nhưng mỗi tiêu chí đều có cái hay và cái dở, nên việc áp dụng phải hết sức cẩn thận.



Hiện nay, theo tôi biết Chính phủ VN chi hơn 3000 tỉ đồng (tức khoảng 150 triệu USD) cho nghiên cứu khoa học (2). Nhưng đánh giá hiệu quả của số tiền đầu tư thì chưa có hệ thống mấy. Báo chí thì than phiền là có quà nhiều nghiên cứu bị xếp học tủ, hoặc không ứng dụng được (tức không có tác động). Giới khoa học thì nói cần phải có thời gian mới ứng dụng được. Lại có người nói trình độ kinh tế của VN chưa đủ để ứng dụng thành quả nghiên cứu khoa học từ VN! Tôi nghĩ vấn đề là thiếu một hệ thống đánh giá hoàn chỉnh. Do đó, trong bài nói chuyện, tôi bàn về các thước đo trong đánh giá khoa học. Tựu trung lại, có 3 thước đo chính: số lượng, phẩm chất, và tác động.

1. Lượng

Trước đây (và ngay cả ngày nay) rất nhiều nơi chạy theo số lượng. Số lượng bài báo, số lượng tiền xin được, số lượng nghiên cứu sinh đào tạo, v.v. được xem như là những chỉ số quan trọng để đánh giá. Những nước mới nổi hay đang trong quá trình "phấn đấu" như Tàu, Đài Loan, Hàn Quốc, v.v. thì họ rất quan tâm đến số lượng công bố quốc tế. Việt Nam ngày nay cũng thế, tức là cũng chạy theo lượng. Nhưng ai cũng biết đó là cách làm đơn giản và không công bằng. Lượng chỉ phản ảnh cái mà tôi gọi là "activity", chứ không phản ảnh đầy đủ thành quả của nghiên cứu khoa học.

2. Phẩm

Một khía cạnh khác là phẩm chất (sau này gọi là "chất lượng") khoa học, nhưng chất thì khó đánh giá. Ông bà mình đã chẳng từng nói "Dò sông dò biển dễ dò/ Có ai lấy thước mà đo lòng người" sao! Rất nhiều chỉ số đã được đề ra để đánh giá phẩm chất khoa học, nhưng tất cả đều có khiếm khuyết. Cách đơn giản nhất là dùng peer, nhưng cách làm này thiếu tính khách quan, dù đây là cách làm cổ điển. Các giải thưởng cũng nói lên một phần về phẩm chất, nhưng không khách quan. Còn impact factor (IF)? Bất cứ ai có kinh nghiệm nghiên cứu khoa học đều biết chỉ số IF không thích hợp cho việc đánh giá phẩm chất, nhưng nó là chỉ số dễ hiểu nhất và được dùng phổ biến nhất. Trong bài nói chuyện, tôi liệt kê (có lẽ chưa hết) các vấn đề của IF. Các chỉ số khác như citation, và các thước đo dựa vào citation (h index, g index, i5, v.v.) thì có phần tốt hơn, nhưng vẫn có vài khiếm khuyết về thời gian tính và văn hoá ngành.

Các nhóm xếp hạng đại học trên thế giới không dùng số bài báo, mà chỉ dùng số citation, để phân tích và xếp hạng các đại học. Cái giả định đằng sau cách làm này là phẩm chất nghiên cứu có liên quan với citations. Một giả định ngầm là các tập san dỏm sẽ chẳng có ai trích dẫn. Do đó, dùng citation làm chỉ số xếp hạng hoá giải vấn đề thật giả. Nhưng như nói trên, citation cũng có vấn đề về thời gian và văn hoá ngành, nên cũng chưa phải là chỉ số tốt nhất.

3. Tác động

Xu hướng mới là ngoài số lượng và chất lượng, phải xem xét đến impact (tác động). Có hai loại tác động trong nghiên cứu: tác động khoa học và tác động xã hội. Tác động khoa học có liên quan đến phẩm chất và có thể phản ảnh qua citation. Còn tác động xã hội thì khó đánh giá, và thường thì chỉ có người am hiểu trong ngành mới đánh giá được. (Người trong ngành mà còn junior hay không am hiểu cũng không thể đánh giá.) Hai chữ "xã hội" ở đây phải hiểu là tác động đến thực hành, chính sách, làm thay đổi nhận thức, v.v. Một nghiên cứu có thể làm thay đổi cách chẩn đoán bệnh và giảm số người cần điều trị hay cứu nhiều người được xem là có societal impact. Nghiên cứu có tác động xã hội như thế có khi không phản ảnh qua số lần trích dẫn. Đó chính là lí do hiện hữu của chỉ số tác động trong đánh giá nghiên cứu khoa học.

Quay lại tình hình ở bên nhà, tôi nghĩ Việt Nam cần phải phát triển một hệ thống đánh giá nghiên cứu khoa học cho tốt để trước là chọn đúng đề tài cho tài trợ, và sau là không phí tiền của người dân. Theo tôi, hệ thống đánh giá cần phải dựa trên 3 tiêu chí về lượng, phẩm, và tác động. Ở nơi khác thì tôi chưa rõ, nhưng ở Úc và Mĩ (nơi mà tôi hay duyệt đề cương nghiên cứu) thì đánh giá tác động gần như là bắt buộc.

Xin nói thêm rằng đây chỉ là những ý kiến mang tính cá nhân, nhưng tôi cũng đã được mời nói cho vài đại học bên Úc (kể cả nơi tôi đang công tác là UNSW và UTS). Kèm theo đây là slides trên ResearchGate (1). Tôi phát hiện là ResearchGate là nơi rất tốt để chia sẻ nghiên cứu và báo cáo seminars.


(2) Con số ~150 triệu USD này chỉ dành cho nghiên cứu khoa học thì phải, vì tổng số tiền chi là khoảng 400-450 triệu USD.

Ps: ĐH Tôn Đức Thắng đang tuyển người có kinh nghiệm về informetrics và scientometrics để làm việc trong một dự án qui mô về đánh giá khoa học và giáo dục, và phát triển phương pháp đánh giá. Hàng loạt projects nghiên cứu đang và sắp được triển khai; một số dự án đòi hỏi kĩ năng database và thống kê học. Trường cần người có kinh nghiệm và kiến thức tốt về đánh giá khoa học và trắc lượng giáo dục (educational measurement), kinh nghiệm về phân tích dữ liệu, am hiểu về phương pháp nghiên cứu khoa học. Ưu tiên cho ứng viên có công bố quốc tế trong chuyên ngành. Lương bổng hấp dẫn, tốt hơn mấy trường khác. Bạn nào thấy mình đáp ứng các điều kiện trên, gửi cv về cho Trường hay cho tôi.



No comments: