Friday, March 3, 2017

Tác giả của "impact factor" (Eugene Garfield) đã ra đi.


Một người có ảnh hưởng rất lớn đến khoa học là Eugene Garfield, người phát triển chỉ số impact factor (tên đúng là Journal Impact Factor - JIF), vừa mới qua đời ở Mĩ hôm 26/2/2017 (1). Ông thọ 91 tuổi.




Ông sinh ra ở New York vào năm 1925, và tên thật là Eugene Garfinkle (nhưng chẳng hiểu sao sau này ông đổi thành họ Garfield). Ông xuất thân là một chuyên gia về ngôn ngữ học, tốt nghiệp tiến sĩ ngôn ngữ học từ Đại học Pennsylvania vào năm 1961.

Tuy không phải là một nhà khoa học, nhưng việc làm và sáng kiến của ông là những đóng góp rất lớn cho khoa học toàn cầu. Ông sáng lập ra Viện thông tin khoa học (Institute of Scientific Information – ISI) vào năm 1960. Thời gian sau đó, ông "sáng chế" ra JIF, gây ảnh hưởng rất lớn đến khoa học. Ảnh hưởng tốt lẫn xấu. Năm 1964 ông sáng lập ra thư mục Science Citation Index (SCI) để thu thập thông tin về trích dẫn của các tập san khoa học có uy tín. Từ những phát triển ban đầu, các cơ sở dữ liệu toàn cầu như Web of Science ra đời. Năm 1988, ông bán ISI cho Nhà xuất bản JPT với cái giá 24 triệu USD. Năm 1992, hãng thông tấn Thomson mua ISI và sản phẩm của Viện với cái giá 210 triệu USD! Nay thì ISI thuộc về tập đoàn Clarivate Analytics. Cho đến nay, hầu như tất cả các đại học trên thế giới đều sử dụng cơ sở dữ liệu của WoS và ISI để đánh giá khoa học. Những cơ sở dữ liệu này giúp giới quản lí khoa học sàng lọc thật và dỏm từ hàng trăm ngàn tập san khoa học trên thế giới.

Một trong những dấu ấn Eugene Garfield để lại cho đời là Journal Impact Factor – chỉ số tác động. JIF là số trích dẫn số lần trích dẫn trung bình của những bài báo khoa học sau khi đã công bố trong vòng 2 năm. Chẳng hạn như IF của năm 2005 của một tập san được tính như sau: IF = A/B, trong đó A là số lần trích dẫn trong năm 2005 của những bài báo đã công bố trong thời gian 2003-2004, và B là số bài báo đã công bố trong thời gian 2003-2004. Ví dụ: trong 2 năm 2003 và 2004 tập san y khoa Lancet công bố 450 bài báo khoa học, và trong năm 2005 có 10,500 bài báo khác trích dẫn 450 bài báo đó, thì hệ số IF = 10.500 / 450 = 23.3. Mỗi năm ISI đánh giá cho khoảng 7,500 tập san trên thế giới. Hiện nay, IF của các tập san dao động từ 0.02 đến 69. Cách tính của IF rõ ràng là phản ảnh tác động của tập san.

Thế nhưng trong thực tế, các đại học dùng nó để đánh giá một bài báo! Đó là vấn đề gây ra nhiều tranh cãi. Một bài báo công bố trên tập san có IF cao chưa chắc được trích dẫn nhiều. Ngược lại, một bài báo công bố trên tập san có IF thấp có thể có nhiều trích dẫn và gây ảnh hưởng. Do đó, dựa vào IF để đánh giá chất lượng của một bài báo là phạm phải sai lầm ecologic fallacy. Lí thuyết là như thế, nhưng đối với giới quản lí, IF là chỉ số thực tế nhất và đơn giản nhất để họ đánh giá bài báo khoa học, và quan trọng hơn, đánh giá nhà khoa học. Ngay cả ông Garfield cũng không ủng hộ việc dùng IF để đánh giá nhà khoa học.

IF do đó gây ra rất nhiều tranh cãi. Đã có nhiều nhóm kêu gọi tẩy chay IF. Đã có nhiều bài báo (kể cả của tôi) chỉ ra cái sai sót của IF. Tất cả những chỉ trích IF đều đúng. IF không phản ảnh chất lượng bài báo khoa học -- đúng. IF không phản ảnh chất lượng tập san khoa học -- đúng. IF không nói lên thành tự của một nhà khoa học -- cũng đúng. Thế nhưng trong thực tế IF vẫn … sống. Vẫn sống và được giới quản lí đại học sử dụng. Lí do đơn giản của sự tồn tại của IF là vì không có cái chỉ số nào khác tốt hơn, đơn giản hơn, và dễ hiểu hơn IF trong việc đánh giá khoa học.

IF có nhiều sai sót, nhưng về lâu dài và về tổng thể thì nó vẫn đúng. Người ta chỉ trích rằng IF không phản ảnh chất lượng tập san khoa học, nhưng trong thực tế thì tập san có uy tín cao (do chính giới khoa học đánh giá) đều có IF cao. Người ta chỉ trích IF không phản ảnh chất lượng bài báo khoa học, nhưng trong thực tế bài công bố trên tập san có IF cao cũng thường có trích dẫn cao. Người ta chỉ trích IF không thể dùng để đánh giá nhà khoa học, nhưng trong thực tế nhà khoa học loại elite thích công bố trên tập san có IF cao. Không ai muốn công bố công trình nghiên cứu trên các tập san có IF thấp. Do đó, sáng kiến IF của Eugene Garfield vẫn còn y nguyên giá trị.

Cũng có thể nói rằng Eugene Garfield cũng chính là một "cha đẻ" của bộ môn khoa học Scientometrics hay Bibliometrics (hay cái này hơi khác nhau), và tôi là một "đồ đệ" của ông. Nói một cách nôm na, Scientometrics là một bộ môn khoa học chuyên nghiên cứu về hoạt động khoa học. Đây là một bộ môn khoa học kết hợp từ thông tin học, thống kê học, và xã hội học. Bộ môn này phát triển rất nhanh trong thời gian gần đây, nhất là có sự tham gia của Tàu. Hơn 10 năm trước khi bị thu hút bởi môn học này, tôi cũng thử làm vài phân tích để có cái nhìn chung về hoạt động khoa học của Việt Nam. Bài báo đầu tiên tôi đăng trên tập san Scientometrics là viết cùng với Ts Phạm Thị Ly, và bài này được khá nhiều cơ quan quốc tế trích dẫn. Tôi có lần liên lạc ông để xin số liệu, và ông rất vui vẻ cung cấp. Dạo đó, tôi dịch Scientometrics là "Trắc lượng khoa học". Đến nay, ĐH Tôn Đức Thắng mới thành lập một nhóm nghiên cứu informetrics, và đang triển khai vài dự án liên quan đến trắc lượng khoa học. Tất cả những việc làm cá nhân đó đều chịu ảnh hưởng và có dấu ấn từ Eugene Garfield. Tuy rằng Eugene Garfield đã ra đi, nhưng di sản của ông thì còn mãi mãi.

(1) https://www.timeshighereducation.com/news/citation-analytics-pioneer-eugene-garfield-dies-aged-91

No comments: