Wednesday, November 5, 2008

Chiều cao và thành tựu của tổng thống Mĩ

Viết xong cái entry về chiều cao và tổng thống Mĩ tôi chợt thấy một bài báo thú vị có tên là “Is Presential Greatness Related to Height?” của Paul Sommers, giáo sư kinh tế của trường Middlebury College (bang Vertmont). Bài đăng trên tập san The Colege Mathematical Journal năm 2002, số 33, trang 14-16.

Ông giáo sư này làm thống kê chiều cao của tổng thống Mĩ trước. Sau đó ông tìm những đánh giá của giới sử gia Mĩ về thành tựu của họ trong thời gian tại chức. Thành tựu ở đây là chính sách kinh tế, giáo dục, y tế, khả năng ứng biến trong tình hình chiến tranh và khủng hoảng. Có bốn bậc thành tựu: great (lớn), near great (gần lớn), above average (trên trung bình), average (trung bình), below average (dưới trung bình), và failure (thất bại). Có một số tổng thống mà người ta không đánh giá được và kí hiệu là “na” (not available hay not applicable). Số liệu đó được trình bày trong bảng dưới đây.

Câu hỏi ông đặt ra là: có mối tương quan nào giữa chiều cao và thành tựu hay không? Cách đơn giản nhất để kiểm định giả thuyết này là tính chiều cao trung bình cho từng bậc. Tôi tính thử thì thấy như sau:

Thành tựu

Số tổng thống

Chiều cao trung bình và độ lệch chuẩn

Great

4

188 (0.5)

Near Great

4

179 (4.2)

Above Average

9

179 (9.2)

Average

11

177 (7.7)

Below Average

7

179 (4.2)

Failure

5

180 (4.7)

Như vậy, chiều cao xem ra có tương quan với mức độ thành tựu. Chiều cao càng cao thành tựu càng lớn. Nếu chúng ta chia thành tựu thành 3 nhóm: Great và Near Great thành một nhóm, average và above average thành một nhóm, và below average và failure, thì kết quả sẽ là:

Thành tựu

Số tổng thống

Chiều cao trung bình và độ lệch chuẩn

Great + Near Great

8

184 (5.4)

Average + Above Average

20

178 (8.2)

Failure + Below Average

12

179 (4.2)

Rõ ràng có sự khác biệt về chiều cao và sự thành tựu của tổng thống. Nhưng thú vị hơn có lẽ là lời giải thích và lí thuyết đằng sau nó. Tôi thấy lí thuyết Darwin khá thuyết phục ở đây, nhưng tôi sẽ … không nói. :-)

Dựa vào kết quả quá khứ, có thể nói xác suất Obama trở thành một tổng thống “Great” hay “Near Great” có thể cao đấy. Cao bao nhiêu thì tôi để cho các bạn tính (vẫn mô hình logistic thôi). :-)

Còn George W. Bush? Dựa vào mô hình trên (chiều cao của GWB là 180 cm), tôi tính thấy xác suất ông ấy đắc cử là 50%. Còn xác suất làm tổng thống "great" hay "near great" thì exp(a+b*height) / (1+exp(a+b*height)), trong đó a=-26.573, b=0.1383) thì xác suất Bush làm tổng thống bậc đó chỉ 15%, ngay cả xác suất ông ấy trên trung bình (với a=-12.1322 và b=0.0651) cũng chỉ 37%.

Mua vui cũng được một vài phút giây. (Xin lỗi Tiên Điền tiên sinh tôi đã sửa lời của cụ!)

NVT

Danh sách tổng thống, chiều cao (cm) và thành tựu

Tên

Chiều cao

Thành tựu

Abraham Lincoln

188

great

Andrew Jackson

185

near great

Andrew Johnson

178

failure

Barack Obama

187

na

Benjamin Harrison

168

average

Bill Clinton

189

above ave

Calvin Coolidge

178

below ave

Chester A Arthur

188

average

Dwight D Eisenhower

179

above ave

Franklin D Roosevelt

188

great

Franklin Pierce

178

below ave

George H W Bush

188

average

George W Bush

180

below ave

George Washington

188

great

Gerald Ford

183

average

Grover Cleveland

180

above ave

Harry S Truman

175

near great

Herbert Hoover

180

average

James Buchanan

183

failure

James Garfield

183

na

James Madison

163

above ave

James Monroe

183

above ave

James Polk

173

above ave

Jimmy Carter

175

average

John Adams

170

average

John F Kennedy

183

above ave

John Quincy Adams

170

above ave

John Tyler

183

below ave

Lyndon B Johnson

192

above ave

Martin Van Buren

168

average

Millard Fillmore

175

below ave

Richard Nixon

182

failure

Ronald Reagan

185

below ave

Rutherford B Hayes

174

average

Theodore Roosevelt

178

near great

Thomas Jefferson

189

great

Ulysses S Grant

172

failure

Warren Harding

183

failure

William Henry Harrison

173

na

William Howard Taft

183

average

William McKinley

170

average

Woodrow Wilson

180

near great

Zachary Taylor

173

below ave

Số liệu tranh cử từ 1789 đến nay là ở đây. Bạn đọc nào có R trong computer, chỉ cần cắt và dán mấy lệnh dưới đây sẽ có kết quả như trong entry trước mà tôi đề cập đến:

year = c(2008, 2008, 2004, 2004, 2000, 2000, 1996, 1996, 1992, 1992,

1988, 1988, 1984, 1984, 1980, 1980, 1976, 1976, 1972, 1972,

1968, 1968, 1964, 1964, 1960, 1960, 1956, 1956, 1952, 1952,

1948, 1948, 1944, 1944, 1940, 1940, 1936, 1936, 1932, 1932,

1928, 1928, 1924, 1924, 1920, 1920, 1916, 1916, 1912, 1912,

1908, 1908, 1904, 1904, 1900, 1900, 1896, 1896, 1892, 1892,

1888, 1888, 1880, 1880, 1864, 1864, 1852, 1852, 1844, 1844,

1840, 1840, 1836, 1836, 1832, 1832, 1828, 1828, 1824, 1824,

1820, 1820, 1816, 1816, 1812, 1812, 1800, 1800, 1796, 1796,

1792, 1792, 1789, 1789)

height = c(187, 167, 180, 193, 180, 184, 189, 183,

189, 188, 188, 167, 185, 180, 185, 175, 175,

185, 182, 185, 182, 180, 192, 183, 183, 182,

179, 178, 179, 178, 175, 173, 188, 173, 188,

185, 188, 173, 188, 180, 182, 168, 178, 183,

183, 168, 180, 180, 180, 178, 182, 183, 178,

183, 170, 183, 170, 183, 180, 168, 168, 180,

183, 188, 192, 168, 178, 196, 173, 185, 173,

168, 168, 173, 185, 185, 185, 170, 170, 185,

183, 170, 183, 178, 163, 191, 189, 168, 170,

189, 188, 170, 188, 170)

won = c(1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,

1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,

0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,

1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,

0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,

1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1,

0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,

1, 0, 1, 0)

# kiem tra so lieu

cbind(year, height, won)

# Ve bieu do box

boxplot(height ~ won,

ylab="Chieu cao", xlab="Ket qua (1=thang, 0=thua")

# mo hinh hoi qui logistic

logist = glm(won ~ height, family=binomial)

6 comments:

Anonymous said...

Cam on Anh da "Mua vui cũng được một vài phút giây" va bon em cung duoc them 1 lan hoc ve Regression va thuc hanh R.

HVP

Anonymous said...

em có thử rồi nhưng chỉ có hiện ra biểu đồ

HVP said...

Chao Anh ban anonymos.

Chac ban chua summary(logist) nen no chang hien ra ket qua chi hien ra bieu do la het.

Ban go them summary(logist) thi ket qua la "

Call:
glm(formula = won ~ height, family = binomial)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.459304 -1.179493 0.005821 1.141729 1.472785

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -7.16205 5.13542 -1.395 0.163
height 0.03982 0.02852 1.396 0.163

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 130.31 on 93 degrees of freedom
Residual deviance: 128.32 on 92 degrees of freedom
AIC: 132.32

Number of Fisher Scoring iterations: 4

Chuc vui

Anonymous said...

Cảm ơn bạn

Nguyễn Hà said...

Chào chú (bác) Tuấn. Cháu bây giờ mới biết tới bài viết thú vị này của chú, tuy là muộn nhưng phải góp ý để mà đính chính gấp.
Là một người yêu thích Lincoln, nghiên cứu Lincoln và các danh nhân thế giới khác 10 năm nay và cũng rất quan tâm đến chiều cao của họ nên từ rất lâu rồi cháu đã biết chiều cao chính xác của Lincoln là 193cm chứ không phải 188cm như bài viết của chú. Ngoài ra Obama cũng chỉ cao 185cm chứ không tới 187cm, các tổng thống khác cháu chưa có thời gian để kiểm chứng ở nguồn khác.
Điều này cháu đã đọc rất kỹ từ khi còn học cấp 2, chưa biết tới internet là gì. Những gì mà điều kiện cho phép cháu biết lúc đó là bất kỳ mẩu báo, tít, hay thông tin thú vị ngoài lề về các tổng thống trên các tạp chí đều được cháu sưu tầm lại. Và tất cả tài liệu đó cũng như bảng xếp hạng đó đều khẳng định Lincoln là tổng thống cao nhất trong tổng số 44 tổng thống Mỹ.
Điều đáng nói thêm là chú đã trích dẫn http://en.wikipedia.org/wiki/Heights_of_presidents_and_presidential_candidates_of_the_United_States#cite_note-kane-6 nhưng thông số đưa lên tính toán thì khác xa rất nhiều, lại còn khẳng định ở bài trước "Tổng thống Mĩ và chiều cao" là Clinton và Jefferson là tổng thống cao nhất nữa?
Hy vọng chú sửa lại.

kachi said...

Bài viết đã gỡ rối cho cháu ít nhiều trong bt môn thống kê đang học. Nhân tiện đọc được bài này, chú có thể cho cháu hỏi thêm 1 chút về vấn đề mình có thể kết luận tổng thống thì cao hơn chiều cao trung bình của người dân k? Với dữ liệu chiều cao của các tổng thống lấy từ nguồn trên và chiều cao trung bình của người dân lấy từ nguồn sau: .