1. Biografi
John Wilder Tukey ialah seorang tokoh utama dalam bidang matematik dan statistik, yang kehidupan awalnya meletakkan asas bagi kerjaya cemerlangnya dalam analisis data dan sains komputer. Kerjayanya dibahagikan antara sumbangan akademik di Universiti Princeton dan penyelidikan industri di Bell Labs, di mana beliau membuat penemuan penting yang membentuk bidang-bidang ini.
1.1. Kehidupan Awal dan Pendidikan
Tukey dilahirkan di New Bedford, Massachusetts, pada 16 Jun 1915. Bapanya ialah seorang guru Bahasa Latin dan ibunya seorang tutor persendirian. Beliau kebanyakannya diajar di rumah oleh ibunya sendiri, dan hanya menghadiri kelas biasa untuk subjek tertentu seperti Bahasa Perancis.
Pendidikan tinggi beliau bermula di Universiti Brown, di mana beliau memperoleh Sarjana Muda Sastera (B.A.) pada tahun 1936 dan Sarjana Sains (M.S.) pada tahun 1937, kedua-duanya dalam bidang kimia. Selepas itu, beliau berpindah ke Universiti Princeton, di mana beliau memperoleh Doktor Falsafah (Ph.D.) dalam matematik pada tahun 1939. Disertasi kedoktorannya bertajuk "On denumerability in topology". Latar belakang pelbagai disiplin ilmu ini, merangkumi kimia, matematik, dan topologi, memberikan beliau perspektif unik yang kemudiannya akan mempengaruhi pendekatan inovatifnya terhadap analisis data.
1.2. Perang Dunia II dan Kerjaya Awal
Semasa Perang Dunia Kedua, Tukey bekerja di Pejabat Penyelidikan Kawalan Api, sebuah aktiviti penyelidikan kritikal. Dalam tempoh ini, beliau bekerjasama dengan Samuel S. Wilks dan William Gemmell Cochran, menyumbang kepada usaha negara yang penting. Beliau juga dikatakan telah membantu mereka bentuk pesawat pengintip U-2, menunjukkan penglibatannya dalam projek-projek sensitif dan strategik yang memerlukan kepakaran analitikal yang tinggi.
Selepas perang, Tukey kembali ke Princeton, membahagikan masanya antara universiti dan AT&T Bell Laboratories. Tempoh ini menandakan permulaan kerjaya profesionalnya yang mempamerkan pengaruhnya yang meluas merentasi akademik dan industri, yang kemudiannya membawa kepada banyak sumbangan penting dalam statistik dan sains komputer. Pada tahun 1962, Tukey telah dipilih sebagai ahli American Philosophical Society.
2. Kerjaya Profesional dan Afiliasi
Kerjaya John Wilder Tukey dicirikan oleh peranan dwi utamanya di Universiti Princeton dan Bell Labs, bersama dengan sumbangan perundingan yang meluas dan pengiktirafan penting melalui anugerah. Ini mencerminkan pengaruhnya yang mendalam dan luas merentasi akademik dan industri.
2.1. Universiti Princeton
Di Universiti Princeton, Tukey mencapai kemajuan yang ketara dalam kerjaya akademiknya. Beliau menjadi profesor penuh pada usia 35 tahun, yang membuktikan kecemerlangan dan pengaruh awalnya dalam bidang matematik dan statistik. Pada tahun 1965, beliau dilantik sebagai pengerusi pengasas jabatan statistik Princeton. Kepimpinan beliau memainkan peranan penting dalam membentuk pendidikan statistik dan penyelidikan di universiti tersebut, mewujudkan asas bagi generasi statistikawan dan saintis data yang akan datang.
2.2. Bell Labs (AT&T Bell Laboratories)
Sebagai seorang saintis di AT&T Bell Laboratories, Tukey menumpukan sebahagian besar masa penyelidikannya kepada pembangunan kaedah statistik untuk komputer. Kerja beliau di Bell Labs adalah asas kepada inovasi yang akan datang. Pada tahun 1947, beliau mencipta istilah bit, singkatan bagi "digit perduaan" (binary digit), yang menjadi unit asas maklumat dalam pengkomputeran. Selain itu, beliau dikreditkan dengan penerbitan pertama perkataan perisian (software), yang menunjukkan wawasannya tentang arah teknologi dan peranannya dalam membentuk bahasa era digital.
2.3. Peranan Perundingan dan Penasihat
Selain peranan akademiknya, Tukey terlibat secara meluas sebagai penasihat kepada pelbagai organisasi berprofil tinggi, mempengaruhi wacana awam dan pembangunan teknologi. Dari tahun 1960 hingga 1980, beliau membantu mereka bentuk tinjauan rangkaian televisyen NBC yang digunakan untuk meramalkan dan menganalisis pilihan raya. Kepakaran beliau juga dicari oleh Educational Testing Service (ETS), Xerox Corporation, dan Merck & Company, di mana beliau berkhidmat sebagai perunding. Semasa tahun 1970-an dan awal 1980-an, Tukey memainkan peranan penting dalam reka bentuk dan pelaksanaan National Assessment of Educational Progress, menunjukkan komitmennya terhadap piawaian pendidikan dan analisis data yang kukuh dalam bidang tersebut.
2.4. Anugerah dan Penghormatan
Atas sumbangannya yang luar biasa, John Wilder Tukey menerima pelbagai anugerah dan penghormatan berprestij sepanjang kerjayanya. Pada tahun 1973, beliau dianugerahkan Pingat Sains Negara (National Medal of Science) oleh Presiden Richard Nixon, pengiktirafan tertinggi di Amerika Syarikat untuk pencapaian saintifik. Beliau juga menerima Pingat Kehormatan IEEE (IEEE Medal of Honor) pada tahun 1982, yang diberikan "Untuk sumbangannya kepada analisis spektrum proses rawak dan algoritma transformasi Fourier cepat (FFT)." Anugerah-anugerah ini mencerminkan impak mendalamnya terhadap matematik, statistik, dan sains komputer.
3. Sumbangan Saintifik Utama
John Wilder Tukey membuat sumbangan yang signifikan dan inovatif dalam pelbagai bidang saintifik, terutamanya statistik, sains komputer, dan analisis data. Kerja beliau telah memajukan pemahaman saintifik dan aplikasi secara meluas.
3.1. Algoritma Fast Fourier Transform (FFT)
Salah satu sumbangan paling berpengaruh John Wilder Tukey ialah pembangunan bersama Algoritma Fast Fourier Transform (FFT) dengan James Cooley. Algoritma ini, yang diterbitkan pada tahun 1965, membolehkan pengiraan siri Fourier kompleks yang cekap, merevolusikan pemprosesan isyarat dan analisis data. Impak FFT adalah meluas, membolehkan kemajuan dalam pelbagai bidang seperti kejuruteraan, fizik, astronomi, dan sains komputer, dengan ketara mengurangkan masa pengiraan yang diperlukan untuk analisis spektrum.
3.2. Analisis Data Eksploratori (EDA) dan Teknik Statistik
John Wilder Tukey adalah seorang penyokong kuat bagi Analisis Data Eksploratori (EDA), satu falsafah dan set teknik yang menekankan penerokaan data untuk mendedahkan corak, anomali, dan hipotesis. Beliau mempopularkan EDA dalam bukunya "Exploratory Data Analysis" pada tahun 1977.
Beliau membangunkan atau mempopularkan pelbagai teknik statistik, termasuk:
- Plot kotak: Perwakilan grafik untuk memaparkan pengedaran data numerik melalui kuartilnya, yang diperkenalkan dalam bukunya pada tahun 1977.
- Kaedah jackknife (juga dikenali sebagai Quenouille-Tukey jackknife): Teknik pensampelan semula untuk menganggar bias dan ralat piawai bagi suatu anggaran.
- Ujian julat Tukey: Ujian perbandingan berbilang untuk mencari kumpulan min yang berbeza secara signifikan antara satu sama lain.
- Taburan lambda Tukey: Keluarga taburan kebarangkalian yang fleksibel.
- Ujian ketambahan Tukey: Ujian statistik untuk menilai interaksi dalam model linear.
- Lemma Tukey: Sebuah lemma dalam teori set yang berguna dalam analisis fungsian dan topologi.
- Tetingkap Tukey: Sebuah fungsi tetingkap yang digunakan dalam analisis spektrum.
- Trimean: Ukuran lokasi tengah yang teguh.
- Garis median-median: Alternatif yang lebih mudah kepada regresi linear.
Pada tahun 1974, bersama dengan Jerome H. Friedman, beliau membangunkan konsep projection pursuit, satu teknik untuk mencari pandangan yang menarik dalam data berbilang variat berdimensi tinggi. Pendekatan-pendekatan ini menekankan kepentingan EDA untuk mendedahkan corak tersembunyi dan mempromosikan analisis data yang teguh, walaupun data tersebut tidak memenuhi andaian model statistik tradisional.
3.3. Asas Sains Data
John Tukey dianggap secara meluas sebagai bapa sains data moden, setelah mempelopori banyak asas utama bidang tersebut. Beliau mencabar dominasi "analisis data pengesahan" pada masa itu, iaitu analisis statistik yang didorong oleh konfigurasi matematik yang tegar, dan sebaliknya menekankan kepentingan memiliki sikap yang lebih fleksibel terhadap analisis data. Beliau mengadvokasi penerokaan data yang teliti, apa yang disebutnya sebagai Analisis Data Eksploratori (EDA), untuk melihat struktur dan maklumat apa yang mungkin terkandung di dalamnya. Dalam banyak aspek, EDA adalah pelopor kepada sains data.
Tukey juga menyedari kepentingan sains komputer kepada EDA. Grafik adalah bahagian penting dalam metodologi EDA, dan walaupun kebanyakan kerja Tukey tertumpu pada paparan statik (seperti plot kotak) yang boleh dilukis dengan tangan, beliau menyedari bahawa grafik komputer akan jauh lebih berkesan untuk mengkaji data berbilang variat. PRIM-9, program pertama untuk melihat data berbilang variat secara interaktif, telah diilhamkan oleh beliau pada awal tahun 1970-an. Penggabungan analisis data dan sains komputer inilah yang kini dikenali sebagai sains data.
Tukey menyatakan perbezaan penting antara Analisis Data Eksploratori dan Analisis Data Pengesahan, dengan kepercayaan bahawa kebanyakan metodologi statistik terlalu menekankan yang terakhir. Walaupun beliau percaya akan kegunaan memisahkan kedua-dua jenis analisis ini, beliau menunjukkan bahawa kadang-kadang, terutamanya dalam sains semula jadi, ini adalah bermasalah dan menamakan situasi tersebut sebagai "sains yang tidak selesa" (uncomfortable scienceBahasa Inggeris).
A. D. Gordon meringkaskan prinsip-prinsip Tukey untuk amalan statistik seperti berikut:
- Kegunaan dan batasan statistik matematik.
- Kepentingan memiliki kaedah analisis statistik yang teguh terhadap pelanggaran andaian yang mendasari penggunaannya.
- Keperluan untuk mengumpul pengalaman tentang tingkah laku kaedah analisis tertentu untuk memberikan panduan penggunaannya.
- Kepentingan membenarkan kemungkinan data mempengaruhi pilihan kaedah yang digunakan untuk menganalisisnya.
- Keperluan bagi ahli statistik untuk menolak peranan "penjaga kebenaran yang terbukti," dan untuk menentang percubaan untuk menyediakan penyelesaian sekali-dan-untuk-selamanya serta penyatuan subjek yang terlalu rapi.
- Sifat analisis data yang berulang.
- Implikasi kuasa, ketersediaan, dan murahnya kemudahan pengkomputeran yang semakin meningkat.
- Latihan ahli statistik.
Ceramah Tukey digambarkan sebagai luar biasa. Peter McCullagh menggambarkan ceramahnya yang diberikan di London pada tahun 1977:
"Tukey berjalan perlahan ke podium, seorang lelaki seperti beruang besar yang berpakaian seluar longgar dan kemeja rajutan hitam. Ini mungkin dulunya sepasang yang padan tetapi usia pakaiannya menjadikan sukar untuk membezakannya... Dengan teliti dan sengaja, senarai tajuk ditulis di papan hitam. Kata-kata juga datang, tidak banyak, seperti bungkusan yang berat, dihantar dengan perlahan tanpa goyah... Setelah selesai, Tukey berpaling menghadap penonton dan podium... "Komen, pertanyaan, cadangan?" beliau bertanya kepada penonton... Sambil menunggu respons, beliau memanjat ke podium dan mengatur diri sehingga beliau duduk bersila menghadap penonton... Kami di kalangan penonton duduk seperti penonton di zoo menunggu beruang besar itu bergerak atau berkata sesuatu. Tetapi beruang besar itu kelihatan melakukan perkara yang sama, dan perasaan itu tidak selesa."
4. Penciptaan Istilah Utama
John Wilder Tukey dikenali bukan sahaja kerana sumbangan saintifiknya, tetapi juga kerana penciptaannya terhadap istilah saintifik dan teknologi yang berpengaruh yang telah membentuk teknologi maklumat moden secara mendalam.
Beliau mencipta perkataan bit sebagai singkatan bagi "digit perduaan" (binary digitBahasa Inggeris). Beliau memperkenalkan istilah ini semasa bekerja dengan John von Neumann dalam reka bentuk komputer awal. Istilah "bit" pertama kali digunakan dalam artikel "A Mathematical Theory of Communication" oleh Claude Shannon pada tahun 1948, yang menunjukkan penerimaan pantas dan kepentingan istilah yang dicipta oleh Tukey.
Walaupun Paul Niquette mendakwa telah mencipta istilah perisian (softwareBahasa Inggeris) pada tahun 1953, penggunaan perkataan tersebut yang pertama kali diterbitkan terdapat dalam kertas kerja Tukey pada tahun 1958 yang diterbitkan dalam jurnal American Mathematical Monthly. Penggunaan istilah oleh Tukey telah memainkan peranan penting dalam penyebarannya yang meluas dan menjadikannya sebahagian daripada leksikon pengkomputeran moden.
5. Falsafah dan Pendekatan terhadap Analisis Data
Falsafah John Wilder Tukey mengenai analisis data sangat menekankan kepentingan Analisis Data Eksploratori (EDA) sebagai pelengkap, dan kadang-kadang sebagai alternatif yang lebih penting, kepada Analisis Data Pengesahan (CDA). Beliau percaya bahawa kebanyakan metodologi statistik terlalu memberi tumpuan kepada CDA, yang melibatkan pengujian hipotesis yang telah ditetapkan dengan konfigurasi matematik yang tegar.
Sebaliknya, Tukey menganjurkan pendekatan yang lebih fleksibel, menggalakkan para saintis dan statistikawan untuk "meneroka" data secara teliti bagi mendedahkan struktur, corak, dan maklumat tersembunyi tanpa andaian awal yang ketat. Bagi beliau, EDA adalah langkah penting untuk memahami data, membina hipotesis baharu, dan mengenal pasti anomali. Beliau berpendapat bahawa EDA adalah proses berulang yang melibatkan gabungan visualisasi, ringkasan, dan teknik yang teguh untuk mendapatkan pandangan yang bermakna.
Tukey juga memperkenalkan konsep "sains yang tidak selesa" (uncomfortable scienceBahasa Inggeris) untuk menggambarkan situasi di mana pemisahan yang jelas antara analisis data eksploratori dan pengesahan menjadi sukar, terutamanya dalam sains semula jadi. Beliau mengakui bahawa dalam situasi dunia nyata yang kompleks, batasan antara penerokaan dan pengesahan boleh kabur, dan para penyelidik perlu berasa selesa dengan ketidakpastian ini.
6. Kehidupan Peribadi
Maklumat terperinci mengenai kehidupan peribadi John Wilder Tukey adalah terhad dalam sumber yang ada. Beliau dilahirkan di New Bedford, Massachusetts, dan merupakan anak kepada seorang bapa yang berprofesi sebagai guru Bahasa Latin dan seorang ibu yang bekerja sebagai tutor persendirian. Sebahagian besar pendidikan awal beliau telah dijalankan di rumah oleh ibunya, dengan hanya kelas tertentu seperti Bahasa Perancis yang dihadiri di sekolah biasa. Sumbangan profesional dan ilmiah beliau menjadi tumpuan utama catatan biografi yang ada.
7. Kematian
John Wilder Tukey bersara pada tahun 1985 setelah kerjaya yang cemerlang. Beliau meninggal dunia di New Brunswick, New Jersey, pada 26 Julai 2000, pada usia 85 tahun. Pemergiannya menandakan berakhirnya era seorang perintis yang telah membuat sumbangan kekal kepada matematik, statistik, dan sains komputer.
8. Warisan dan Penilaian
Warisan John Wilder Tukey sangat mendalam, melangkaui pelbagai disiplin ilmu dan membentuk cara kita menganalisis dan memahami data. Penilaian terhadap pencapaiannya secara keseluruhannya adalah positif, walaupun terdapat beberapa kritikan mengenai penglibatannya dalam isu-isu sosial tertentu.
8.1. Penilaian Positif dan Pencapaian
Sumbangan John Wilder Tukey terhadap statistik dan sains komputer adalah sangat besar dan meluas. Beliau secara meluas diiktiraf sebagai "bapa sains data", satu pengiktirafan yang timbul daripada sumbangan perintisnya dalam bidang analisis data dan penekanannya terhadap kepentingan visualisasi data.
Pencapaian utamanya termasuk:
- Pembangunan bersama Algoritma Fast Fourier Transform (FFT), yang merevolusikan pemprosesan isyarat dan analisis data di pelbagai bidang.
- Penciptaan dan pempopularan Analisis Data Eksploratori (EDA), bersama dengan teknik-teknik seperti plot kotak, yang menyediakan cara intuitif untuk memahami dan meneroka data.
- Penciptaan istilah-istilah asas seperti bit dan penggunaan perisian yang pertama kali diterbitkan, yang penting untuk evolusi teknologi maklumat.
- Pembangunan pelbagai kaedah statistik teguh lain seperti kaedah jackknife, ujian julat Tukey, dan garis median-median.
Kerjanya telah mengubah cara saintis, juruteranya, dan penyelidik berinteraksi dengan data, membolehkan pemahaman yang lebih mendalam dan keputusan yang lebih bermakna. Beliau telah menggerakkan statistik daripada semata-mata pengesahan kepada penerokaan, memupuk pendekatan yang lebih fleksibel dan praktikal untuk menyelesaikan masalah dunia nyata.
8.2. Kritikan dan Kontroversi
Salah satu titik perdebatan yang berkaitan dengan kerja John Wilder Tukey melibatkan penglibatannya dalam jawatankuasa American Statistical Association yang menghasilkan laporan mengkritik metodologi statistik Laporan Kinsey mengenai tingkah laku seksual manusia. Laporan tersebut, bertajuk Statistical Problems of the Kinsey Report on Sexual Behavior in the Human Male, menyatakan secara kritikal: "Pemilihan rawak tiga orang akan lebih baik daripada kumpulan 300 orang yang dipilih oleh Encik Kinsey."
Kritikan ini bukan ditujukan kepada isi atau kesimpulan Laporan Kinsey secara substantif, tetapi secara khusus menyoroti kelemahan metodologi dalam pengumpulan data dan analisis statistik. Peranan Tukey dalam kritik ini menyoroti komitmennya terhadap kekukuhan statistik dan kepentingan data yang tidak berat sebelah, walaupun dalam bidang sensitif seperti penyelidikan seksual. Ia menggambarkan bahawa kepakaran statistik, walaupun bertujuan untuk objektiviti, boleh mempunyai implikasi sosial yang ketara dan tertakluk kepada penelitian.
8.3. Pengaruh terhadap Generasi Mendatang
Pengaruh John Wilder Tukey terhadap generasi saintis, bidang akademik, dan masyarakat berikutnya adalah berkekalan dan konkrit. Konsep Analisis Data Eksploratori (EDA) beliau telah menjadi asas dalam kurikulum statistik dan sains data, membentuk cara profesional data mendekati data mentah.
Kerja perintisnya dalam menggabungkan statistik dengan sains komputer meletakkan asas bagi perkembangan bidang sains data sebagai disiplin tersendiri. Hari ini, prinsip-prinsip Tukey mengenai visualisasi, keteguhan, dan pemikiran fleksibel adalah penting untuk amalan analisis data moden dalam kecerdasan buatan, pembelajaran mesin, dan analitik data besar. Istilah-istilah seperti "bit" dan "perisian" yang dicipta oleh beliau telah menjadi sebahagian yang tidak terpisahkan daripada leksikon teknologi global. Melalui kerja-kerja dan falsafahnya, Tukey terus memberi inspirasi kepada penyelidik untuk meneroka data dengan pemikiran terbuka, menggalakkan penemuan yang didorong oleh data yang memberi manfaat kepada pelbagai sektor masyarakat.
9. Penerbitan
Berikut adalah senarai buku dan kertas kerja utama yang ditulis atau disunting bersama oleh John Wilder Tukey, yang mencerminkan keluasan sumbangan ilmiahnya:
- Andrews, David F.; Bickel, Peter J.; Hampel, Frank R.; Huber, Peter J.; Rogers, W. H.; Tukey, John Wilder (1972). Robust estimates of location: survey and advances. Princeton University Press.
- Basford, Kaye E.; Tukey, John Wilder (1998). Graphical Analysis of Multiresponse Data. Chapman & Hall/CRC Press.
- Blackman, R. B.; Tukey, John Wilder (1959). The measurement of power spectra from the point of view of communications engineering. Dover Publications.
- Cochran, William Gemmell; Mosteller, Charles Frederick; Tukey, John Wilder (1953). Statistical problems of the Kinsey report on sexual behavior in the human male. Journal of the American Statistical Association.
- Cooley, James W.; Tukey, John W. (1965). An algorithm for the machine calculation of complex Fourier series. Math. Comput.
- Hoaglin, David C.; Mosteller, Charles Frederick; Tukey, John Wilder (eds.) (1983). Understanding Robust and Exploratory Data Analysis. Wiley.
- Hoaglin, David C.; Mosteller, Charles Frederick; Tukey, John Wilder (eds.) (1985). Exploring Data Tables, Trends and Shapes. Wiley.
- Hoaglin, David C.; Mosteller, Charles Frederick; Tukey, John Wilder (eds.) (1991). Fundamentals of exploratory analysis of variance. Wiley.
- Morgenthaler, Stephan; Tukey, John Wilder (eds.) (1991). Configural polysampling: a route to practical robustness. Wiley.
- Mosteller, Charles Frederick; Tukey, John Wilder (1977). Data analysis and regression: a second course in statistics. Addison-Wesley.
- Tukey, John Wilder (1940). Convergence and Uniformity in Topology. Princeton University Press.
- Tukey, John Wilder (1977). Exploratory Data Analysis. Addison-Wesley.
- Tukey, John Wilder; Ross, Ian C.; Bertrand, Verna (1973). Index to statistics and probability. R & D Press.
Koleksi The collected works of John W Tukey, disunting oleh William S. Cleveland, termasuk:
- Brillinger, David R. (ed.) (1984). Volume I: Time series, 1949-1964. Wadsworth, Inc.
- Brillinger, David R. (ed.) (1985). Volume II: Time series, 1965-1984. Wadsworth, Inc.
- Jones, Lyle V. (ed.) (1985). Volume III: Philosophy and principles of data analysis, 1949-1964. Wadsworth & Brooks/Cole.
- Jones, Lyle V. (ed.) (1986). Volume IV: Philosophy and principles of data analysis, 1965-1986. Wadsworth & Brooks/Cole.
- Cleveland, William S. (ed.) (1988). Volume V: Graphics, 1965-1985. Wadsworth & Brooks/Cole.
- Mallows, Colin L. (ed.) (1990). Volume VI: More mathematical, 1938-1984. Wadsworth & Brooks/Cole.
- Cox, David R. (ed.) (1992). Volume VII: Factorial and ANOVA, 1949-1962. Wadsworth & Brooks/Cole.
- Braun, Henry I. (ed.) (1994). Volume VIII: Multiple comparisons, 1949-1983. Chapman & Hall/CRC Press.
10. Lihat Juga
- Senarai perintis dalam sains komputer