Teknologi

Martin Hairer Tantang ChatGPT-5.2 dan Gemini 3.0: AI Masih Bertele-tele dan Tidak Relevan

Martin Hairer, peraih Fields Medal 2014, bersama tim matematikawan terkemuka dari institusi seperti Harvard, Stanford, dan MathSci.ai, telah melakukan serangkaian pengujian untuk mengevaluasi kemampuan kecerdasan buatan (AI) dalam menyelesaikan masalah matematika yang kompleks. Eksperimen yang dinamakan “First Proof” ini bertujuan untuk mengeksplorasi apakah AI benar-benar mampu menghasilkan pemikiran yang orisinal atau sekadar mengolah informasi yang telah ada sebelumnya.

Eksperimen ini berawal dari keprihatinan seorang siswa SMA yang mengirim email kepada Hairer, menanyakan tentang masa depan dunia matematika di tengah kemajuan cepat teknologi AI. Menanggapi kekhawatiran tersebut, Hairer menegaskan bahwa bidang matematika masih aman dari ancaman otomatisasi total oleh mesin.

Kegagalan AI dalam Menghasilkan Ide Orisinal

Dalam penelitian ini, tim peneliti menguji model AI terbaru, termasuk ChatGPT-5.2 Pro dan Google Gemini 3.0 Deep Think. Mereka menyajikan soal-soal penelitian yang belum pernah dipublikasikan untuk memastikan bahwa AI tidak dapat mengandalkan jawaban dari data yang tersedia di internet.

Hairer menjelaskan bahwa meskipun Large Language Model (LLM) menunjukkan kemampuan yang baik dalam menyelesaikan soal-soal standar, mereka mengalami kegagalan ketika dihadapkan pada konsep-konsep baru. “Saya belum melihat contoh yang masuk akal di mana LLM menghasilkan ide atau konsep baru yang benar-benar orisinal,” ujar Hairer.

Kualitas Jawaban yang Bertele-tele dan Tidak Akurat

Temuan dari eksperimen ini mengungkapkan bahwa jawaban yang dihasilkan oleh AI sering kali tidak akurat atau tidak relevan. Hairer membandingkan kualitas argumen AI dengan mahasiswa sarjana yang kurang kompeten, yang cenderung memberikan detail berlebihan pada aspek yang mudah tetapi sangat minim pada inti argumen yang kompleks.

AI sering kali melakukan “hand-waving”, memberikan argumen yang kabur di tengah proses pembuktian dengan harapan pembaca tidak menyadarinya. Hal ini menunjukkan bahwa meskipun AI mengetahui titik awal dan tujuan akhir suatu masalah, mesin tersebut tidak memiliki pemahaman yang mendalam tentang proses logis yang diperlukan untuk mencapai solusi.

Fenomena Infinite Loop dan Kelemahan Fundamental

Lauren Williams, seorang profesor matematika dari Harvard, mengidentifikasi fenomena menarik di mana AI sering terjebak dalam lingkaran setan atau infinite loop. Ketika diuji dengan masalah riset yang nyata, AI akan memberikan jawaban dan kemudian terus mengoreksi dirinya sendiri tanpa pernah sampai pada solusi akhir yang benar.

Ada beberapa alasan teknis yang menjelaskan mengapa AI belum dapat menggantikan peran matematikawan profesional, antara lain:

Kelemahan Visual

AI memiliki keterbatasan dalam penalaran visual, yang membuatnya gagal pada soal-soal yang membutuhkan imajinasi ruang.

Daya Ingat Pendek

Kualitas jawaban AI cenderung menurun drastis ketika pembuktian memerlukan penjelasan yang lebih panjang dari lima halaman.

Sifat Yes Man

AI cenderung mengikuti sudut pandang pengguna dan tidak mampu terlibat dalam debat untuk menguji sebuah ide.

Dampak Terhadap Kemajuan Sains

Tamara Kolda dari MathSci.ai memperingatkan bahwa ketergantungan pada AI berpotensi memperlambat kemajuan ilmiah di masa depan. Ia menekankan bahwa kemajuan dalam ilmu pengetahuan memerlukan perdebatan ide dan perspektif baru yang menantang, yang tidak dapat dilakukan oleh AI yang hanya mengulangi instruksi.

Insight Praktis

2. **Pentingnya Perdebatan**: Kemajuan ilmiah tidak hanya bergantung pada data, tetapi juga pada dialog yang aktif dan kritis antar ilmuwan.
3. **Keseimbangan dalam Penggunaan Teknologi**: Mengintegrasikan AI dengan bijak dalam praktik matematika dan penelitian dapat memberikan manfaat, tetapi harus disertai dengan pemahaman akan batasannya.

Kesimpulan

Eksperimen yang dilakukan oleh Martin Hairer dan timnya menunjukkan bahwa meskipun AI seperti ChatGPT-5.2 dan Gemini 3.0 memiliki kemampuan dalam menyelesaikan masalah standar, mereka belum dapat menghasilkan ide-ide orisinal atau terlibat dalam proses pemikiran yang kompleks. Temuan ini menegaskan pentingnya peran manusia dalam bidang matematika dan sains, serta perlunya perdebatan dan inovasi yang tidak dapat sepenuhnya digantikan oleh mesin. Hasil penelitian ini, yang dilaporkan oleh The New York Times dan tim peneliti, memperingatkan kita akan potensi risiko ketergantungan pada AI dalam kemajuan sains di masa depan.

Related Articles

Back to top button