Mata Terbuka Lebar: Bagaimana Kerangka Autoresearch Karpathy Dapat Mendemokratisasi Penelitian Glaucoma

Pendahuluan

Glaucoma adalah neuropati optik kronis yang secara progresif merusak sel ganglion retina (RGC) dan menyebabkan kehilangan penglihatan yang tidak dapat dipulihkan. Ini mempengaruhi jutaan orang di seluruh dunia – diperkirakan 64,3 juta orang pada tahun 2013, diproyeksikan meningkat di atas 110 juta pada tahun 2040 (physionet.org). Yang mengkhawatirkan, sekitar setengah dari semua kasus tetap tidak terdiagnosis hingga kehilangan penglihatan sudah dimulai (physionet.org). Perawatan glaucoma tradisional berfokus pada penurunan tekanan intraokular (TIO) melalui obat-obatan atau operasi, tetapi perawatan ini tidak dapat membalikkan kerusakan atau sepenuhnya mencegah kebutaan (pmc.ncbi.nlm.nih.gov) (physionet.org). Akibatnya, ada kebutuhan mendesak untuk penemuan baru di bidang-bidang seperti neuroproteksi, regenerasi RGC/saraf optik, dan terapi gen dan sel inovatif. Namun, penelitian akademis dan farmasi di bidang-bidang ini masih kekurangan sumber daya, sebagian karena merupakan upaya jangka panjang dan berisiko tinggi. Sementara itu, kemajuan dalam pembelajaran mesin (ML) dan kecerdasan buatan (AI) memberdayakan pendekatan baru untuk analisis data dan desain generatif.

Karya terbaru (misalnya, proyek “autoresearch” Andrej Karpathy (www.theneuron.ai) (medium.com)) menunjukkan bahwa agen AI dapat secara otonom menjalankan ratusan eksperimen kecil pada satu GPU hanya berdasarkan instruksi tingkat tinggi yang sederhana. Dalam paradigma ini, manusia menulis program.md singkat yang menjelaskan tujuan penelitian, dan agen AI secara iteratif menyesuaikan model atau hyperparameter, menjalankan pelatihan selama 5 menit, mempertahankan perubahan yang berhasil, dan membuang yang lain (medium.com) (www.theneuron.ai). Semalaman, putaran ini dapat melakukan sekitar 100 eksperimen, menjelajahi arsitektur dan ruang parameter tanpa pengkodean manual.

Artikel ini mengeksplorasi bagaimana kerangka autoresearch Karpathy dapat diterapkan pada penelitian glaucoma oleh pasien, pengasuh, ilmuwan warga, dan pengembang open-source yang termotivasi. Kami akan mensurvei area penelitian glaucoma yang kurang dieksplorasi (neuroproteksi, regenerasi, dll.) dan mengidentifikasi tugas pembelajaran mesin di setiap domain di mana eksperimen model kecil secara masuk akal dapat membantu. Untuk setiap tugas, kami menyarankan dataset publik spesifik, model/arsitektur dasar, metrik evaluasi, dan menguraikan seperti apa instruksi program.md agen tersebut. Kami kemudian membahas langkah-langkah praktis bagi komunitas untuk menyiapkan dan berbagi eksperimen semacam itu, termasuk pertimbangan perangkat keras, persiapan data, dan platform kolaborasi. Kami meneliti konteks spesifik terapi pemulihan penglihatan dan apakah putaran bergaya autoresearch dapat mempercepat optimasi prostesis saraf atau intervensi lainnya. Akhirnya, kami membahas bagaimana hipotesis yang dihasilkan warga dapat divalidasi dan disampaikan kepada dokter, serta menyusun peta jalan 90 hari yang konkret untuk meluncurkan inisiatif autoresearch yang dipimpin pasien – termasuk cara menghindari jebakan “teater penelitian” dan memastikan dampak nyata. Sepanjang artikel ini, kami mengutip sumber-sumber terkini tentang penelitian glaucoma dan AI dalam penglihatan, bertujuan untuk panduan yang seimbang, realistis, dan mudah diakses.

1. Lanskap Penelitian Glaucoma & Kebutuhan yang Belum Terpenuhi

Penelitian glaucoma mencakup berbagai bidang – mulai dari memahami mekanisme penyakit hingga mengembangkan terapi baru untuk neuroproteksi dan pemulihan penglihatan. Banyak area menjanjikan yang kekurangan sumber daya:

Neuroproteksi: Intervensi yang melindungi RGC agar tidak mati (independen dari TIO). Contohnya termasuk faktor neurotropik dan dukungan metabolisme. Misalnya, implan yang melepaskan faktor neurotropik siliaris (CNTF) telah menunjukkan potensi dalam uji coba awal (pmc.ncbi.nlm.nih.gov), dan molekul lain seperti faktor pertumbuhan saraf dan citicoline sedang diselidiki (pmc.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Namun, ini belum menjadi perawatan standar, dan lebih banyak pekerjaan diperlukan untuk menerjemahkannya ke pasien. Sebuah tinjauan tahun 2025 memperingatkan bahwa terapi glaucoma neuroprotektif adalah “perawatan masa depan” yang membutuhkan uji coba lebih lanjut (pmc.ncbi.nlm.nih.gov), yang mencerminkan kebutuhan yang belum terpenuhi.
Regenerasi RGC & Regenerasi Saraf Optik: Setelah RGC dan aksonnya mati, obat-obatan saat ini tidak memiliki cara untuk membalikkan kondisi tersebut. Beberapa penelitian pada hewan menggunakan terapi gen untuk memprogram ulang RGC atau merangsang pertumbuhan kembali. Misalnya, represi berbasis CRISPR dari PTEN (regulator pertumbuhan negatif) telah mendorong pertumbuhan kembali akson pada sel saraf tikus (pmc.ncbi.nlm.nih.gov), dan eksperimen co-deletion PTEN dan SOCS3 mendorong regenerasi saraf optik yang berkelanjutan pada tikus (pmc.ncbi.nlm.nih.gov). Namun, terobosan ini masih dalam model laboratorium. Biologi yang mendasari – misalnya, bagaimana merekapitulasi perkembangan retina atau melewati penghambat pertumbuhan – sangat kompleks. Ada permintaan besar untuk modalitas (molekul kecil, gen, biomaterial) yang dapat merangsang kelangsungan hidup RGC atau pertumbuhan kembali akson, tetapi kemajuan menuju uji coba pada manusia lambat.
Terapi Gen dan Sel: Teknologi baru seperti CRISPR, vektor virus, dan RGC yang berasal dari sel induk menjanjikan untuk glaucoma. Strateginya meliputi penyuntingan gen untuk mengurangi TIO (misalnya menargetkan produksi humor aqueous) atau memodulasi jalur neurodegeneratif (pubmed.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Sel induk secara (teoritis) dapat menggantikan sel trabecular meshwork atau RGC yang hilang dan mengeluarkan faktor pelindung (pubmed.ncbi.nlm.nih.gov). Pekerjaan awal telah menunjukkan bahwa faktor transkripsi tertentu (misalnya Oct4-Sox2-Klf4) dapat memprogram ulang non-RGC menjadi neuron mirip RGC pada tikus (memulihkan penglihatan pada cedera saraf optik) (pmc.ncbi.nlm.nih.gov). Namun, pendekatan ini menghadapi tantangan keamanan dan pengiriman sebelum mencapai pasien. Beberapa tinjauan baru-baru ini menyoroti terapi gen sebagai batas yang menarik tetapi belum klinis untuk glaucoma (pubmed.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Singkatnya, inovasi molekuler dan seluler sedang berkembang, tetapi sumber daya dan data uji coba terbatas – menciptakan peluang untuk eksplorasi komputasi (misalnya, merancang konstruksi virus yang optimal atau memprediksi penyuntingan gen yang efektif).
Stimulasi Listrik dan Optogenetik untuk Pemulihan Penglihatan: Untuk pasien dengan glaucoma lanjut (atau penyakit gabungan seperti retinitis pigmentosa), prostesis penglihatan buatan atau terapi optogenetik bertujuan untuk melewati RGC yang rusak. Implan retina (susunan elektroda epiretinal atau subretinal) dan implan kortikal telah menghasilkan persepsi buatan (“fosphenes”), tetapi resolusinya rendah dan hasilnya sangat bervariasi. Sebuah tinjauan terbaru tahun 2025 tentang AI dalam prostesis visual mencatat bahwa “algoritma AI menunjukkan harapan dalam mengoptimalkan penglihatan prostetik, terutama melalui peningkatan ekstraksi saliency gambar dan strategi stimulasi,” meskipun sejauh ini sebagian besar penelitian adalah simulasi (pmc.ncbi.nlm.nih.gov). Dengan kata lain, pembelajaran mesin dapat membantu mengubah gambar kamera menjadi pola stimulasi yang paling informatif mengingat batasan perangkat. Optogenetik (membuat sel retina yang bertahan hidup peka cahaya) dan pulsa stimulasi listrik transkorneal (TES) juga sedang diuji coba untuk kehilangan penglihatan terkait glaucoma. Semua area ini membutuhkan penyetelan parameter yang ekstensif (misalnya pola stimulasi spasial-temporal, vektor ekspresi gen) — tugas yang berpotensi cocok untuk pencarian ML otonom.
Mekanisme Independen TIO: Banyak orang terus kehilangan penglihatan meskipun TIO terkontrol dengan baik. Faktor-faktor seperti gangguan aliran darah okular, disfungsi neurovaskular, atau stres metabolik pada kepala saraf optik dikenal tetapi belum sepenuhnya dipahami. Studi genetik menunjukkan komponen risiko glaucoma “independen TIO” yang signifikan (pubmed.ncbi.nlm.nih.gov) (pubmed.ncbi.nlm.nih.gov). Biomarker dari proses-proses ini (selain tekanan) sangat dibutuhkan. Juga, separuh pasien glaucoma memiliki penyakit “tekanan normal,” menyoroti bahwa TIO tinggi bukan satu-satunya penyebab. Penelitian tentang faktor vaskular atau jalur kerusakan lainnya sedang berlangsung tetapi terfragmentasi. Pemodelan komputasi atau penambangan dataset besar (misalnya studi asosiasi genom-luas) dapat membantu mengidentifikasi mekanisme baru atau target terapeutik di domain ini.
Penemuan Biomarker melalui Pencitraan dan Bidang: Deteksi dini dan pemantauan glaucoma seringkali bergantung pada pencitraan (foto fundus, OCT) dan tes fungsional (bidang penglihatan). Algoritma canggih dapat mengungkap biomarker halus yang tidak terlihat oleh dokter manusia. Misalnya, deep learning telah mulai mendeteksi kehilangan bidang penglihatan pra-perimetrik (perubahan yang tidak terlihat oleh analisis bidang standar) (pmc.ncbi.nlm.nih.gov). Demikian pula, AI telah digunakan untuk menganalisis profil ketebalan lapisan OCT untuk memprediksi glaucoma sebelum kerusakan yang jelas. Namun, belum ada biomarker AI yang diterima secara luas yang digunakan secara klinis untuk screening atau stratifikasi risiko. Hambatan komputasi di sini termasuk kebutuhan akan dataset besar yang diberi label dengan baik dan protokol validasi yang kuat (pmc.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Tantangan publik (REFUGE, AIROGS, dll.) telah mulai menstandardisasi data, tetapi cakupan penyakit tahap awal masih tipis (pmc.ncbi.nlm.nih.gov). Penemuan biomarker multi-modal yang lebih lanjut berbasis mesin (menggabungkan OCT, bidang, genetika, dll.) tetap menjadi batas yang terbuka.

Di mana ML model kecil dapat membantu? Banyak dari yang di atas menjelaskan masalah tingkat tinggi. Hambatannya seringkali adalah kelangkaan data, banyak variabel yang berinteraksi, dan biologi yang bergerak lambat. Di sinilah agen autoresearch bersinar: dalam mengotomatiskan eksperimen skala kecil pada data yang tersedia. Misalnya, jika ada dataset OCT yang sederhana dengan dan tanpa glaucoma awal, seorang ilmuwan warga dapat menyiapkan putaran pengujian model cepat untuk menemukan arsitektur mana yang paling baik membedakannya. Demikian pula, transformator kecil pada genomik atau literatur dapat menyarankan kandidat gen atau obat baru. Kuncinya adalah berfokus pada tugas-tugas sempit dengan metrik yang terdefinisi (akurasi klasifikasi, AUC, loss) dan berulang dengan cepat. Area dengan data publik terbatas (misalnya parameter TES atau koktail gen baru) mungkin mengandalkan data sintetik atau proksi. Pada bagian selanjutnya, kami memetakan tugas ML spesifik dalam glaucoma ke pendekatan autoresearch.

2. Memetakan Autoresearch ke Masalah Glaucoma

Kerangka autoresearch Karpathy bersifat agnostik domain: dapat menjalankan eksperimen dalam tugas ML apa pun yang disediakan oleh prepare.py dan train.py dengan metrik evaluasi yang terdefinisi dengan baik. Kami mengidentifikasi beberapa tugas konkret terkait glaucoma dan menentukan bagaimana seorang agen dapat menangani masing-masing. Setiap kasus penggunaan di bawah ini meliputi: dataset yang tersedia secara publik (jika mungkin), model atau arsitektur awal, metrik evaluasi, dan sketsa instruksi program.md.

2.1 Analisis Gambar OCT (Deteksi Struktural dan Segmentasi)

Tugas: Deteksi Glaucoma Dini dari Pemindaian OCT. Pencitraan OCT memberikan gambaran penampang lapisan retina. Penipisan lapisan serat saraf retina (RNFL) dan kompleks sel ganglion (GCC) dapat mendahului kehilangan bidang penglihatan. Kita dapat memperlakukan ini sebagai tugas klasifikasi (glaucoma vs sehat) atau regresi (misalnya ketebalan RNFL output).
- Dataset: Rilis terbaru, SYN-OCT (www.nature.com), adalah dataset sintetik berisi 200.000 gambar OCT sirkumpapiler (100k glaucoma, 100k normal) yang dihasilkan oleh GAN. Setiap gambar memiliki ketebalan RNFL dan mask segmentasi terkait. Ini tersedia secara publik di Zenodo (www.nature.com). (Meskipun sintetik, mereka divalidasi secara statistik untuk meniru OCT asli (www.nature.com).) Alternatifnya, seseorang dapat menggunakan dataset OCT-DL (www.nature.com) (2064 gambar berbagai penyakit retina) atau koleksi OCT klinis yang lebih kecil.
- Model: Mulailah dengan jaringan saraf konvolusional (CNN) kecil. Untuk klasifikasi, model dengan ~ 3–5 lapisan konvolusional (misalnya analog dengan ResNet-18 yang terpotong, atau CNN kecil kustom) dapat berfungsi. Untuk segmentasi RNFL/GCC, encoder-decoder seperti U-Net kecil (dengan kedalaman 3–4) cocok. train.py awal dapat mengimplementasikan CNN sederhana dan training loop, dengan hyperparameter default.
- Metrik: Jika melakukan klasifikasi glaucoma pada OCT, gunakan AUC (Area Under ROC) atau akurasi pada validation split. Untuk segmentasi, gunakan koefisien Dice atau IoU pada mask lapisan RNFL (SYN-OCT menyediakan mask (www.nature.com)).
- Contoh program.md:
  
  "Tujuan: Memaksimalkan validasi AUC untuk mendeteksi glaucoma dari gambar OCT. Modifikasi yang diizinkan: jumlah lapisan konvolusional, jumlah filter, ukuran kernel, fungsi aktivasi, learning rate, pilihan optimizer, batch size, dll. Setelah setiap training run 5 menit, evaluasi AUC pada set held-out. Jika AUC membaik, pertahankan perubahan; jika tidak, kembalikan." (medium.com) (www.theneuron.ai).
  Agen akan mencoba variasi (misalnya menambahkan lapisan, menyesuaikan lebar, beralih dari Adam ke RMSProp) untuk meningkatkan AUC.
Tugas: Segmentasi Lapisan RNFL/GCC. Mengukur ketebalan RNFL secara tepat sangat penting. Menggunakan pemindaian OCT sintetik (dengan segmentasi yang disediakan) atau OCT nyata apa pun dengan lapisan beranotasi, ini dapat dibingkai sebagai tugas segmentasi.
- Dataset: SYN-OCT sekali lagi menyediakan mask segmentasi RNFL (www.nature.com). Sumber lain: beberapa kelompok akademis telah memberi label B-scan OCT (meskipun seringkali bersifat proprietary). Jika diperlukan, seseorang dapat menggunakan dataset segmentasi OCT generik (seperti tantangan cairan retina OCT Duke (www.nature.com)) sebagai proksi.
- Model: CNN mirip U-Net kecil, bahkan mungkin saluran dipangkas dari baseline. Misalnya, gunakan 3 blok turun/naik, dimulai dengan 16 filter. Agen diizinkan untuk mengubah kedalaman dan lebar.
- Metrik: Skor Dice atau mean IoU dari mask RNFL yang diprediksi vs kebenaran.
- Contoh program.md:
  
  "Tujuan: Memaksimalkan skor Dice untuk segmentasi lapisan RNFL pada OCT. Model dasar adalah U-Net 3 blok. Agen dapat memvariasikan jumlah filter, menambahkan dropout, atau mengubah learning rate. Latih selama 5 menit setiap percobaan dan hitung Dice pada validasi. Pertahankan modifikasi yang meningkatkan Dice."
Tugas: Prediksi Progresi melalui OCT Serial. Menggunakan OCT sekuensial, prediksi penipisan di masa depan. Jika data OCT longitudinal ada (misalnya data UK Biobank atau klinik swasta), tujuannya bisa untuk memprediksi perubahan RNFL atau label biner “progresor cepat”.
- Dataset: Data OCT longitudinal publik yang spesifik untuk glaucoma langka. Namun, seseorang dapat menggunakan kembali data tantangan SR OCT (atau gambar SYN-OCT dengan progresi simulasi) untuk mensimulasikan tugas ini. Alternatifnya, gunakan gambar OCT UK Biobank (meskipun tidak spesifik glaucoma dan tidak mudah diakses oleh ilmuwan warga). Sebagai ilustrasi, asumsikan dataset pemindaian OCT pada waktu0 dan waktu1 dengan label.
- Model: CNN Siamese atau terkonsentrasi yang mengambil pasangan gambar OCT, mengeluarkan probabilitas progresi. Mulailah dengan memasukkan waktu0 dan memprediksi cut-off waktu1.
- Metrik: AUC untuk klasifikasi progresi biner, atau MSE jika mencoba memprediksi perubahan ketebalan.
- Contoh program.md:
  
  "Tujuan: Mengidentifikasi mata yang akan mengalami kehilangan RNFL yang cepat. Input: OCT baseline; label: penipisan >5μm setelah 1 tahun. Kami menggunakan pengklasifikasi CNN. Perubahan yang diizinkan termasuk kedalaman jaringan, learning rate, augmentasi. Gunakan validasi AUC sebagai metrik."

2.2 Analisis Bidang Visual (BV)

Tugas: Memprediksi Kehilangan Bidang Visual di Masa Depan. Mengingat satu atau lebih tes bidang visual Humphrey di masa lalu (nilai sensitivitas titik-demi-titik), perkirakan sensitivitas atau tingkat progresi di masa depan. Ini adalah masalah manajemen glaucoma klasik.
- Dataset: Dataset GRAPE (www.nature.com) (2023) menyediakan follow-up longitudinal 263 mata (1115 catatan) dengan BV dan fundus/OCT, termasuk progresi yang dianotasi. Sumber lain adalah database longitudinal UH Visual Field (UWHVF) AS (www.nature.com) (28.943 bidang dari banyak pasien). Namun, GRAPE dikurasi dengan baik dan bersifat publik dengan BV dan hasilnya.
- Model: Pendekatan sederhana adalah jaringan feed-forward (terhubung penuh) pada data BV 54 titik (atau kompres ke indeks global). Untuk prediksi progresi, MLP yang lebih kecil atau 1D-CNN dapat menangani 54 atau 30 fitur input. Ide lain: perlakukan grid 8×8 sebagai gambar kecil dan gunakan CNN kecil (misalnya, kernel 3×3).
- Metrik: Jika memprediksi deviasi rata-rata atau nilai titik di masa depan, gunakan MSE (lebih rendah lebih baik). Jika mengklasifikasikan “progresor cepat vs tidak”, gunakan AUC.
- Contoh program.md:
  
  "Tujuan: Meminimalkan MSE dari bidang visual yang diprediksi. Atau, maksimalkan AUC untuk mengklasifikasikan kehilangan cepat. Model dasar: perceptron 2 lapis pada 54 nilai BV. Agen dapat menyesuaikan ukuran tersembunyi, aktivasi, atau menambahkan dropout. Setelah setiap pelatihan 5 menit, hitung metrik pada set validasi."
Tugas: Mengidentifikasi Progresor Cepat. Menggunakan serangkaian BV masa lalu, klasifikasikan mata mana yang akan kehilangan penglihatan dengan cepat.
- Dataset: Gunakan status progresi yang dianotasi di GRAPE (www.nature.com) (mereka menandai mata sebagai yang mengalami progresi). Atau ambil UWHVF dan beri label desil teratas kehilangan MD sebagai “cepat”.
- Model: Dapat menggabungkan fitur dari dua atau tiga bidang berturut-turut (atau perbedaan) ke dalam jaringan kecil. Mungkin termasuk TIO baseline dan usia jika tersedia.
- Metrik: AUC untuk membedakan progresor cepat vs lambat.
- Contoh program.md:
  
  "Tujuan: Memaksimalkan AUC untuk memprediksi progresi bidang yang cepat. Fitur input: perbedaan orde kedua dari BV1 & BV2, ditambah TIO. Gunakan jaringan FC kecil. Agen dapat menyetel lebar lapisan, learning rate, batch size."

2.3 Skrining Obat/Senyawa (Penemuan Kandidat In Silico)

Tugas: Memprediksi Kandidat Senyawa Neuroprotektif/Regeneratif. Gunakan ML untuk menemukan molekul kecil yang mungkin melindungi RGC atau mendorong regenerasi. Misalnya, banyak senyawa yang dikenal (seperti nikotinamida, valproate) menunjukkan efek neuroprotektif. Kita dapat melatih model untuk mengenali kemotipe yang berkorelasi dengan efikasi yang diketahui dan kemudian mencari ruang kimia.
- Dataset: Ini menantang karena kurangnya database obat glaucoma khusus. Sebagai proksi, seseorang dapat menggunakan dataset MolNet (misalnya penghambatan HIV, permeabilitas BBB) atau dataset bioaktivitas apa pun. Alternatifnya, kumpulkan daftar senyawa yang diuji dalam model cedera saraf optik (dari penambangan literatur) dengan label. Dalam praktiknya, seseorang dapat memulai dengan properti yang lebih generik (misalnya data penetrasi blood-brain barrier dari MoleculeNet).
- Model: Transformator kecil atau jaringan saraf grafik pada string SMILES. Transformator (gaya GPT-2) dengan beberapa lapisan atau jaringan konvolusional grafik sederhana (misalnya 3 lapisan GCN) dapat diimplementasikan dalam train.py.
- Metrik: Jika kita memperlakukan sebagai klasifikasi (aktif vs tidak aktif), gunakan AUROC. Jika memprediksi afinitas atau logP, gunakan RMSE.
- Contoh program.md:
  
  "Tujuan: Memaksimalkan ROC-AUC klasifikasi untuk mengidentifikasi senyawa mirip neuroprotektif. Model dasar: transformator kecil pada SMILES. Agen dapat menyesuaikan jumlah lapisan transformator, dropout, learning rate, atau menggunakan featurisasi alternatif (misalnya input sidik jari). Setelah setiap 5 menit, evaluasi AUC pada molekul validasi."

(Catatan: Karena data publik untuk neuroproteksi aktual langka, tugas ini lebih bersifat ilustratif. Dalam praktiknya, ilmuwan warga dapat membuat dataset kustom senyawa neuroprotektif yang diketahui vs kontrol dan mengikuti pola ini.)

2.4 Pemodelan Jaringan Regulasi Gen (RGC Sel Tunggal)

Tugas: Mengidentifikasi Kombinasi TF Regeneratif. Gunakan data RNA-seq sel tunggal dari RGC untuk mempelajari pola transkripsional pertumbuhan regeneratif. Misalnya, beberapa subtipe RGC beregenerasi lebih baik daripada yang lain. Model ML mungkin memprediksi label “keadaan regeneratif”, dan seseorang dapat memeriksa faktor transkripsi mana yang penting.
- Dataset: Sebuah studi tahun 2018 menyediakan transkriptom sel tunggal RGC (akses GEO GSE115404) (pmc.ncbi.nlm.nih.gov), mengidentifikasi subtipe RGC yang berbeda. Kita dapat menggunakan dataset ini (atau subsetnya) di mana sel diberi label berdasarkan subtipe atau kondisi eksperimen (misalnya pra- vs pasca-cedera).
- Model: Transformator kecil atau MLP yang beroperasi pada vektor ekspresi gen (setiap sel memiliki ribuan kelimpahan gen). Secara praktis, seseorang akan memilih sekitar 500 gen teratas (misalnya gen yang sangat bervariasi). train.py mungkin mengimplementasikan mini-transformator (misalnya 4 lapisan, embedding 256) atau perceptron 2 lapis sederhana.
- Metrik: Jika menggunakan analisis tanpa pengawasan, seseorang dapat menggunakan skor siluet, tetapi lebih sederhana, jika memberi label sel sebagai “beregenerasi” vs “tidak” (jika label ada), gunakan akurasi/AUC klasifikasi.
- Contoh program.md:
  
  "Tujuan: Membangun model yang membedakan profil ekspresi gen RGC yang beregenerasi vs tidak beregenerasi. Mulailah dengan transformator 3 lapis. Agen dapat mengubah embed dim, kedalaman, learning rate, atau menambahkan batchnorm. Optimalkan akurasi validasi."
  Setelah dijalankan, bobot perhatian model terbaik atau fitur yang dipelajari mungkin menyoroti faktor transkripsi kunci untuk eksperimen.

2.5 Analisis Sinyal Elektrofisiologi

Tugas: Mendeteksi Disfungsi RGC Subklinis melalui ERG. Elektroretinogram pola (pERG) atau sinyal elektrofisiologi lainnya dapat mengungkapkan kesehatan RGC. Misalnya, respons ERG yang tertunda atau berkurang dapat mendahului cacat bidang penglihatan. Kita dapat mencoba mengklasifikasikan sinyal sebagai “normal” vs “terduga glaucoma.”
- Dataset: Dataset ERG publik pada glaucoma jarang. Seseorang dapat menggunakan pengganti: dataset dari hewan (degenerasi retina) atau sinyal sintetik. Jika tidak tersedia, bahkan dataset elektrofisiologi 1D generik (misalnya EKG) dapat mengilustrasikan pipeline.
- Model: CNN 1D (misalnya 2 lapisan konvolusi diikuti oleh FC) pada data deret waktu. Alternatifnya, LSTM dapat digunakan jika urutannya lebih panjang.
- Metrik: Akurasi atau AUC dalam mengklasifikasikan disfungsi halus vs normal. Mungkin F1 jika kelas tidak seimbang.
- Contoh program.md:
  
  "Tujuan: Memaksimalkan akurasi validasi untuk mengklasifikasikan jejak ERG (pola sehat vs glaucoma awal). Gunakan CNN 1D. Agen dapat menyesuaikan ukuran filter, stride, atau menambahkan lapisan recurrent. Pertahankan setiap perubahan yang meningkatkan akurasi."

2.6 Penambangan Literatur (Generasi Hipotesis)

Tugas: Menyetel Halus Model Bahasa Kecil untuk Mengungkap Wawasan Baru. Dengan ribuan makalah penelitian glaucoma di PubMed, agen ML dapat mencari koneksi atau mereposisi kandidat. Misalnya, menghubungkan jalur neuroprotektif ke obat-obatan yang ada. Kita dapat memperlakukan ini sebagai masalah pemodelan bahasa atau sebagai masalah pengambilan informasi.
- Dataset: Kumpulkan korpus abstrak terkait glaucoma (misalnya gunakan pencarian PubMed untuk “terapi gen glaucoma” dll). Seseorang dapat mengunduh ~10.000 abstrak melalui API NCBI. Untuk awal yang lebih sederhana, gunakan artikel glaucoma akses terbuka PMC.
- Model: Model bahasa transformator kecil (misalnya GPT-2 6 lapis) atau bahkan BERT yang disetel halus. Untuk tujuan autoresearch, kita kemungkinan akan menyetel halus model kausal (GPT) pada teks.
- Metrik: Secara standar, validasi loss (perpleksitas) dioptimalkan. Jika melakukan klasifikasi (misalnya, diberikan abstrak, prediksi label untuk obat atau jalur), gunakan akurasi/AUC.
- Contoh program.md:
  
  "Tujuan: Meminimalkan perpleksitas validasi GPT-2 kecil pada korpus literatur glaucoma. Gunakan fine-tuning run 5 menit. Agen dapat memvariasikan jumlah lapisan, ukuran tersembunyi, learning rate, panjang konteks. Pertahankan perubahan yang mengurangi perpleksitas."
  Setelah dilatih, seseorang dapat meminta model ini untuk menghasilkan hipotesis (misalnya “Kandidat obat yang dapat direposisi teratas untuk neuroproteksi pada glaucoma: ...”).

Di setiap domain ini, kuncinya adalah satu GPU dan run singkat memungkinkan banyak percobaan. Kami tidak mengharapkan agen untuk membuat kode algoritma baru dari awal tetapi untuk menyesuaikan skrip pelatihan yang sudah ada. Peran manusia adalah menulis program.md untuk memandu pencarian agen menuju tujuan spesifik glaucoma (seperti memaksimalkan AUC pada dataset fundus atau memprediksi ketebalan RNFL). Contoh di atas mengilustrasikan bagaimana train.py dapat diatur pada awalnya dan bagaimana program.md meminta untuk meningkatkan metrik yang dipilih (medium.com) (www.theneuron.ai).

3. Panduan Implementasi Ilmu Pengetahuan Warga Praktis

Bagaimana individu yang termotivasi dengan sumber daya terbatas (misalnya satu RTX 3060 atau MacBook dengan Apple Silicon) benar-benar dapat menerapkan autoresearch pada masalah glaucoma? Kabar baiknya adalah repo Karpathy kecil dan memiliki panduan untuk skala bawah. Berikut adalah langkah-langkah dan tips utama:

Penyiapan Lingkungan: Clone repo karpathy/autoresearch. Anda akan membutuhkan Python modern dan idealnya akses LLM (agen itu sendiri biasanya LLM yang sudah dilatih sebelumnya seperti GPT-4 atau Claude yang mengedit kode). Untuk GPU, instal PyTorch dengan dukungan CUDA/metal yang tepat. Untuk Apple Silicon, gunakan salah satu fork (misalnya MLX) atau build PyTorch untuk M1/M2 (lihat dokumen repo). Pada Windows/Linux dengan 3060 atau 4070, PyTorch CUDA normal berfungsi.
Konfigurasi untuk GPU Kecil: Autoresearch default menggunakan model seperti GPT dengan ~50M parameter dan urutan panjang 1024 (medium.com), yang mungkin berat. Untuk GTX 3060 (12GB), Anda harus mengurangi ukuran model dan panjang urutan. Dalam train.py, atur MAX_SEQ_LEN=512 atau bahkan 256. Kurangi jumlah lapisan dan lebar (GPT menengah sekitar 8 lapisan; coba 4 lapisan, lebar 256). Instruksi di komunitas menyebutkan mengurangi “DEPTH”, “WIDTH”, dll. Anda juga dapat mengurangi memori optimizer dengan menggunakan ukuran batch yang lebih kecil (bahkan 16 atau 8). Agen masih dapat memutasi parameter ini, tetapi memberinya titik awal yang lebih kecil memastikan run <5 menit. README autoresearch GitHub dan diskusi masalah juga mencatat bahwa chip Mac M1 dapat menangani urutan yang lebih pendek (misalnya 256 token) karena memori terbatas; skala serupa berlaku untuk GPU mana pun.
Menyiapkan Data Glaucoma: Data setiap tugas harus dimuat dan dibagi. Dataset glaucoma publik meliputi:
- Dataset Fundus: ORIGA(-light) (650 gambar berlabel (pubmed.ncbi.nlm.nih.gov)), RIM-ONE DL (485 gambar dengan segmentasi cawan/cakram (github.com)), REFUGE (1200+ gambar, dengan split pelatihan/uji (refuge.grand-challenge.org)), Dataset Glaucoma Hillel Yaffe (HYGD) baru dengan ~1200 gambar fundus dan label berkualitas tinggi (physionet.org). EyePACS/AIROGS (puluhan ribu gambar retina) juga dapat diakses publik melalui pendaftaran (misalnya Kaggle).
- Dataset OCT: SYN-OCT (200k B-scan sintetik dengan mask RNFL (www.nature.com) (www.nature.com)), OCTDL (2064 gambar berbagai penyakit retina (www.nature.com)), dan lainnya dari tantangan publik.
- Data Bidang Visual: GRAPE (263 mata BV longitudinal plus gambar (www.nature.com)). UWHVF (28k tes BV) terbuka jika Anda mengunduh dari repositori University of Washington (www.nature.com). Beberapa tantangan Kaggle menyertakan data BV.
- Elektrofisiologi: Tidak ada dataset ERG glaucoma terbuka besar yang diketahui, tetapi seseorang dapat memulai dengan data sinyal normal vs glaucoma yang dapat diakses.
- Data Kimia/Gen: Dataset standar seperti MoleculeNet (untuk senyawa) atau GEO (untuk gen) dapat digunakan kembali. Misalnya, unduh hitungan mentah GSE115404 (melalui kueri GEO (pmc.ncbi.nlm.nih.gov)) dan preprocess ke matriks ekspresi.
Untuk setiap, Anda memerlukan prepare.py yang memuat data dan mendefinisikan train_set, val_set, dan fungsi evaluasi. Templat Karpathy mengharapkan prepare.py untuk menghasilkan data pelatihan dan rutinitas evaluasi yang mengembalikan loss atau metrik. Misalnya, prepare.py untuk RIM-ONE mungkin memuat gambar dan CC yang diberi label glaucoma, membagi menjadi folder train/val, dan mendefinisikan fungsi yang menghitung AUC validasi. RUJUK ke [14†L71-L79] untuk bagaimana RIM-ONE terstruktur.
Menyesuaikan Data untuk Skala Kecil: Jika dataset besar (seperti EyePACS atau SYN-OCT), Anda dapat melakukan subsampling untuk membuat dataset “kecil” beberapa ratus contoh (model masih dapat mempelajari sesuatu yang berharga pada korpus kecil). Repo autoresearch bahkan menyebutkan penggunaan dataset kecil bergaya “TinyStories” untuk dijalankan pada perangkat keras kecil. Misalnya, pilih 500 gambar dari ORIGA (seimbang), atau 1000 bidang BV dari GRAPE. Demikian pula, untuk bahasa, seseorang dapat menggunakan subset 5.000 abstrak dari makalah glaucoma PubMed. Kuncinya adalah dataset tetap yang diulang oleh agen. Pastikan untuk melakukan pre-shuffle dan membagi 80/20 sehingga setiap run 5 menit melihat split train/val yang sama.
Menulis Strategi program.md: Komunitas harus berbagi berbagai prompt program.md (seperti “resep”) dalam kontrol versi. Setiap file dapat mengkodekan strategi penelitian. Misalnya, satu strategi mungkin mengatakan “tingkatkan kedalaman jaringan jika kedalaman <6, jika tidak kurangi learning rate,” sementara yang lain mungkin mengatakan “fokus pada perubahan augmentasi data.” Seiring waktu, kelompok dapat membandingkan strategi mana yang menghasilkan metrik yang lebih baik di papan peringkat. program.md yang baik mencakup tujuan (misalnya memaksimalkan AUC atau meminimalkan validation loss) dan petunjuk tentang mutasi yang diizinkan (lapisan, filter, LR). LLM agen menggunakan instruksi ini untuk mengusulkan editan kode. Jaga agar metrik terstandarisasi (misalnya selalu laporkan AUC untuk tugas klasifikasi glaucoma) sehingga eksperimen dapat dibandingkan.
Kolaborasi Komunitas: Untuk membuat upaya ini dapat diskalakan, komunitas ilmuwan warga harus mengorganisir:
- Log Eksperimen Bersama: Publikasikan hasil setiap eksperimen (misalnya “Run #27 dari program-v1 mencapai Val AUC=0,82 dengan lebar=4, kedalaman=3”).
- Metrik Terstandarisasi: Definisikan metrik untuk setiap tugas: misalnya “AUC glaucoma OCT”, “AUC progresi BV”, “AUC Atribut”, dll. Papan peringkat bersama (mirip dengan val_bpb autoresearch) dapat melacak skor teratas. Misalnya, Slack atau GitHub Actions mungkin mengumpulkan AUC terbaik setiap agen setiap minggu.
- program.md Terkontrol Versi: Host semua program.md di repo GitHub. Anggota dapat melakukan fork dan mengusulkan strategi baru (melalui pull request) sambil mempertahankan versi historis. Dengan cara ini beberapa pendekatan dapat diuji secara paralel (misalnya “program_word2vec.md” vs “program_transformer.md”).
- Berbagi Data dan Kode: Gunakan repo publik atau notebook untuk skrip persiapan data, dan bagikan modifikasi train.py yang ditemukan oleh agen (untuk direproduksi dalam kerangka ML standar). Menghubungkan ke sumber dataset asli (Kaggle, PhysioNet, Zenodo) memastikan orang lain dapat mengunduh data yang sama.

Dengan menurunkan hambatan teknis (agen mengedit kode, pengguna mengedit instruksi dalam Markdown), dan dengan mengkoordinasikan upaya (log bersama, papan peringkat), ilmuwan warga dapat secara kolektif menjelajahi pilihan hyperparameter/model untuk masalah ML glaucoma ini. Pada dasarnya, mereka menginvestasikan kreativitas manusia dalam mendefinisikan tujuan, dan membiarkan agen menjalankan kerja keras 100 eksperimen semalam per tujuan (medium.com) (www.theneuron.ai).

4. Pemulihan Penglihatan Secara Spesifik

Pemulihan penglihatan – mendapatkan kembali penglihatan setelah kerusakan – adalah target yang sangat menarik untuk optimasi berbasis AI. Penelitian pemulihan penglihatan yang dibantu AI saat ini meliputi implan retina, prostesis kortikal, dan optogenetik. Begini cara putaran autoresearch dapat masuk:

Mengoptimalkan Enkoding Prostesis Visual: Prostesis modern (implan retina atau kamera yang terhubung ke susunan elektroda) mencoba menerjemahkan gambar kamera menjadi pola stimulasi listrik yang diinterpretasikan otak sebagai penglihatan. Tantangannya adalah “bandwidth” elektroda sangat terbatas (seringkali hanya puluhan hingga beberapa ratus titik) (pmc.ncbi.nlm.nih.gov). Model ML (CNN atau transformator kecil) dapat dilatih untuk memetakan gambar input ke peta stimulasi ideal, tetapi hyperparameter atau arsitektur terbaik untuk terjemahan ini tidak diketahui. Agen autoresearch dapat menjalankan 100 variasi model “neural encoder” dalam beberapa jam. Misalnya, siapkan dataset pasangan gambar→stimulasi (baik fosphen simulasi atau data pasien) dan minta agen mengoptimalkan jaringan encoder untuk meminimalkan reconstruction loss atau memaksimalkan metrik utilitas (integritas kontras, akurasi pengenalan). Agen mungkin mencoba menambahkan lapisan perhatian, mengubah ukuran konvolusi, atau menyetel learning rate. Selama banyak run, seseorang dapat menemukan jaringan kecil yang menghasilkan output prostetik yang lebih menonjol. Beberapa karya terbaru sudah menggunakan AI untuk mengekstrak saliency visual untuk prostesis (pmc.ncbi.nlm.nih.gov); autoresearch dapat mengotomatiskan penyetelan pipeline tersebut.
Pola Stimulasi Optogenetik: Dalam terapi optogenetik, RGC yang bertahan hidup atau sel retina lainnya dibuat peka cahaya (melalui gen yang dimasukkan). Input dari kamera kemudian harus dienkode menjadi pulsa cahaya. Di sini lagi, model ML dapat mengontrol pola. Seseorang dapat membingkai tugas mainan: jaringan kecil mengubah gambar kamera menjadi peta intensitas cahaya (dimensi yang sama dengan sel). Tujuan agen bisa untuk memaksimalkan beberapa metrik stimulasi efektif (misalnya memaksimalkan aktivasi sel target dalam retina simulasi). Setiap percobaan mungkin menjalankan simulasi cepat respons. Selama iterasi, agen mungkin menjelajahi durasi pulsa atau filter spasial. Misalnya, menyesuaikan agresivitas high-pass filter pada input kamera mungkin bermanfaat untuk beberapa pola. Intinya adalah banyak parameter analog (kernel filter, nonlinieritas, temporal pulse coding) dapat disapu secara otomatis.
Optimasi Pola Pulsa (TES dan Implan): Bahkan domain non-pembelajaran mesin dapat memperoleh manfaat dari pencarian cepat. Misalnya, sebuah studi terbaru (Xie et al. 2025) menemukan bahwa durasi pulsa yang lebih pendek dan penyisipan interval antar-fase secara signifikan meningkatkan aktivasi kortikal untuk implan retina (pmc.ncbi.nlm.nih.gov). Ini menunjukkan bahwa ruang parameter stimulasi listrik memiliki efek yang kuat dan non-intuitif. Agen autoresearch dapat memperlakukan parameter protokol stimulasi (durasi fase, frekuensi, interval) sebagai “parameter jaringan” dan menjalankan banyak eksperimen kecil (masing-masing disimulasikan atau empiris) untuk memaksimalkan respons kortikal. Misalnya, siapkan model listrik yang disederhanakan (atau gunakan data potensial evoked yang direkam) di prepare.py dan biarkan agen menyesuaikan parameter train.py seperti pulse timing untuk memaksimalkan amplitudo respons yang ditentukan. Ini mirip dengan mengotomatisasi apa yang dilakukan ahli saraf secara manual.
Desain Vektor Virus dan Geometri Perancah: Dalam pengembangan terapi yang lebih eksploratif, pendekatan looping agen juga dapat mengatasi optimasi biomedis. Misalnya, desain capsid virus AAV atau promoter untuk menargetkan RGC dapat dipandu oleh model prediktif kecil (misalnya regresi logistik pada fitur urutan). Autoresearch dapat berulang kali mencoba memodifikasi model yang memprediksi tropisme atau ekspresi (dilatih pada misalnya pustaka virus kecil) untuk meningkatkan prediksi tersebut. Demikian pula, jika seseorang memiliki kode simulasi untuk pertumbuhan dalam perancah saraf (untuk perbaikan saraf optik), agen dapat menyesuaikan parameter geometris untuk memaksimalkan ekstensi akson. Ini adalah tingkat lanjut, tetapi secara konseptual sesuai – “agen sebagai eksperimenter” dapat menyesuaikan parameter model atau simulasi untuk hasil yang lebih baik.

Singkatnya, setiap aspek prostesis atau pemulihan penglihatan yang mengandalkan algoritma berparameter dapat ditingkatkan melalui iterasi cepat. Yang penting, batasannya adalah kita umumnya hanya memiliki data simulasi untuk banyak tugas ini; pengujian pasien aktual dari ratusan varian tidak mungkin dilakukan. Tetapi autoresearch dapat beroperasi in silico untuk mengusulkan kandidat terbaik untuk pengujian klinis selanjutnya. Seperti yang dicatat oleh tinjauan prostesis, “memastikan phosphene dihasilkan secara andal di lokasi yang tepat… adalah tantangan penting” dan “model berbasis AI telah menunjukkan potensi” di bidang ini (pmc.ncbi.nlm.nih.gov). Autoresearch dapat secara signifikan mempercepat penemuan konfigurasi terbaik model AI tersebut.

5. Menjembatani Dampak Klinis

Hasil komputasi pada akhirnya harus terhubung kembali ke penelitian dan perawatan glaucoma nyata. Bagaimana ide-ide yang dihasilkan oleh autoresearch yang dipimpin pasien dapat divalidasi dan dikembangkan?

Kolaborasi dengan Kelompok Penelitian: Ilmuwan warga harus menjangkau konsorsium penelitian glaucoma yang mapan. Contohnya termasuk International Glaucoma Genetics Consortium (IGGC) dan konsorsium NEIGHBORHOOD, yang mengumpulkan data genetik dan klinis (pubmed.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Temuan dari autoresearch (misalnya gen kandidat baru atau hipotesis drug repurposing) dapat dibagikan dengan kelompok tersebut untuk follow-up eksperimental. Laboratorium kultur jaringan (misalnya di universitas besar) atau peneliti tidur mungkin menguji senyawa pada kelangsungan hidup RGC. Dokter akademis dapat mengkorelasikan biomarker atau pengklasifikasi gambar apa pun dengan data pasien mereka di bawah IRB. Memulai dialog antara kelompok bergaya hackathon dan laboratorium formal adalah kunci.
Melibatkan Organisasi Advokasi Pasien: Kelompok seperti Glaucoma Research Foundation atau Cure Glaucoma Foundation sering mendanai inovasi yang berpusat pada pasien. Mereka dapat mensponsori proyek proof-of-concept atau kompetisi warga menggunakan autoresearch. Organisasi-organisasi ini memiliki jaringan dokter dan dapat membantu mengarahkan lead model yang menjanjikan ke klinik. Misalnya, jika seorang agen menandai obat yang sudah disetujui FDA sebagai neuroprotektif, kelompok advokasi dapat membantu dalam menyiapkan uji coba kecil di bawah protokol yang tepat. Menyoroti keberhasilan akan membutuhkan pembingkaian output sebagai hipotesis (bukan nasihat medis) dan memastikan transparansi.
Pembatas Etika dan Keamanan: Ilmuwan warga harus menggunakan hanya data publik yang tidak teridentifikasi atau data yang sepenuhnya sintetik. Setiap penggunaan catatan pasien aktual memerlukan protokol yang disetujui IRB (dan kemungkinan persetujuan pasien). Output dari putaran autoresearch harus diberi label jelas sebagai penghasil-hipotesis. Misalnya, “Model ini menunjukkan Obat X dapat melindungi RGC – validasi eksperimental diperlukan.” Keputusan medis kritis harus tetap berada di tangan dokter. Risiko termasuk secara tidak sengaja mendistribusikan model yang memprediksi hasil pribadi (progresi glaucoma) – penafian eksplisit diperlukan agar ini tidak diperlakukan sebagai alat diagnostik. Praktik terbaik privasi data (misalnya menggunakan bidang yang diagregasi atau anonim) adalah suatu keharusan.
Preseden dalam Ilmu Pengetahuan Warga: Bukan hal yang belum pernah terjadi sebelumnya bagi amatir untuk berkontribusi pada penelitian medis/ilmu saraf. Proyek Eyewire (permainan pemetaan neuron crowdsourced MIT) memobilisasi sukarelawan untuk merekonstruksi sirkuit saraf retina (www.citizenscience.gov). Dalam oftalmologi, non-ahli telah membantu menganotasi gambar dalam tantangan yang didanai OpenAI (misalnya dataset berlabel untuk penyakit mata). Di luar perawatan mata, permainan seperti Foldit (teka-teki pelipatan protein) dan Galaxy Zoo (mengklasifikasikan galaksi) menunjukkan bahwa partisipasi warga dapat memecahkan masalah ilmiah yang sulit. Keberhasilan ini mendorong gagasan bahwa banyak tangan (dan sekarang AI) memang dapat membantu penelitian kompleks. Pendekatan autoresearch seperti memberikan setiap orang asisten laboratorium bertenaga AI: upaya crowdsourced sebelumnya hanya menggunakan manusia untuk menganalisis tugas-tugas tetap, sedangkan di sini manusia menetapkan tujuan dan AI melakukan iterasi.

Dengan bersikap transparan, hati-hati, dan kolaboratif, inisiatif autoresearch ilmu pengetahuan warga dapat memperoleh kepercayaan. Ini harus menekankan “menghasilkan lead, bukan resep.” Jika komunitas mendokumentasikan metode dan berbagi kode secara terbuka, peneliti profesional dapat mereproduksi temuan. Misalnya, jika seseorang menemukan kombinasi faktor pelindung RGC yang baru, mereka dapat memublikasikannya dalam preprint atau memberi tahu laboratorium. Referensi gaya sitasi (seperti yang kami lakukan di sini) membantu menjembatani: misalnya “Kami memperlakukan daftar obat kandidat Anda dalam konteks jalur yang diketahui (pmc.ncbi.nlm.nih.gov).” Pada akhirnya, ini adalah bentuk open science – didorong pasien tetapi secara ilmiah ketat. Jika standar etika dipertahankan, inovasi akar rumput semacam itu memiliki potensi besar untuk memicu kolaborasi baru dan pada akhirnya masuk ke penelitian oftalmologi yang ditinjau sejawat.

6. Peta Jalan 90 Hari yang Konkret

Rencana yang terfokus dan berbatas waktu dapat menggalang komunitas 10–50 orang (dengan setidaknya satu GPU atau Apple Silicon masing-masing) untuk meluncurkan upaya autoresearch-untuk-glaucoma. Berikut adalah rencana bertahap yang disarankan:

Minggu 1–2: Pembentukan & Penyiapan
- Rekrutmen dan Peluncuran: Buat saluran komunikasi (misalnya Slack atau Discord) dan repo GitHub untuk proyek tersebut. Publikasikan ke forum pasien glaucoma, kelompok biohacker, dan pertemuan AI.
- Pemeriksaan Perangkat Keras: Pastikan setiap orang dapat menginstal PyTorch dan clone repo Karpathy (atau fork Maple). Selenggarakan sesi penyiapan di mana setiap anggota menjalankan autoresearch loop sampel pada dataset mainan (misalnya subset CIFAR-10) untuk memverifikasi lingkungan.
- Pemilihan Dataset: Putuskan 1–3 tugas awal (misalnya klasifikasi OCT, progresi BV). Untuk setiap tugas, tetapkan tim kecil untuk menyiapkan data: misalnya satu tim mengunduh gambar RIM-ONE (github.com), tim lain mengambil bidang GRAPE (www.nature.com), tim lain mengumpulkan abstrak literatur. Tim harus membagi data 80/20 dan membuat stub prepare.py.
- Model Baseline: Untuk setiap tugas, finalisasi train.py sederhana: misalnya, CNN kecil untuk RIM-ONE, MLP untuk BV. Pilih metrik evaluasi (AUC, Dice, MSE).
- Draf Awal program.md: Setiap tim menulis file instruksi awal (program.md) yang menyatakan tujuan dan perubahan yang diizinkan. Misalnya untuk RIM-ONE: “memaksimalkan AUC deteksi glaucoma,” untuk GRAPE: “meminimalkan MSE BV.”
Minggu 3–6: Siklus Eksperimen Pertama
- Jalankan Autoresearch Loops: Setiap subkelompok menjalankan agen pada tugas mereka semalaman (sekitar 100 run 5 menit). Gunakan satu program.md untuk memulai, lalu biarkan peserta menambahkan variasi (misalnya “program_temp1.md”).
- Kumpulkan Hasil: Setiap pagi, tim memeriksa log (repo secara otomatis mencatat setiap run). Catat metrik terbaik yang dicapai, parameter model pada saat itu, dan perubahan penting apa pun yang ditemukan agen. Untuk transparansi, dorong hasil ini ke GitHub bersama (mungkin dalam CSV atau JSON).
- Iterasi & Umpan Balik: Bandingkan run. Apakah ada strategi yang mengalahkan baseline secara signifikan? Jika sub-tim melihat sedikit kemajuan, mereka harus menyesuaikan program.md (misalnya menjadi lebih agresif dengan perubahan learning rate). Setiap akhir pekan, sintesis temuan dalam rapat komunitas.
- Alat: Gunakan Git untuk kontrol versi pada program.md dan pada template kode. Pertimbangkan Google Sheet atau tabel wiki bersama untuk papan peringkat (misalnya “OCT-AUC: terbaik=0.85 oleh Alice; VF-RMSE: terbaik=2.1 oleh Bob”). Ini memotivasi kompetisi yang sehat dan transparansi.
Minggu 7–12: Penyempurnaan dan Jangkauan
- Sempurnakan Eksperimen: Berdasarkan hasil awal, sempurnakan tugas-tugas yang menjanjikan. Misalnya, mungkin pengklasifikasi RIM-ONE mencapai AUC 0,90 – sekarang coba tambahkan augmentasi data atau jaringan yang sedikit lebih dalam. Dorong branching: beberapa dapat mencoba arsitektur yang berbeda (misalnya Vision Transformer kecil alih-alih CNN). Agen dapat menjalankan beberapa varian program.md secara paralel.
- Sintesis Hasil: Buat laporan singkat tentang setiap domain (OCT, BV, dll.), merangkum apa yang berhasil. Misalnya, “Kami meningkatkan Dice segmentasi GCC dari 0,60 menjadi 0,75 dengan beralih dari ReLU ke GELU activation.” Gunakan bahasa awam agar non-ahli dapat mengikuti (glosarium untuk istilah ML).
- Presentasi Komunitas: Pada minggu ke-10, tulis postingan blog atau slide deck yang merangkum inisiatif sejauh ini. Sorot temuan non-trivial apa pun (bahkan hasil “nol” berguna untuk dibagikan). Undang umpan balik dari forum online; mungkin hubungi peneliti yang meminta komentar (“Kami menemukan X penyesuaian jaringan saraf membantu mengklasifikasikan glaucoma awal – ada ide apakah ini selaras dengan fisiologi?”).
- Rencanakan Jangkauan: Identifikasi satu atau dua laboratorium oftalmologi atau dokter yang tertarik untuk berkolaborasi. Jangkau dengan hasil awal. Misalnya, hubungi penulis dataset HYGD atau tim GRAPE di Twitter/LinkedIn, sebutkan temuan warga Anda. Jelajahi kemungkinan untuk ko-validasi (misalnya, kirimkan mereka bobot model yang dilatih untuk diuji pada data mereka).
Di Luar 12 Minggu: Langkah Selanjutnya
- Lanjutkan looping pada tugas-tugas yang paling menjanjikan dan yang baru. Misalnya, jika RIM-ONE menghasilkan hasil yang baik, selanjutnya tangani REFUGE. Mungkin membangun model komposit (ensemble CNN).
- Resmikan halaman proyek atau preprint yang menjelaskan upaya tersebut.
- Pertimbangkan untuk menyelenggarakan hackathon untuk membawa lebih banyak pemikiran, mungkin dalam kemitraan dengan badan amal glaucoma.

Dengan struktur seperti ini, komunitas dapat membuat kemajuan yang stabil, belajar bersama, dan mulai menjembatani para ahli pada akhir 90 hari.

7. Risiko, Batasan & Penilaian Jujur

Gagasan autoresearch-untuk-glaucoma ambisius, sehingga membutuhkan kejujuran tentang potensi jebakan:

Risiko Overfitting dan Pola Palsu: Model kecil pada dataset kecil dan berisik seringkali terpaku pada kebetulan. Agen mungkin menemukan penyesuaian yang meningkatkan AUC validasi hanya dengan overfitting pada kekhasan. Misalnya, jika subset gambar memiliki tanda anotasi yang samar, jaringan mungkin menggunakan itu alih-alih fitur glaucoma yang sebenarnya. Ini mengarah pada “kebodohan gradient descent.” Untuk mengatasinya:
- Selalu gunakan set uji held-out (terpisah sepenuhnya dari penyesuaian apa pun) untuk evaluasi akhir.
- Batasi kompleksitas: jaga agar model tetap sederhana, dan perhatikan jika agen memperdalam atau memperlebar jaringan secara berlebihan di luar batas wajar.
- Jika model mencapai skor mendekati sempurna terlalu cepat, pertanyakan.
- Gunakan pemeriksaan kewarasan: misalnya, acak label dan lihat apakah AUC turun ke acak (jika tidak, ada kebocoran).
Bias dan Kualitas Data: Dataset glaucoma publik sering berasal dari populasi yang sempit (misalnya ORIGA dari Singapura) (pubmed.ncbi.nlm.nih.gov). Model yang disetel untuk itu mungkin tidak dapat digeneralisasi. Eksperimen warga harus mencatat batasan ini. Idealnya, beberapa dataset (dari kohort yang berbeda) digunakan untuk memeriksa apakah temuan itu kuat.
Petunjuk Palsu (“Teater Penelitian”): Menjalankan banyak eksperimen terasa produktif, tetapi jika setiap peningkatan hanya pada dataset sintetik atau sepele, itu mungkin tidak bermanfaat bagi pasien. Untuk menghindari ini:
- Fokus pada tugas-tugas dengan relevansi klinis (misalnya deteksi dini dari OCT rutin).
- Kaitkan hasil dengan ukuran nyata jika memungkinkan (misalnya AUC untuk progresi, bukan hanya delta loss kecil).
- Prioritaskan interpretasi: jika agen “menemukan” biomarker baru, coba pastikan itu masuk akal (misalnya, apakah itu berfokus pada perubahan anatomi yang diketahui?).
Tidak Ada Jaminan Klinis: Harus sangat jelas: output dari loop ini adalah pembuatan hipotesis, bukan nasihat medis. Model yang menyarankan obat baru harus diperiksa di laboratorium sebelum digunakan pada pasien mana pun. Klaim berlebihan berbahaya. Beri label semua hasil yang dibagikan dengan penafian: “Ini adalah eksplorasi AI dan bukan temuan yang telah ditinjau sejawat.”
Keterbatasan “Model Kecil”: Jaringan yang sangat kecil memiliki kapasitas terbatas. Mereka mungkin melewatkan pola kompleks. Sebaliknya, model besar sering melihat terobosan tetapi membutuhkan data besar. Di sini kami menerima cakupan terbatas: harapannya adalah bahkan peningkatan kecil dapat memandu penelitian. Tetapi kita tidak boleh berharap model ini menggantikan deep learning pada data masif. Mereka paling baik dalam mencoba ide-ide yang jelas dengan cepat.
Keandalan Agen: Agen (misalnya GPT-4) mungkin berhalusinasi atau menyimpang. Penting agar hasil dapat direproduksi: setelah agen berjalan, manusia harus memeriksa perubahan apa yang dipertahankan dan menjalankan kembali pelatihan untuk mengonfirmasi metrik. Jaga agar agen jujur dengan menyertakan pernyataan dalam program.md seperti “hanya menerima peningkatan aktual dalam metrik evaluasi”.

Meskipun ada tantangan ini, perlindungan utama adalah transparansi dan follow-up kritis. Dokumentasikan semuanya. Ketika sebuah model menunjukkan pola, verifikasi itu. Jika banyak ilmuwan warga melihat anomali yang sama (misalnya, semua model AUC tinggi untuk tugas OCT menekankan daerah retina nasal), itu memperkuat kasus tersebut. Tujuannya adalah mempercepat fase pembuatan ide, bukan menghindari ilmu pengetahuan yang cermat sesudahnya.

Kesimpulan

Glaucoma adalah penyakit kebutaan kompleks yang diam-diam, dengan banyak kebutuhan penelitian yang belum terpenuhi – mulai dari melindungi neuron hingga memulihkan penglihatan. Pada saat yang sama, AI telah mendemokratisasi eksperimen: satu orang dengan GPU dan sedikit tekad dapat menjalankan pencarian hyperparameter otomatis yang secara manual akan memakan waktu berminggu-minggu bagi tim. Kerangka autoresearch Karpathy pada dasarnya menyerahkan setiap warga negara asisten laboratorium AI. Dengan menulis tujuan tingkat tinggi yang jelas di Markdown, peneliti komunitas dapat membiarkan agen menelusuri produk dan langsung menuju lead yang menjanjikan.

Kami telah menguraikan bagaimana ini dapat dilakukan dalam praktik: mengidentifikasi tugas ML glaucoma, memilih data (gambar fundus dan OCT, bidang visual, dataset molekuler), mendefinisikan model dan metrik, serta menggunakan instruksi program untuk memandu pencarian. Kami membuat sketsa peta jalan komunitas 90 hari dan mencatat jembatan ke dokter untuk memastikan bahwa output yang berharga dapat menginformasikan ilmu glaucoma yang sebenarnya. Pendekatan ini sangat “ilmu pengetahuan warga”: membuka alat penemuan ilmiah dengan cara yang mudah diakses, sambil tetap mengandalkan pengawasan ahli di mana pun itu penting.

Sitasi: Kami telah merujuk pada sumber daya terbaru dalam penelitian glaucoma dan AI. Fakta-fak fakta kunci (prevalensi penyakit, separuh tidak terdiagnosis (physionet.org)), terapi yang menjanjikan (implan CNTF (pmc.ncbi.nlm.nih.gov), penyuntingan gen (pmc.ncbi.nlm.nih.gov)), dan jebakan tersembunyi (AI dalam pencitraan (pmc.ncbi.nlm.nih.gov)) didasarkan pada literatur terkini. Autoresearch itu sendiri dijelaskan dalam walkthrough Karpathy (medium.com) dan tinjauan (www.theneuron.ai). Ini seharusnya memberikan kredibilitas pada visi yang digariskan di sini.

Pada akhirnya, kami berharap pembaca merasa diberdayakan: jika Anda seorang pasien, pengasuh, atau penggemar yang bersemangat, Anda bisa menjadi bagian dari pendorong penelitian glaucoma ke depan. Alat dan data ada, masalahnya jelas, dan dengan koordinasi serta agen AI, kita dapat mempercepat pembelajaran. Seperti halnya penelitian apa pun, perjalanan akan memiliki awal yang salah, tetapi bahkan kegagalan pun mengajarkan kita sesuatu – seringkali mengarahkan pikiran manusia menuju pendekatan yang benar. Dengan mata terbuka lebar terhadap kemungkinan dan jebakan, autoresearch yang dipimpin warga bisa menjadi pelengkap yang kuat untuk ilmu glaucoma tradisional.

Mulai Di Sini

Cara termudah untuk memulai autoresearch untuk glaucoma hari ini: Jalankan klasifikasi kecil pada gambar fundus ORIGA.

Dapatkan datanya: Unduh dataset ORIGA-light (650 gambar fundus retina berlabel normal vs glaucoma) (pubmed.ncbi.nlm.nih.gov). Bagi sekitar 80% pelatihan / 20% validasi.
Model awal: Gunakan atau adaptasi skrip sampel dari karpathy/autoresearch untuk klasifikasi gambar. Misalnya, sedikit kode untuk memuat gambar ORIGA dan melatih CNN kecil (2–3 lapisan konvolusi) untuk membedakan glaucoma vs sehat.
Tulis program.md: Dalam teks, tetapkan tujuan untuk “memaksimalkan validasi AUC untuk deteksi glaucoma”, dan instruksikan agen bahwa ia dapat menyesuaikan kedalaman model, learning rate, dll. Misalnya:

Tujuan: Memaksimalkan AUC pada glaucoma vs normal untuk dataset ORIGA.

Agen harus mencoba menyesuaikan ukuran lapisan konvolusional, jumlah filter, dan learning rate. Setiap percobaan adalah 5 menit pelatihan. Jika validasi AUC meningkat, pertahankan perubahan. Ulangi.

Jalankan loop: Luncurkan autoresearch (arahkan ke prepare.py, train.py, dan program.md Anda). Biarkan berjalan selama beberapa jam atau semalaman pada RTX 3060 Anda. Ini akan melakukan ~100 eksperimen secara otomatis.
Periksa hasilnya: Periksa konsol atau log untuk melihat AUC validasi terbaik yang dicapai (seharusnya >0.8 jika semuanya berjalan lancar). Anda sekarang memiliki model dan skrip pelatihan yang disempurnakan oleh agen AI.

Eksperimen akhir pekan sederhana ini sudah memberi Anda pengalaman langsung dalam membangun pipeline ML tanpa menulis kode baru secara manual. Dokumentasikan apa yang Anda coba dan bagikan program.md serta hasil Anda dengan komunitas. Setiap keberhasilan kecil (peningkatan AUC, perubahan jaringan yang menarik) adalah building block. Anda secara harfiah menginstruksikan AI untuk melakukan penelitian pada masalah glaucoma pilihan Anda – dan dengan demikian, Anda belajar ilmu data glaucoma dan memiliki harapan untuk membuat perbedaan dalam memahami atau mengobati kehilangan penglihatan.

Semoga berhasil! Jaga pertanyaan dan temuan tetap open-source, dan ingat: ini adalah alat mainan penelitian, bukan nasihat medis. Periksa run Anda dengan cermat dan nikmati proses penemuan.

**`

Mata Terbuka Lebar: Bagaimana Kerangka Autoresearch Karpathy Dapat Mendemokratisasi Penelitian Glaucoma — Sebuah Cetak Biru untuk Penemuan yang Dipimpin Pasien dan Didorong AI dalam Pemulihan Penglihatan