Mở Rộng Tầm Mắt: Khung Autoresearch của Karpathy Có Thể Dân Chủ Hóa Nghiên Cứu Bệnh Tăng Nhãn Áp Như Thế Nào

Giới thiệu

Bệnh tăng nhãn áp (glaucoma) là một bệnh thần kinh thị giác mãn tính dần dần phá hủy các tế bào hạch võng mạc (RGCs) và dẫn đến mất thị lực không hồi phục. Bệnh ảnh hưởng đến hàng triệu người trên toàn thế giới – ước tính 64,3 triệu người vào năm 2013, dự kiến sẽ tăng lên hơn 110 triệu vào năm 2040 (physionet.org). Đáng lo ngại là khoảng một nửa số trường hợp không được chẩn đoán cho đến khi thị lực đã bắt đầu suy giảm (physionet.org). Chăm sóc bệnh tăng nhãn áp truyền thống tập trung vào việc hạ áp lực nội nhãn (IOP) thông qua thuốc hoặc phẫu thuật, nhưng những phương pháp điều trị này không thể đảo ngược tổn thương hoặc ngăn ngừa hoàn toàn tình trạng mù lòa (pmc.ncbi.nlm.nih.gov) (physionet.org). Do đó, có một nhu cầu cấp thiết về khám phá mới trong các lĩnh vực như bảo vệ thần kinh, tái tạo RGC/dây thần kinh thị giác, và các liệu pháp gen và tế bào đổi mới. Tuy nhiên, nghiên cứu học thuật và dược phẩm trên các lĩnh vực này vẫn còn thiếu nguồn lực, một phần vì chúng là những nỗ lực dài hạn, rủi ro cao. Trong khi đó, những tiến bộ trong học máy (ML) và trí tuệ nhân tạo (AI) đang thúc đẩy các phương pháp mới để phân tích dữ liệu và thiết kế tạo sinh.

Các công trình gần đây (ví dụ, dự án “autoresearch” của Andrej Karpathy (www.theneuron.ai) (medium.com)) cho thấy các tác nhân AI có thể tự động chạy hàng trăm thí nghiệm nhỏ trên một GPU duy nhất chỉ dựa trên các hướng dẫn cấp cao đơn giản. Trong mô hình này, một người viết một tệp program.md ngắn mô tả mục tiêu nghiên cứu, và một tác nhân AI lặp lại điều chỉnh mô hình hoặc siêu tham số, chạy các lần huấn luyện 5 phút, giữ lại những thay đổi thành công và loại bỏ những thay đổi khác (medium.com) (www.theneuron.ai). Chỉ sau một đêm, vòng lặp này có thể thực hiện khoảng 100 thí nghiệm, khám phá không gian kiến trúc và tham số mà không cần lập trình thủ công.

Bài viết này khám phá cách khung autoresearch của Karpathy có thể được áp dụng vào nghiên cứu bệnh tăng nhãn áp bởi các bệnh nhân có động lực, người chăm sóc, nhà khoa học công dân và các nhà phát triển mã nguồn mở. Chúng tôi sẽ khảo sát các lĩnh vực nghiên cứu bệnh tăng nhãn áp ít được khám phá (bảo vệ thần kinh, tái tạo, v.v.) và xác định các nhiệm vụ học máy trong mỗi lĩnh vực mà thử nghiệm mô hình nhỏ có thể giúp ích. Đối với mỗi nhiệm vụ, chúng tôi đề xuất các tập dữ liệu công khai cụ thể, các mô hình/kiến trúc cơ sở, các chỉ số đánh giá và phác thảo các hướng dẫn program.md của tác nhân có thể trông như thế nào. Sau đó, chúng tôi thảo luận về các bước thực tế để một cộng đồng thiết lập và chia sẻ các thí nghiệm như vậy, bao gồm các cân nhắc về phần cứng, chuẩn bị dữ liệu và nền tảng hợp tác. Chúng tôi xem xét ngữ cảnh cụ thể của các liệu pháp phục hồi thị lực và liệu các vòng lặp kiểu autoresearch có thể tăng tốc tối ưu hóa bộ phận giả thần kinh hoặc các can thiệp khác hay không. Cuối cùng, chúng tôi đề cập đến cách các giả thuyết do công dân tạo ra có thể được xác thực và chuyển đến các bác sĩ lâm sàng, đồng thời đưa ra một lộ trình 90 ngày cụ thể để khởi động một sáng kiến autoresearch do bệnh nhân dẫn dắt – bao gồm cách tránh những cạm bẫy của “nghiên cứu hình thức” và đảm bảo tác động thực sự. Xuyên suốt bài viết, chúng tôi trích dẫn các nguồn hiện tại về nghiên cứu bệnh tăng nhãn áp và AI trong thị giác, nhằm mục đích đưa ra một hướng dẫn cân bằng, thực tế và dễ tiếp cận.

1. Bối cảnh nghiên cứu bệnh tăng nhãn áp & Nhu cầu chưa được đáp ứng

Nghiên cứu bệnh tăng nhãn áp bao gồm nhiều khía cạnh – từ việc tìm hiểu cơ chế bệnh đến phát triển các liệu pháp mới để bảo vệ thần kinh và phục hồi thị lực. Nhiều lĩnh vực đầy hứa hẹn đang thiếu nguồn lực:

Bảo vệ thần kinh: Các can thiệp bảo vệ RGCs khỏi chết (độc lập với IOP). Ví dụ bao gồm các yếu tố dinh dưỡng thần kinh và hỗ trợ chuyển hóa. Chẳng hạn, cấy ghép giải phóng yếu tố dinh dưỡng thần kinh thể mi (CNTF) đã cho thấy tiềm năng trong các thử nghiệm ban đầu (pmc.ncbi.nlm.nih.gov), và các phân tử khác như yếu tố tăng trưởng thần kinh và citicoline đang được nghiên cứu (pmc.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Tuy nhiên, những phương pháp này vẫn chưa phải là chăm sóc tiêu chuẩn, và cần nhiều công việc hơn để đưa chúng đến bệnh nhân. Một đánh giá năm 2025 cảnh báo rằng các liệu pháp bảo vệ thần kinh cho bệnh tăng nhãn áp là một “phương pháp điều trị trong tương lai” cần các thử nghiệm sâu hơn (pmc.ncbi.nlm.nih.gov), phản ánh một nhu cầu chưa được đáp ứng.
Tái tạo RGC & Tái tạo dây thần kinh thị giác: Một khi RGCs và sợi trục của chúng chết, y học hiện tại không có cách nào để đảo ngược điều đó. Một số nghiên cứu trên động vật sử dụng liệu pháp gen để lập trình lại RGCs hoặc kích thích tái tạo. Ví dụ, việc ức chế PTEN (một bộ điều hòa tăng trưởng tiêu cực) dựa trên CRISPR đã thúc đẩy tái tạo sợi trục trong tế bào thần kinh chuột (pmc.ncbi.nlm.nih.gov), và các thí nghiệm đồng loại bỏ PTEN và SOCS3 đã thúc đẩy tái tạo dây thần kinh thị giác bền vững ở chuột (pmc.ncbi.nlm.nih.gov). Tuy nhiên, những đột phá này vẫn còn trong các mô hình phòng thí nghiệm. Sinh học cơ bản – ví dụ: làm thế nào để tái tạo sự phát triển của võng mạc hoặc vượt qua các chất ức chế tăng trưởng – rất phức tạp. Có một nhu cầu lớn về các phương thức (phân tử nhỏ, gen, vật liệu sinh học) có thể kích thích sự sống sót của RGC hoặc tái tạo sợi trục, nhưng tiến bộ đến các thử nghiệm trên người rất chậm.
Liệu pháp Gen và Tế bào: Các công nghệ mới như CRISPR, vector virus và RGC có nguồn gốc từ tế bào gốc hứa hẹn nhiều tiềm năng cho bệnh tăng nhãn áp. Các chiến lược bao gồm chỉnh sửa gen để giảm IOP (ví dụ: nhắm mục tiêu sản xuất thủy dịch) hoặc điều hòa các con đường thoái hóa thần kinh (pubmed.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Tế bào gốc có thể (về lý thuyết) thay thế các tế bào bè trabecular hoặc RGCs đã mất và tiết ra các yếu tố bảo vệ (pubmed.ncbi.nlm.nih.gov). Công trình ban đầu đã chỉ ra rằng một số yếu tố phiên mã nhất định (ví dụ: Oct4-Sox2-Klf4) có thể lập trình lại các tế bào không phải RGC thành các tế bào thần kinh giống RGC ở chuột (phục hồi thị lực trong chấn thương dây thần kinh thị giác) (pmc.ncbi.nlm.nih.gov). Tuy nhiên, những phương pháp này phải đối mặt với các thách thức về an toàn và phân phối trước khi tiếp cận bệnh nhân. Một số đánh giá gần đây nhấn mạnh liệu pháp gen là một biên giới thú vị nhưng chưa lâm sàng cho bệnh tăng nhãn áp (pubmed.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Tóm lại, những đổi mới về phân tử và tế bào đang tiến triển, nhưng nguồn lực và dữ liệu thử nghiệm còn hạn chế – tạo cơ hội cho việc khám phá tính toán (ví dụ: thiết kế cấu trúc virus tối ưu hoặc dự đoán các chỉnh sửa gen hiệu quả).
Kích thích Điện và Quang di truyền để Phục hồi Thị lực: Đối với bệnh nhân bị bệnh tăng nhãn áp nặng (hoặc các bệnh kết hợp như viêm võng mạc sắc tố), bộ phận giả thị giác nhân tạo hoặc liệu pháp quang di truyền nhằm mục đích bỏ qua các RGC bị tổn thương. Cấy ghép võng mạc (mảng điện cực biểu mô hoặc dưới võng mạc) và cấy ghép vỏ não đã tạo ra các cảm nhận nhân tạo (“phosphenes”), nhưng độ phân giải thấp và kết quả thay đổi rộng rãi. Một đánh giá năm 2025 gần đây về AI trong bộ phận giả thị giác lưu ý rằng “các thuật toán AI cho thấy hứa hẹn trong việc tối ưu hóa thị giác nhân tạo, đặc biệt thông qua việc tăng cường trích xuất độ nổi bật hình ảnh và các chiến lược kích thích,” mặc dù cho đến nay hầu hết các nghiên cứu chỉ là mô phỏng (pmc.ncbi.nlm.nih.gov). Nói cách khác, học máy có thể giúp biến hình ảnh camera thành các mẫu kích thích mang tính thông tin nhất dựa trên giới hạn của thiết bị. Quang di truyền (làm cho các tế bào võng mạc còn sống sót nhạy cảm với ánh sáng) và kích thích điện xuyên giác mạc (TES) cũng đang được thử nghiệm cho tình trạng mất thị lực liên quan đến bệnh tăng nhãn áp. Tất cả các lĩnh vực này đều cần điều chỉnh tham số rộng rãi (ví dụ: các mẫu kích thích không gian-thời gian, vector biểu hiện gen) — các nhiệm vụ có khả năng phù hợp với tìm kiếm ML tự động.
Các Cơ chế Độc lập với IOP: Nhiều người tiếp tục mất thị lực mặc dù IOP được kiểm soát tốt. Các yếu tố như lưu lượng máu mắt bị suy yếu, rối loạn chức năng thần kinh mạch máu hoặc căng thẳng trao đổi chất ở đầu dây thần kinh thị giác được công nhận nhưng chưa được hiểu đầy đủ. Các nghiên cứu di truyền cho thấy các thành phần “độc lập với IOP” đáng kể của nguy cơ bệnh tăng nhãn áp (pubmed.ncbi.nlm.nih.gov) (pubmed.ncbi.nlm.nih.gov). Các dấu ấn sinh học của các quá trình này (ngoài áp lực) đang rất cần thiết. Ngoài ra, một nửa số bệnh nhân tăng nhãn áp có bệnh “áp lực bình thường”, cho thấy IOP cao không phải là nguyên nhân duy nhất. Nghiên cứu về các yếu tố mạch máu hoặc các con đường tổn thương khác đang diễn ra nhưng bị phân mảnh. Mô hình hóa tính toán hoặc khai thác các tập dữ liệu lớn (ví dụ: các nghiên cứu liên kết toàn bộ bộ gen) có thể giúp xác định các cơ chế hoặc mục tiêu điều trị mới trong lĩnh vực này.
Khám phá Dấu ấn Sinh học thông qua Hình ảnh và Trường thị giác: Phát hiện sớm và theo dõi bệnh tăng nhãn áp thường dựa vào hình ảnh (ảnh đáy mắt, OCT) và các xét nghiệm chức năng (trường thị giác). Các thuật toán nâng cao có thể khám phá các dấu ấn sinh học tinh tế mà các bác sĩ lâm sàng bỏ lỡ. Ví dụ, học sâu đã bắt đầu phát hiện mất thị trường trước khi có triệu chứng (những thay đổi không thể nhìn thấy bằng phân tích trường tiêu chuẩn) (pmc.ncbi.nlm.nih.gov). Tương tự, AI đã được sử dụng để phân tích hồ sơ độ dày lớp OCT để dự đoán bệnh tăng nhãn áp trước khi có tổn thương rõ ràng. Tuy nhiên, chưa có dấu ấn sinh học AI nào được chấp nhận rộng rãi được sử dụng lâm sàng để sàng lọc hoặc phân tầng rủi ro. Các nút thắt cổ chai về tính toán ở đây bao gồm nhu cầu về các tập dữ liệu lớn, được dán nhãn tốt và các giao thức xác thực mạnh mẽ (pmc.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Các thử thách công khai (REFUGE, AIROGS, v.v.) đã bắt đầu chuẩn hóa dữ liệu, nhưng phạm vi bao phủ bệnh giai đoạn đầu còn mỏng (pmc.ncbi.nlm.nih.gov). Việc khám phá dấu ấn sinh học đa phương thức (kết hợp OCT, trường thị giác, di truyền học, v.v.) do máy tính điều khiển vẫn là một biên giới mở.

Học máy mô hình nhỏ có thể giúp gì? Nhiều điều trên mô tả các vấn đề cấp cao. Nút thắt cổ chai thường là sự khan hiếm dữ liệu, nhiều biến tương tác và sinh học chậm tiến. Nơi mà một tác nhân autoresearch tỏa sáng là ở tự động hóa các thí nghiệm quy mô nhỏ trên dữ liệu có sẵn. Ví dụ, nếu có một tập dữ liệu khiêm tốn gồm các ảnh quét OCT có và không có bệnh tăng nhãn áp sớm, một nhà khoa học công dân có thể thiết lập một vòng lặp kiểm tra mô hình nhanh chóng để tìm kiến trúc nào phân biệt chúng tốt nhất. Tương tự, các mô hình transformer nhỏ trên dữ liệu gen hoặc tài liệu có thể đề xuất các ứng viên gen hoặc thuốc mới. Điều quan trọng là tập trung vào các nhiệm vụ hẹp với các chỉ số xác định (độ chính xác phân loại, AUC, mất mát) và lặp lại nhanh chóng. Các lĩnh vực có dữ liệu công khai hạn chế (ví dụ: tham số TES hoặc các hỗn hợp gen mới lạ) có thể dựa vào dữ liệu tổng hợp hoặc các đại diện. Trong phần tiếp theo, chúng tôi sẽ ánh xạ các nhiệm vụ ML cụ thể trong bệnh tăng nhãn áp vào phương pháp autoresearch.

2. Ánh xạ Autoresearch tới các vấn đề bệnh tăng nhãn áp

Khung autoresearch của Karpathy không phụ thuộc vào lĩnh vực: nó có thể chạy các thí nghiệm trong bất kỳ nhiệm vụ ML nào được cung cấp bởi một prepare.py và train.py với một chỉ số đánh giá được xác định rõ ràng. Chúng tôi xác định một số nhiệm vụ cụ thể liên quan đến bệnh tăng nhãn áp và chỉ rõ cách một tác nhân có thể giải quyết từng nhiệm vụ. Mỗi trường hợp sử dụng dưới đây bao gồm: một tập dữ liệu công khai (nếu có thể), một mô hình hoặc kiến trúc khởi đầu, một chỉ số đánh giá và một bản phác thảo các hướng dẫn program.md.

2.1 Phân tích hình ảnh OCT (Phát hiện và Phân đoạn cấu trúc)

Nhiệm vụ: Phát hiện sớm bệnh tăng nhãn áp từ ảnh quét OCT. Hình ảnh OCT cung cấp các chế độ xem mặt cắt của các lớp võng mạc. Mỏng đi của lớp sợi thần kinh võng mạc (RNFL) và phức hợp tế bào hạch (GCC) có thể xảy ra trước khi mất thị trường. Chúng ta có thể coi đây là một nhiệm vụ phân loại (tăng nhãn áp so với khỏe mạnh) hoặc hồi quy (ví dụ: xuất ra độ dày RNFL).
- Tập dữ liệu: Một bản phát hành gần đây, SYN-OCT (www.nature.com), là một tập dữ liệu tổng hợp gồm 200.000 hình ảnh OCT quanh nhú thị giác (100 nghìn tăng nhãn áp, 100 nghìn bình thường) được tạo bởi GANs. Mỗi hình ảnh có độ dày RNFL và mặt nạ phân đoạn liên quan. Chúng có sẵn công khai trên Zenodo (www.nature.com). (Mặc dù là tổng hợp, chúng được xác thực thống kê để mô phỏng OCT thực tế (www.nature.com).) Ngoài ra, người ta có thể sử dụng tập dữ liệu OCT-DL (www.nature.com) (2064 hình ảnh của các bệnh võng mạc khác nhau) hoặc các bộ sưu tập OCT lâm sàng nhỏ hơn.
- Mô hình: Bắt đầu với một mạng nơ-ron tích chập (CNN) nhỏ. Đối với phân loại, một mô hình với khoảng 3–5 lớp tích chập (ví dụ: tương tự như ResNet-18 bị cắt bớt, hoặc một CNN nhỏ tùy chỉnh) có thể hoạt động. Đối với phân đoạn RNFL/GCC, một bộ mã hóa-giải mã như một U-Net nhỏ (với độ sâu 3–4) là phù hợp. train.py ban đầu có thể triển khai một CNN đơn giản và vòng lặp huấn luyện, với các siêu tham số mặc định.
- Chỉ số: Nếu phân loại bệnh tăng nhãn áp trên OCT, hãy sử dụng AUC (Diện tích dưới đường cong ROC) hoặc độ chính xác trên một phần xác thực. Đối với phân đoạn, hãy sử dụng hệ số Dice hoặc IoU trên mặt nạ lớp RNFL (SYN-OCT cung cấp mặt nạ (www.nature.com)).
- Ví dụ program.md:
  
  "Mục tiêu: Tối đa hóa AUC xác thực để phát hiện bệnh tăng nhãn áp từ hình ảnh OCT. Các sửa đổi được phép: số lớp tích chập, số lượng bộ lọc, kích thước nhân, hàm kích hoạt, tốc độ học, lựa chọn bộ tối ưu hóa, kích thước lô, v.v. Sau mỗi lần huấn luyện 5 phút, đánh giá AUC trên tập dữ liệu giữ lại. Nếu AUC cải thiện, giữ lại thay đổi; nếu không, hoàn nguyên." (medium.com) (www.theneuron.ai).
  Tác nhân sẽ thử các biến thể (ví dụ: thêm lớp, điều chỉnh chiều rộng, chuyển từ Adam sang RMSProp) để cải thiện AUC.
Nhiệm vụ: Phân đoạn lớp RNFL/GCC. Đo độ dày RNFL một cách chính xác là rất quan trọng. Sử dụng ảnh quét OCT tổng hợp (với các phân đoạn được cung cấp) hoặc bất kỳ OCT thực nào với các lớp được chú thích, người ta có thể coi đây là một nhiệm vụ phân đoạn.
- Tập dữ liệu: SYN-OCT một lần nữa cung cấp mặt nạ phân đoạn RNFL (www.nature.com). Một nguồn khác: một số nhóm học thuật đã dán nhãn B-scans OCT (mặc dù thường là độc quyền). Nếu cần, người ta có thể sử dụng các tập dữ liệu phân đoạn OCT tổng quát (như thử thách dịch võng mạc Duke OCT (www.nature.com)) làm đại diện.
- Mô hình: Một CNN nhỏ giống U-Net, thậm chí có thể được cắt bớt kênh từ một mô hình cơ sở. Ví dụ, sử dụng 3 khối xuống/lên, bắt đầu với 16 bộ lọc. Tác nhân được phép thay đổi độ sâu và chiều rộng.
- Chỉ số: Điểm Dice hoặc IoU trung bình của mặt nạ RNFL dự đoán so với sự thật.
- Ví dụ program.md:
  
  "Mục tiêu: Tối đa hóa điểm Dice cho phân đoạn lớp RNFL trên OCT. Mô hình cơ sở là U-Net 3 khối. Tác nhân có thể thay đổi số lượng bộ lọc, thêm dropout hoặc thay đổi tốc độ học. Huấn luyện 5 phút mỗi lần thử và tính toán Dice trên tập xác thực. Giữ lại những sửa đổi làm tăng điểm Dice."
Nhiệm vụ: Dự đoán tiến triển thông qua OCT nối tiếp. Sử dụng OCT tuần tự, dự đoán sự mỏng đi trong tương lai. Nếu dữ liệu OCT dọc tồn tại (ví dụ: UK Biobank hoặc dữ liệu phòng khám tư nhân), mục tiêu có thể là dự đoán sự thay đổi RNFL hoặc nhãn nhị phân “tiến triển nhanh”.
- Tập dữ liệu: Dữ liệu OCT dọc công khai cụ thể cho bệnh tăng nhãn áp rất khan hiếm. Tuy nhiên, người ta có thể tái sử dụng dữ liệu thử thách SR OCT (hoặc hình ảnh SYN-OCT với tiến triển mô phỏng) để mô phỏng nhiệm vụ này. Ngoài ra, hãy sử dụng hình ảnh OCT của UK Biobank (mặc dù không cụ thể cho bệnh tăng nhãn áp và không dễ tiếp cận đối với các nhà khoa học công dân). Để minh họa, giả định một tập dữ liệu gồm các ảnh quét OCT tại thời điểm 0 và thời điểm 1 với các nhãn.
- Mô hình: Một CNN Siamese hoặc CNN nối tiếp nhận các cặp hình ảnh OCT, xuất ra xác suất tiến triển. Bắt đầu bằng cách đưa vào thời điểm 0 và dự đoán ngưỡng thời điểm 1.
- Chỉ số: AUC cho phân loại tiến triển nhị phân, hoặc MSE nếu cố gắng dự đoán sự thay đổi độ dày.
- Ví dụ program.md:
  
  "Mục tiêu: Xác định những mắt sẽ mất RNFL nhanh chóng. Đầu vào: OCT cơ bản; nhãn: >5μm mỏng đi sau 1 năm. Chúng tôi sử dụng bộ phân loại CNN. Các thay đổi được phép bao gồm độ sâu mạng, tốc độ học, tăng cường dữ liệu. Sử dụng AUC xác thực làm chỉ số."

2.2 Phân tích Trường thị giác (VF)

Nhiệm vụ: Dự đoán mất thị trường trong tương lai. Dựa trên một hoặc nhiều bài kiểm tra trường thị giác Humphrey (giá trị độ nhạy từng điểm) trong quá khứ, dự báo độ nhạy trong tương lai hoặc tốc độ tiến triển. Đây là một vấn đề quản lý bệnh tăng nhãn áp cổ điển.
- Tập dữ liệu: Tập dữ liệu GRAPE (www.nature.com) (2023) cung cấp dữ liệu theo dõi dọc của 263 mắt (1115 bản ghi) với VF và fundus/OCT, bao gồm cả tiến triển được chú thích. Một tài nguyên khác là cơ sở dữ liệu dọc UH Visual Field (UWHVF) của Hoa Kỳ (www.nature.com) (28.943 trường từ nhiều bệnh nhân). Tuy nhiên, GRAPE được quản lý tốt và công khai với cả VF và kết quả.
- Mô hình: Một cách tiếp cận đơn giản là mạng truyền thẳng (kết nối đầy đủ) trên dữ liệu VF 54 điểm (hoặc nén thành các chỉ số toàn cục). Để dự đoán tiến triển, một MLP nhỏ hơn hoặc 1D-CNN có thể xử lý 54 hoặc 30 tính năng đầu vào. Một ý tưởng khác: coi lưới 8×8 là một hình ảnh nhỏ và sử dụng một CNN nhỏ (ví dụ, nhân 3×3).
- Chỉ số: Nếu dự đoán độ lệch trung bình trong tương lai hoặc giá trị điểm, hãy sử dụng MSE (càng thấp càng tốt). Nếu phân loại “tiến triển nhanh so với không”, hãy sử dụng AUC.
- Ví dụ program.md:
  
  "Mục tiêu: Giảm thiểu MSE của trường thị giác dự đoán. Ngoài ra, tối đa hóa AUC để phân loại mất nhanh. Mô hình cơ sở: perceptron 2 lớp trên 54 giá trị VF. Tác nhân có thể điều chỉnh kích thước ẩn, kích hoạt, hoặc thêm dropout. Sau mỗi lần huấn luyện 5 phút, tính toán chỉ số trên tập xác thực."
Nhiệm vụ: Xác định bệnh nhân có tiến triển nhanh. Sử dụng một loạt các VF trong quá khứ, phân loại những mắt nào sẽ mất thị lực nhanh chóng.
- Tập dữ liệu: Sử dụng trạng thái tiến triển được chú thích trong GRAPE (www.nature.com) (họ đã đánh dấu các mắt là đã tiến triển). Hoặc lấy UWHVF và dán nhãn phần mười trên cùng của mất MD là “nhanh”.
- Mô hình: Có thể nối các tính năng từ hai hoặc ba trường liên tiếp (hoặc sự khác biệt) vào một mạng nhỏ. Có thể bao gồm IOP cơ bản và tuổi nếu có.
- Chỉ số: AUC để phân biệt giữa bệnh nhân tiến triển nhanh và chậm.
- Ví dụ program.md:
  
  "Mục tiêu: Tối đa hóa AUC để dự đoán tiến triển nhanh của trường. Các tính năng đầu vào: sự khác biệt bậc hai của VF1 & VF2, cộng với IOP. Sử dụng mạng FC nhỏ. Tác nhân có thể điều chỉnh chiều rộng lớp, tốc độ học, kích thước lô."

2.3 Sàng lọc Thuốc/Hợp chất (Khám phá ứng viên trên máy tính)

Nhiệm vụ: Dự đoán các hợp chất bảo vệ thần kinh/tái tạo tiềm năng. Sử dụng ML để tìm các phân tử nhỏ có thể bảo vệ RGCs hoặc khuyến khích tái tạo. Ví dụ, nhiều hợp chất đã biết (như nicotinamide, valproate) cho thấy tác dụng bảo vệ thần kinh. Chúng ta có thể huấn luyện các mô hình để nhận biết các kiểu hóa học tương quan với hiệu quả đã biết và sau đó tìm kiếm trong không gian hóa học.
- Tập dữ liệu: Điều này rất thách thức do thiếu cơ sở dữ liệu thuốc tăng nhãn áp chuyên dụng. Để thay thế, người ta có thể sử dụng các tập dữ liệu MolNet (ví dụ: ức chế HIV, tính thấm hàng rào máu não) hoặc bất kỳ tập dữ liệu hoạt tính sinh học nào. Ngoài ra, hãy lập danh sách các hợp chất đã được thử nghiệm trong các mô hình tổn thương dây thần kinh thị giác (từ khai thác tài liệu) với các nhãn. Trên thực tế, người ta có thể bắt đầu với một thuộc tính tổng quát hơn (ví dụ: dữ liệu về sự xâm nhập hàng rào máu não từ MoleculeNet).
- Mô hình: Một mô hình transformer nhỏ hoặc mạng nơ-ron đồ thị trên chuỗi SMILES. Một mô hình transformer (kiểu GPT-2) với ít lớp hoặc một mạng tích chập đồ thị đơn giản (ví dụ: 3 lớp GCN) có thể được triển khai trong train.py.
- Chỉ số: Nếu chúng ta coi là phân loại (hoạt tính so với không hoạt tính), hãy sử dụng AUROC. Nếu dự đoán ái lực hoặc logP, hãy sử dụng RMSE.
- Ví dụ program.md:
  
  "Mục tiêu: Tối đa hóa ROC-AUC phân loại để xác định các hợp chất giống bảo vệ thần kinh. Mô hình cơ sở: transformer nhỏ trên SMILES. Tác nhân có thể điều chỉnh số lượng lớp transformer, dropout, tốc độ học hoặc sử dụng các phép biểu diễn tính năng thay thế (ví dụ: đầu vào vân tay). Sau mỗi 5 phút, đánh giá AUC trên các phân tử xác thực."

(Lưu ý: Bởi vì dữ liệu công khai cho việc bảo vệ thần kinh thực tế rất khan hiếm, nhiệm vụ này mang tính minh họa nhiều hơn. Trên thực tế, các nhà khoa học công dân có thể tạo một tập dữ liệu tùy chỉnh về các hợp chất bảo vệ thần kinh đã biết so với nhóm đối chứng và tuân theo mẫu này.)

2.4 Mô hình hóa Mạng lưới điều hòa Gen (RGC đơn bào)

Nhiệm vụ: Xác định các tổ hợp TF tái tạo. Sử dụng dữ liệu RNA-seq đơn bào từ RGCs để tìm hiểu các mẫu phiên mã của sự tăng trưởng tái tạo. Ví dụ, một số phân nhóm RGC tái tạo tốt hơn những phân nhóm khác. Một mô hình ML có thể dự đoán một nhãn “trạng thái tái tạo”, và người ta có thể kiểm tra xem yếu tố phiên mã nào là quan trọng.
- Tập dữ liệu: Một nghiên cứu năm 2018 cung cấp bộ gen phiên mã đơn bào RGC (mã truy cập GEO GSE115404) (pmc.ncbi.nlm.nih.gov), xác định các phân nhóm RGC riêng biệt. Chúng ta có thể sử dụng tập dữ liệu này (hoặc một tập con) trong đó các tế bào được dán nhãn theo phân nhóm hoặc theo điều kiện thử nghiệm (ví dụ: trước so với sau chấn thương).
- Mô hình: Một mô hình transformer nhỏ hoặc MLP hoạt động trên các vector biểu hiện gen (mỗi tế bào có hàng ngàn gen phong phú). Trên thực tế, người ta sẽ chọn trước khoảng 500 gen hàng đầu (ví dụ: các gen có tính biến đổi cao). train.py có thể triển khai một mô hình transformer mini (ví dụ: 4 lớp, nhúng 256) hoặc perceptron 2 lớp đơn giản.
- Chỉ số: Nếu sử dụng phân tích không giám sát, người ta có thể sử dụng điểm silhouette, nhưng đơn giản hơn, nếu dán nhãn tế bào là “đang tái tạo” so với “không” (nếu có nhãn), hãy sử dụng độ chính xác/AUC phân loại.
- Ví dụ program.md:
  
  "Mục tiêu: Xây dựng một mô hình phân biệt hồ sơ biểu hiện gen RGC tái tạo so với không tái tạo. Bắt đầu với một transformer 3 lớp. Tác nhân có thể thay đổi kích thước nhúng, độ sâu, tốc độ học hoặc thêm batchnorm. Tối ưu hóa độ chính xác xác thực."
  Sau các lần chạy, trọng số chú ý hoặc các tính năng đã học của mô hình tốt nhất có thể làm nổi bật các yếu tố phiên mã chính để thử nghiệm.

2.5 Phân tích Tín hiệu Điện sinh lý

Nhiệm vụ: Phát hiện rối loạn chức năng RGC dưới lâm sàng thông qua ERG. Điện võng mạc đồ mẫu (pERG) hoặc các tín hiệu điện sinh lý khác có thể tiết lộ sức khỏe RGC. Ví dụ, phản ứng ERG bị trì hoãn hoặc giảm có thể xảy ra trước các khiếm khuyết thị trường. Chúng ta có thể cố gắng phân loại các tín hiệu là “bình thường” so với “nghi ngờ tăng nhãn áp”.
- Tập dữ liệu: Các tập dữ liệu ERG công khai trong bệnh tăng nhãn áp rất hiếm. Người ta có thể sử dụng một cái thay thế: một tập dữ liệu từ động vật (thoái hóa võng mạc) hoặc các tín hiệu tổng hợp. Nếu không có sẵn, ngay cả các tập dữ liệu điện sinh lý 1D tổng quát (ví dụ: ECG) cũng có thể minh họa quy trình.
- Mô hình: Một CNN 1D (ví dụ: 2 lớp tích chập sau đó là FC) trên dữ liệu chuỗi thời gian. Ngoài ra, có thể sử dụng LSTM nếu chuỗi dài hơn.
- Chỉ số: Độ chính xác hoặc AUC trong việc phân loại một rối loạn chức năng tinh tế so với bình thường. Có thể là F1 nếu các lớp không cân bằng.
- Ví dụ program.md:
  
  "Mục tiêu: Tối đa hóa độ chính xác xác thực để phân loại dấu vết ERG (mẫu khỏe mạnh so với tăng nhãn áp sớm). Sử dụng CNN 1D. Tác nhân có thể điều chỉnh kích thước bộ lọc, bước nhảy hoặc thêm lớp hồi quy. Giữ lại bất kỳ thay đổi nào cải thiện độ chính xác."

2.6 Khai thác Tài liệu (Tạo Giả thuyết)

Nhiệm vụ: Tinh chỉnh một mô hình ngôn ngữ nhỏ để đưa ra những hiểu biết mới. Với hàng ngàn bài báo nghiên cứu bệnh tăng nhãn áp trong PubMed, một tác nhân ML có thể tìm kiếm các mối liên hệ hoặc tái sử dụng các ứng viên. Chẳng hạn, liên kết các con đường bảo vệ thần kinh với các loại thuốc hiện có. Chúng ta có thể coi đây là một vấn đề mô hình ngôn ngữ hoặc là một vấn đề truy xuất.
- Tập dữ liệu: Tổng hợp một kho tàng các bản tóm tắt liên quan đến bệnh tăng nhãn áp (ví dụ: sử dụng tìm kiếm PubMed cho “liệu pháp gen tăng nhãn áp”, v.v.). Người ta có thể tải xuống khoảng 10.000 bản tóm tắt thông qua API của NCBI. Để bắt đầu đơn giản hơn, hãy sử dụng các bài báo tăng nhãn áp truy cập mở của PMC.
- Mô hình: Một mô hình ngôn ngữ transformer nhỏ (ví dụ: GPT-2 6 lớp) hoặc thậm chí BERT được tinh chỉnh. Cho mục đích autoresearch, chúng ta có thể tinh chỉnh một mô hình nhân quả (GPT) trên văn bản.
- Chỉ số: Thông thường, mất mát xác thực (độ khó) được tối ưu hóa. Nếu thực hiện phân loại (ví dụ: cho một bản tóm tắt, dự đoán một nhãn cho một loại thuốc hoặc con đường), hãy sử dụng độ chính xác/AUC.
- Ví dụ program.md:
  
  "Mục tiêu: Giảm thiểu độ khó xác thực của một GPT-2 nhỏ trên kho tàng tài liệu tăng nhãn áp. Sử dụng các lần tinh chỉnh 5 phút. Tác nhân có thể thay đổi số lượng lớp, kích thước ẩn, tốc độ học, độ dài ngữ cảnh. Giữ lại những thay đổi làm giảm độ khó."
  Khi đã được huấn luyện, người ta có thể yêu cầu mô hình này tạo ra các giả thuyết (ví dụ: “Các loại thuốc tiềm năng hàng đầu có thể tái sử dụng để bảo vệ thần kinh trong bệnh tăng nhãn áp: ...”).

Trong mỗi lĩnh vực này, điều quan trọng là một GPU duy nhất và các lần chạy ngắn cho phép nhiều lần thử nghiệm. Chúng ta không mong đợi tác nhân sẽ viết mã các thuật toán mới từ đầu mà là điều chỉnh một tập lệnh huấn luyện hiện có. Vai trò của con người là viết program.md để hướng dẫn tìm kiếm của tác nhân hướng tới một mục tiêu cụ thể liên quan đến bệnh tăng nhãn áp (như tối đa hóa AUC trên tập dữ liệu đáy mắt hoặc dự đoán độ dày RNFL). Các ví dụ trên minh họa cách train.py có thể được thiết lập ban đầu và cách program.md nhắc nhở cải thiện một chỉ số đã chọn (medium.com) (www.theneuron.ai).

3. Hướng dẫn Triển khai Khoa học Công dân Thực tế

Làm thế nào để những cá nhân có động lực với nguồn lực hạn chế (ví dụ: một RTX 3060 hoặc một MacBook với Apple Silicon) thực sự áp dụng autoresearch vào các vấn đề về bệnh tăng nhãn áp? Tin tốt là kho lưu trữ của Karpathy nhỏ và có hướng dẫn để thu nhỏ. Dưới đây là các bước và mẹo chính:

Thiết lập môi trường: Clone kho lưu trữ karpathy/autoresearch. Bạn sẽ cần một Python hiện đại và lý tưởng là quyền truy cập LLM (bản thân tác nhân thường là một LLM đã được huấn luyện trước như GPT-4 hoặc Claude để chỉnh sửa mã). Đối với GPU, hãy cài đặt PyTorch với hỗ trợ CUDA/metal phù hợp. Đối với Apple Silicon, hãy sử dụng một trong các nhánh (ví dụ: MLX) hoặc một bản dựng PyTorch cho M1/M2 (xem tài liệu của kho lưu trữ). Trên Windows/Linux với 3060 hoặc 4070, PyTorch CUDA thông thường hoạt động.
Cấu hình cho GPU nhỏ: Autoresearch mặc định sử dụng một mô hình giống GPT với khoảng 50 triệu tham số và chuỗi độ dài 1024 (medium.com), có thể khá nặng. Đối với GTX 3060 (12GB), bạn nên giảm kích thước mô hình và độ dài chuỗi. Trong train.py, đặt MAX_SEQ_LEN=512 hoặc thậm chí 256. Giảm số lượng lớp và chiều rộng (GPT trung bình có khoảng 8 lớp; hãy thử 4 lớp, chiều rộng 256). Các hướng dẫn trong cộng đồng đề cập đến việc giảm “DEPTH”, “WIDTH”, v.v. Bạn cũng có thể giảm bộ nhớ của bộ tối ưu hóa bằng cách sử dụng kích thước lô nhỏ hơn (thậm chí 16 hoặc 8). Tác nhân vẫn có thể thay đổi các tham số này, nhưng việc cung cấp cho nó một điểm khởi đầu nhỏ hơn đảm bảo các lần chạy <5 phút. README và các cuộc thảo luận về vấn đề của autoresearch GitHub cũng lưu ý rằng chip Mac M1 có thể xử lý các chuỗi ngắn hơn (ví dụ: 256 token) do bộ nhớ hạn chế; việc điều chỉnh tương tự cũng áp dụng cho bất kỳ GPU nào.
Chuẩn bị dữ liệu bệnh tăng nhãn áp: Dữ liệu của mỗi nhiệm vụ phải được tải và chia nhỏ. Các tập dữ liệu tăng nhãn áp công khai bao gồm:
- Tập dữ liệu đáy mắt: ORIGA(-light) (650 hình ảnh được dán nhãn (pubmed.ncbi.nlm.nih.gov)), RIM-ONE DL (485 hình ảnh với phân đoạn cốc/đĩa (github.com)), REFUGE (hơn 1200 hình ảnh, với các phần huấn luyện/kiểm tra (refuge.grand-challenge.org)), Tập dữ liệu Glaucoma Hillel Yaffe mới (HYGD) với khoảng 1200 hình ảnh đáy mắt và các nhãn chất lượng cao (physionet.org). EyePACS/AIROGS (hàng chục nghìn hình ảnh võng mạc) cũng có thể truy cập công khai thông qua đăng ký (ví dụ: Kaggle).
- Tập dữ liệu OCT: SYN-OCT (200k B-scans tổng hợp với mặt nạ RNFL (www.nature.com) (www.nature.com)), OCTDL (2064 hình ảnh của các bệnh võng mạc khác nhau (www.nature.com)), và các tập dữ liệu khác từ các thử thách công khai.
- Dữ liệu thị trường: GRAPE (263 mắt với VF dọc và hình ảnh (www.nature.com)). UWHVF (28k bài kiểm tra VF) mở nếu bạn tải xuống từ kho lưu trữ của Đại học Washington (www.nature.com). Một số thử thách Kaggle bao gồm dữ liệu VF.
- Điện sinh lý: Không có tập dữ liệu ERG tăng nhãn áp lớn nào được biết đến, nhưng người ta có thể bắt đầu với bất kỳ dữ liệu tín hiệu bình thường so với tăng nhãn áp nào có thể truy cập được.
- Dữ liệu hóa chất/gen: Các tập dữ liệu tiêu chuẩn như MoleculeNet (cho hợp chất) hoặc GEO (cho gen) có thể được tái sử dụng. Ví dụ, tải xuống số lượng thô GSE115404 (thông qua truy vấn GEO (pmc.ncbi.nlm.nih.gov)) và tiền xử lý thành ma trận biểu hiện.
Đối với mỗi cái, bạn cần một prepare.py tải dữ liệu và định nghĩa train_set, val_set, và một hàm đánh giá. Mẫu của Karpathy mong đợi prepare.py xuất ra dữ liệu huấn luyện và một quy trình đánh giá trả về một mất mát hoặc chỉ số. Ví dụ, prepare.py cho RIM-ONE có thể tải hình ảnh và CC được dán nhãn là bệnh tăng nhãn áp, chia thành các thư mục huấn luyện/xác thực, và định nghĩa một hàm tính toán AUC xác thực. THAM KHẢO [14†L71-L79] để biết cấu trúc của RIM-ONE.
Điều chỉnh dữ liệu cho quy mô nhỏ: Nếu các tập dữ liệu lớn (như EyePACS hoặc SYN-OCT), bạn có thể lấy mẫu con để tạo một tập dữ liệu “nhỏ” chỉ vài trăm ví dụ (mô hình vẫn có thể học được điều gì đó có giá trị trên một tập hợp nhỏ). Kho lưu trữ autoresearch thậm chí còn đề cập đến việc sử dụng các tập dữ liệu nhỏ kiểu “TinyStories” để chạy trên phần cứng nhỏ. Ví dụ, chọn 500 hình ảnh từ ORIGA (cân bằng), hoặc 1000 trường VF từ GRAPE. Tương tự, đối với ngôn ngữ, người ta có thể sử dụng một tập con gồm 5.000 bản tóm tắt các bài báo tăng nhãn áp từ PubMed. Điều quan trọng là một tập dữ liệu cố định mà tác nhân lặp lại. Đảm bảo xáo trộn trước và chia 80/20 để mỗi lần chạy 5 phút thấy cùng một phần huấn luyện/xác thực.
Viết chiến lược program.md: Cộng đồng nên chia sẻ các lời nhắc program.md khác nhau (giống như “công thức”) trong hệ thống kiểm soát phiên bản. Mỗi tệp có thể mã hóa một chiến lược nghiên cứu. Chẳng hạn, một chiến lược có thể nói “tăng độ sâu mạng nếu độ sâu <6, nếu không thì giảm tốc độ học,” trong khi một chiến lược khác có thể nói “tập trung vào các thay đổi tăng cường dữ liệu.” Theo thời gian, các nhóm có thể so sánh chiến lược nào mang lại các chỉ số tốt hơn trên bảng xếp hạng. Một tệp program.md tốt bao gồm một mục tiêu (ví dụ: tối đa hóa AUC hoặc giảm thiểu mất mát xác thực) và gợi ý về các thay đổi được phép (lớp, bộ lọc, LR). LLM của tác nhân sử dụng các hướng dẫn này để đề xuất các chỉnh sửa mã. Giữ các chỉ số được chuẩn hóa (ví dụ: luôn báo cáo AUC cho các nhiệm vụ phân loại bệnh tăng nhãn áp) để các thí nghiệm có thể so sánh được.
Hợp tác Cộng đồng: Để nỗ lực này có thể mở rộng, một cộng đồng khoa học công dân nên tổ chức:
- Nhật ký thí nghiệm được chia sẻ: Đăng kết quả của mỗi thí nghiệm (ví dụ: “Lần chạy số 27 của program-v1 đạt Val AUC=0.82 với width=4, depth=3”).
- Các chỉ số được chuẩn hóa: Xác định các chỉ số cho mỗi nhiệm vụ: ví dụ: “OCT glaucoma AUC”, “VF progression AUC”, “Attribute AUC”, v.v. Một bảng xếp hạng được chia sẻ (tương tự như val_bpb của autoresearch) có thể theo dõi các điểm số cao nhất. Ví dụ, một kênh Slack hoặc GitHub Actions có thể thu thập AUC tốt nhất của mỗi tác nhân hàng tuần.
- program.md được kiểm soát phiên bản: Lưu trữ tất cả các tệp program.md trong một kho lưu trữ GitHub. Các thành viên có thể fork và đề xuất các chiến lược mới (thông qua pull request) trong khi vẫn giữ các phiên bản lịch sử. Bằng cách này, nhiều cách tiếp cận có thể được kiểm tra song song (ví dụ: “program_word2vec.md” so với “program_transformer.md”).
- Chia sẻ dữ liệu và mã: Sử dụng các kho lưu trữ hoặc sổ ghi chép công khai cho các tập lệnh chuẩn bị dữ liệu, và chia sẻ các sửa đổi train.py do tác nhân tìm thấy (để tái tạo trong các khung ML tiêu chuẩn). Liên kết đến các nguồn tập dữ liệu gốc (Kaggle, PhysioNet, Zenodo) đảm bảo những người khác có thể tải xuống cùng dữ liệu.

Bằng cách giảm bớt các rào cản kỹ thuật (tác nhân chỉnh sửa mã, người dùng chỉnh sửa hướng dẫn trong Markdown) và bằng cách điều phối nỗ lực (nhật ký chia sẻ, bảng xếp hạng), các nhà khoa học công dân có thể cùng nhau khám phá các lựa chọn siêu tham số/mô hình cho các vấn đề ML về bệnh tăng nhãn áp này. Về bản chất, họ đầu tư sự sáng tạo của con người vào việc xác định mục tiêu, và để tác nhân thực hiện công việc lặp đi lặp lại của 100 thí nghiệm mỗi đêm cho mỗi mục tiêu (medium.com) (www.theneuron.ai).

4. Đặc biệt về Phục hồi Thị lực

Phục hồi thị lực – lấy lại thị giác sau tổn thương – là một mục tiêu đặc biệt hấp dẫn cho tối ưu hóa dựa trên AI. Nghiên cứu phục hồi thị lực được hỗ trợ bởi AI hiện nay bao gồm cấy ghép võng mạc, bộ phận giả vỏ não và quang di truyền. Dưới đây là cách một vòng lặp autoresearch có thể phù hợp:

Tối ưu hóa mã hóa bộ phận giả thị giác: Các bộ phận giả hiện đại (cấy ghép võng mạc hoặc camera liên kết với mảng điện cực) cố gắng dịch hình ảnh từ camera thành các mẫu kích thích điện mà não bộ diễn giải thành thị giác. Thách thức là “băng thông” của điện cực rất hạn chế (thường chỉ vài chục đến vài trăm điểm) (pmc.ncbi.nlm.nih.gov). Một mô hình ML (một CNN hoặc transformer nhỏ) có thể được huấn luyện để ánh xạ hình ảnh đầu vào tới các bản đồ kích thích lý tưởng, nhưng các siêu tham số hoặc kiến trúc tốt nhất cho phép chuyển đổi này vẫn chưa được biết. Một tác nhân autoresearch có thể chạy 100 biến thể của một mô hình “bộ mã hóa thần kinh” trong vài giờ. Ví dụ, thiết lập một tập dữ liệu các cặp hình ảnh → kích thích (hoặc các ảo ảnh mô phỏng hoặc dữ liệu bệnh nhân) và để tác nhân tối ưu hóa mạng bộ mã hóa để giảm thiểu mất mát tái tạo hoặc tối đa hóa một chỉ số tiện ích (tính nguyên vẹn tương phản, độ chính xác nhận dạng). Tác nhân có thể thử thêm các lớp chú ý, thay đổi kích thước tích chập hoặc điều chỉnh tốc độ học. Sau nhiều lần chạy, người ta có thể tìm thấy các mạng nhỏ mang lại đầu ra giả nhân có giá trị hơn. Một số công trình gần đây đã sử dụng AI để trích xuất độ nổi bật thị giác cho bộ phận giả (pmc.ncbi.nlm.nih.gov); autoresearch có thể tự động điều chỉnh các quy trình như vậy.
Mô hình kích thích quang di truyền: Trong liệu pháp quang di truyền, các tế bào RGC hoặc các tế bào võng mạc khác còn sống sót được làm cho nhạy cảm với ánh sáng (thông qua các gen được đưa vào). Các đầu vào từ camera sau đó phải được mã hóa thành các xung ánh sáng. Ở đây một lần nữa, một mô hình ML có thể kiểm soát các mẫu. Người ta có thể xây dựng một nhiệm vụ thử nghiệm: mạng nhỏ chuyển đổi hình ảnh camera thành bản đồ cường độ ánh sáng (cùng kích thước với các tế bào). Mục tiêu của tác nhân có thể là tối đa hóa một chỉ số nào đó về kích thích hiệu quả (ví dụ: tối đa hóa sự kích hoạt của các tế bào mục tiêu trong võng mạc mô phỏng). Mỗi lần thử có thể chạy một mô phỏng nhanh về phản ứng. Sau nhiều lần lặp, tác nhân có thể khám phá thời lượng xung hoặc bộ lọc không gian. Chẳng hạn, điều chỉnh độ mạnh của bộ lọc thông cao trên đầu vào camera có thể có lợi cho một số mẫu. Điểm mấu chốt là nhiều tham số tương tự (nhân bộ lọc, phi tuyến tính, mã hóa xung thời gian) có thể được quét tự động.
Tối ưu hóa mẫu xung (TES và cấy ghép): Ngay cả các lĩnh vực không thuộc học máy cũng có thể hưởng lợi từ tìm kiếm nhanh. Ví dụ, một nghiên cứu gần đây (Xie et al. 2025) đã phát hiện ra rằng thời lượng xung ngắn hơn và việc chèn các khoảng thời gian giữa các pha đã cải thiện đáng kể sự kích hoạt vỏ não đối với cấy ghép võng mạc (pmc.ncbi.nlm.nih.gov). Điều này cho thấy không gian tham số của kích thích điện có những tác động mạnh mẽ, không trực quan. Một tác nhân autoresearch có thể coi các tham số giao thức kích thích (thời lượng pha, tần số, khoảng thời gian) là “tham số mạng” và chạy nhiều thí nghiệm nhỏ (mỗi thí nghiệm được mô phỏng hoặc thực nghiệm) để tối đa hóa phản ứng vỏ não. Chẳng hạn, thiết lập một mô hình điện đơn giản (hoặc sử dụng dữ liệu tiềm năng gợi ý đã ghi lại) trong prepare.py và để tác nhân điều chỉnh các tham số train.py như thời gian xung để tối đa hóa biên độ phản ứng đã xác định. Điều này giống như tự động hóa những gì các nhà thần kinh học nghiệp dư làm thủ công.
Thiết kế vector virus và hình học giàn giáo: Trong phát triển liệu pháp mang tính khám phá hơn, phương pháp lặp của tác nhân cũng có thể giải quyết các tối ưu hóa y sinh. Ví dụ, thiết kế các capsid hoặc promotor virus AAV để nhắm mục tiêu RGCs có thể được hướng dẫn bởi các mô hình dự đoán nhỏ (ví dụ: hồi quy logistic trên các tính năng trình tự). Autoresearch có thể lặp lại thử sửa đổi một mô hình dự đoán tính hướng hoặc biểu hiện (được huấn luyện trên ví dụ: các thư viện virus nhỏ) để cải thiện dự đoán đó. Tương tự, nếu ai đó có mã mô phỏng sự tăng trưởng trong các giàn giáo thần kinh (để sửa chữa dây thần kinh thị giác), tác nhân có thể điều chỉnh các tham số hình học để tối đa hóa sự mở rộng sợi trục. Đây là những lĩnh vực nâng cao, nhưng phù hợp về mặt khái niệm – “tác nhân là người thí nghiệm” có thể điều chỉnh các tham số mô hình hoặc mô phỏng để cải thiện kết quả.

Tóm lại, bất kỳ khía cạnh nào của bộ phận giả hoặc phục hồi thị lực dựa vào các thuật toán có tham số đều có thể được cải thiện thông qua các lần lặp nhanh. Quan trọng là, giới hạn ở đây là chúng ta thường chỉ có dữ liệu mô phỏng cho nhiều nhiệm vụ này; việc thử nghiệm hàng trăm biến thể trên bệnh nhân thực tế là không thể. Nhưng autoresearch có thể hoạt động trên máy tính để đề xuất các ứng cử viên tốt nhất cho thử nghiệm lâm sàng sau này. Như đánh giá bộ phận giả đã lưu ý, “đảm bảo ảo ảnh được tạo ra một cách đáng tin cậy ở các vị trí chính xác… là một thách thức quan trọng” và “các mô hình dựa trên AI đã cho thấy tiềm năng” trong lĩnh vực này (pmc.ncbi.nlm.nih.gov). Autoresearch có thể tăng tốc đáng kể việc tìm kiếm các cấu hình tốt nhất của các mô hình AI đó.

5. Kết nối với tác động lâm sàng

Các kết quả tính toán cuối cùng phải kết nối lại với nghiên cứu và chăm sóc bệnh tăng nhãn áp thực tế. Làm thế nào để các ý tưởng được tạo ra bởi autoresearch do bệnh nhân dẫn dắt có thể được xác thực và phát triển?

Hợp tác với các nhóm nghiên cứu: Các nhà khoa học công dân nên liên hệ với các tổ chức nghiên cứu bệnh tăng nhãn áp đã thành lập. Các ví dụ bao gồm Hiệp hội Di truyền Bệnh tăng nhãn áp Quốc tế (IGGC) và hiệp hội NEIGHBORHOOD, nơi tập hợp dữ liệu di truyền và lâm sàng (pubmed.ncbi.nlm.nih.gov) (pmc.ncbi.nlm.nih.gov). Các phát hiện từ autoresearch (ví dụ: một gen ứng viên mới lạ hoặc giả thuyết tái sử dụng thuốc) có thể được chia sẻ với các nhóm như vậy để theo dõi thực nghiệm. Các phòng thí nghiệm nuôi cấy mô (ví dụ: tại các trường đại học lớn) hoặc các nhà nghiên cứu giấc ngủ có thể thử nghiệm các hợp chất về sự sống sót của RGC. Các bác sĩ lâm sàng học thuật có thể tương quan bất kỳ dấu ấn sinh học hoặc bộ phân loại hình ảnh nào với dữ liệu bệnh nhân của họ theo IRB. Bắt đầu đối thoại giữa các nhóm kiểu hackathon và các phòng thí nghiệm chính thức là rất quan trọng.
Thu hút các tổ chức vận động bệnh nhân: Các nhóm như Glaucoma Research Foundation hoặc Cure Glaucoma Foundation thường tài trợ cho các đổi mới lấy bệnh nhân làm trung tâm. Họ có thể tài trợ các dự án bằng chứng khái niệm hoặc các cuộc thi công dân sử dụng autoresearch. Các tổ chức này có mạng lưới bác sĩ lâm sàng và có thể giúp chuyển các mô hình tiềm năng đến phòng khám. Ví dụ, nếu một tác nhân gắn cờ một loại thuốc đã được FDA chấp thuận là có tính bảo vệ thần kinh, một nhóm vận động có thể hỗ trợ thiết lập một thử nghiệm nhỏ theo các giao thức phù hợp. Việc làm nổi bật những thành công sẽ đòi hỏi phải đóng khung các kết quả đầu ra dưới dạng giả thuyết (không phải lời khuyên y tế) và đảm bảo tính minh bạch.
Các rào cản đạo đức và an toàn: Các nhà khoa học công dân phải sử dụng chỉ dữ liệu công khai đã được ẩn danh hoặc dữ liệu tổng hợp hoàn toàn. Bất kỳ việc sử dụng hồ sơ bệnh nhân thực tế nào đều yêu cầu một giao thức được IRB chấp thuận (và có thể là sự đồng ý của bệnh nhân). Đầu ra từ các vòng lặp autoresearch phải được dán nhãn rõ ràng là tạo giả thuyết. Ví dụ: “Mô hình này cho thấy Thuốc X có thể bảo vệ RGCs – cần xác thực thực nghiệm.” Các quyết định y tế quan trọng phải do bác sĩ đưa ra. Các rủi ro bao gồm việc vô tình phân phối các mô hình dự đoán kết quả cá nhân (tiến triển bệnh tăng nhãn áp) – cần có các tuyên bố từ chối trách nhiệm rõ ràng để không coi đây là công cụ chẩn đoán. Các phương pháp hay nhất về quyền riêng tư dữ liệu (ví dụ: sử dụng các trường được tổng hợp hoặc ẩn danh) là điều bắt buộc.
Tiền lệ trong khoa học công dân: Không phải là chưa từng có tiền lệ khi những người nghiệp dư đóng góp vào nghiên cứu y học/thần kinh học. Dự án Eyewire (trò chơi lập bản đồ neuron theo nguồn lực cộng đồng của MIT) đã huy động các tình nguyện viên để tái tạo các mạch thần kinh võng mạc (www.citizenscience.gov). Trong nhãn khoa, những người không chuyên đã giúp chú thích hình ảnh trong các thử thách do OpenAI tài trợ (ví dụ: các tập dữ liệu được dán nhãn cho bệnh về mắt). Ngoài lĩnh vực chăm sóc mắt, các trò chơi như Foldit (giải đố gấp protein) và Galaxy Zoo (phân loại thiên hà) cho thấy sự tham gia của công dân có thể giải quyết các vấn đề khoa học khó khăn. Những thành công này khuyến khích ý tưởng rằng nhiều bàn tay (và giờ là AI) thực sự có thể hỗ trợ nghiên cứu phức tạp. Cách tiếp cận autoresearch giống như việc cung cấp cho mỗi người một trợ lý phòng thí nghiệm được hỗ trợ bởi AI: những nỗ lực theo nguồn lực cộng đồng trước đây chỉ sử dụng con người để phân tích các nhiệm vụ cố định, trong khi ở đây con người đặt mục tiêu và AI thực hiện các lần lặp.

Bằng cách minh bạch, cẩn trọng và hợp tác, một sáng kiến autoresearch khoa học công dân có thể giành được sự tin cậy. Nó nên nhấn mạnh “tạo ra các gợi ý, không phải đơn thuốc.” Nếu cộng đồng ghi lại các phương pháp và chia sẻ mã một cách công khai, các nhà nghiên cứu chuyên nghiệp có thể tái tạo các phát hiện. Ví dụ, nếu ai đó tìm thấy một sự kết hợp mới của các yếu tố bảo vệ RGC, họ có thể xuất bản nó trong một bản preprint hoặc thông báo cho một phòng thí nghiệm. Các tham chiếu kiểu trích dẫn (như chúng tôi làm ở đây) giúp kết nối: ví dụ: “Chúng tôi đã xử lý danh sách các loại thuốc tiềm năng của bạn trong ngữ cảnh các con đường đã biết (pmc.ncbi.nlm.nih.gov).” Cuối cùng, đây là một hình thức khoa học mở – do bệnh nhân điều khiển nhưng nghiêm ngặt về mặt khoa học. Nếu các tiêu chuẩn đạo đức được duy trì, sự đổi mới từ cơ sở như vậy có tiềm năng lớn để khơi dậy các hợp tác mới và cuối cùng đóng góp vào nghiên cứu nhãn khoa được đánh giá bởi các đồng nghiệp.

6. Lộ trình 90 ngày cụ thể

Một kế hoạch tập trung, có giới hạn thời gian có thể tập hợp một cộng đồng từ 10–50 người (mỗi người có ít nhất một GPU hoặc Apple Silicon) để khởi động nỗ lực autoresearch cho bệnh tăng nhãn áp. Dưới đây là kế hoạch giai đoạn được đề xuất:

Tuần 1–2: Thành lập & Thiết lập
- Tuyển dụng và Khởi động: Tạo một kênh giao tiếp (ví dụ: Slack hoặc Discord) và một kho lưu trữ GitHub cho dự án. Quảng bá đến các diễn đàn bệnh nhân tăng nhãn áp, các nhóm biohacker và các buổi gặp mặt AI.
- Kiểm tra phần cứng: Đảm bảo mọi người có thể cài đặt PyTorch và clone kho lưu trữ của Karpathy (hoặc nhánh Maple). Tổ chức một buổi thiết lập nơi mỗi thành viên chạy một vòng lặp autoresearch mẫu trên một tập dữ liệu thử nghiệm (ví dụ: tập con CIFAR-10) để xác minh môi trường.
- Chọn tập dữ liệu: Quyết định 1–3 nhiệm vụ ban đầu (ví dụ: phân loại OCT, tiến triển VF). Đối với mỗi nhiệm vụ, phân công một nhóm nhỏ chuẩn bị dữ liệu: ví dụ: một nhóm tải xuống hình ảnh RIM-ONE (github.com), một nhóm khác truy xuất trường GRAPE (www.nature.com), một nhóm khác thu thập các bản tóm tắt tài liệu. Các nhóm nên chia dữ liệu 80/20 và tạo các tập lệnh prepare.py mẫu.
- Các mô hình cơ sở: Đối với mỗi nhiệm vụ, hoàn thiện một train.py đơn giản: ví dụ, một CNN nhỏ cho RIM-ONE, một MLP cho VFs. Chọn các chỉ số đánh giá (AUC, Dice, MSE).
- Soạn thảo program.md ban đầu: Mỗi nhóm viết một tệp hướng dẫn ban đầu (program.md) nêu rõ mục tiêu và các thay đổi được phép. Ví dụ, đối với RIM-ONE: “tối đa hóa AUC phát hiện tăng nhãn áp,” đối với GRAPE: “giảm thiểu VF MSE.”
Tuần 3–6: Các Chu trình Thử nghiệm Đầu tiên
- Chạy các vòng lặp Autoresearch: Mỗi tiểu nhóm chạy tác nhân trên nhiệm vụ của họ qua đêm (khoảng 100 lần chạy 5 phút). Sử dụng một tệp program.md để bắt đầu, sau đó cho phép người tham gia thêm các biến thể (ví dụ: “program_temp1.md”).
- Thu thập kết quả: Mỗi sáng, các nhóm kiểm tra nhật ký (kho lưu trữ tự động ghi nhật ký mỗi lần chạy). Ghi lại chỉ số tốt nhất đạt được, các tham số mô hình tại thời điểm đó và bất kỳ thay đổi đáng chú ý nào mà tác nhân tìm thấy. Để minh bạch, đẩy các kết quả này lên GitHub được chia sẻ (có thể ở định dạng CSV hoặc JSON).
- Lặp lại & Phản hồi: So sánh các lần chạy. Có chiến lược nào đánh bại đáng kể đường cơ sở không? Nếu một tiểu nhóm thấy ít tiến bộ, họ nên điều chỉnh program.md (ví dụ: tích cực hơn với các thay đổi tốc độ học). Mỗi cuối tuần, tổng hợp các phát hiện trong một cuộc họp cộng đồng.
- Công cụ: Sử dụng Git để kiểm soát phiên bản trên program.md và trên các mẫu mã. Cân nhắc một Google Sheet hoặc bảng wiki được chia sẻ cho các bảng xếp hạng (ví dụ: “OCT-AUC: tốt nhất=0.85 bởi Alice; VF-RMSE: tốt nhất=2.1 bởi Bob”). Điều này thúc đẩy cạnh tranh lành mạnh và minh bạch.
Tuần 7–12: Tinh chỉnh và Tiếp cận Cộng đồng
- Tinh chỉnh thí nghiệm: Dựa trên kết quả ban đầu, tinh chỉnh các nhiệm vụ đầy hứa hẹn. Ví dụ, có lẽ bộ phân loại RIM-ONE đã vượt 0.90 AUC – giờ hãy thử thêm tăng cường dữ liệu hoặc một mạng sâu hơn một chút. Khuyến khích phân nhánh: một số có thể thử các kiến trúc khác nhau (ví dụ: Vision Transformer nhỏ thay vì CNN). Các tác nhân có thể chạy nhiều biến thể program.md song song.
- Tổng hợp kết quả: Tạo các báo cáo ngắn về từng lĩnh vực (OCT, VF, v.v.), tóm tắt những gì đã hoạt động. Chẳng hạn, “Chúng tôi đã cải thiện Dice phân đoạn GCC từ 0.60 lên 0.75 bằng cách chuyển từ kích hoạt ReLU sang GELU.” Sử dụng ngôn ngữ phổ thông để những người không chuyên có thể theo dõi (bảng chú giải các thuật ngữ ML).
- Trình bày cộng đồng: Đến tuần 10, viết một bài đăng blog hoặc tập slide tóm tắt sáng kiến cho đến nay. Nêu bật bất kỳ phát hiện không tầm thường nào (ngay cả kết quả “rỗng” cũng hữu ích để chia sẻ). Mời phản hồi từ các diễn đàn trực tuyến; có lẽ liên hệ với một nhà nghiên cứu để hỏi ý kiến (“Chúng tôi đã tìm thấy các chỉnh sửa mạng nơ-ron X giúp phân loại bệnh tăng nhãn áp sớm – có ý tưởng nào nếu điều này phù hợp với sinh lý học không?”).
- Lên kế hoạch tiếp cận: Xác định một hoặc hai phòng thí nghiệm nhãn khoa hoặc bác sĩ lâm sàng quan tâm đến việc hợp tác. Liên hệ với họ với các kết quả ban đầu. Ví dụ, kết nối với các tác giả của tập dữ liệu HYGD hoặc nhóm GRAPE trên Twitter/LinkedIn, đề cập đến các phát hiện công dân của bạn. Khám phá các khả năng đồng xác thực (ví dụ: gửi cho họ trọng số mô hình đã được huấn luyện để kiểm tra trên dữ liệu của họ).
Sau 12 Tuần: Các Bước Tiếp theo
- Tiếp tục lặp lại trên các nhiệm vụ tiềm năng nhất và các nhiệm vụ mới. Ví dụ, nếu RIM-ONE mang lại kết quả tốt, tiếp theo hãy giải quyết REFUGE. Có lẽ xây dựng các mô hình tổng hợp (tập hợp các CNN).
- Chính thức hóa một trang dự án hoặc bản preprint mô tả nỗ lực.
- Cân nhắc tổ chức một hackathon để thu hút thêm nhiều bộ óc, có thể hợp tác với một tổ chức từ thiện về bệnh tăng nhãn áp.

Bằng cách cấu trúc theo cách này, cộng đồng có thể đạt được tiến bộ ổn định, học hỏi cùng nhau và bắt đầu kết nối với các chuyên gia vào cuối 90 ngày.

7. Rủi ro, Hạn chế & Đánh giá trung thực

Ý tưởng autoresearch cho bệnh tăng nhãn áp đầy tham vọng, vì vậy cần phải trung thực về những cạm bẫy tiềm ẩn:

Rủi ro quá khớp và các mẫu giả: Các mô hình nhỏ trên các tập dữ liệu nhỏ, nhiễu thường bị bám vào những sự trùng hợp ngẫu nhiên. Một tác nhân có thể tìm thấy một chỉnh sửa làm cải thiện AUC xác thực chỉ đơn giản bằng cách quá khớp với những đặc điểm riêng. Ví dụ, nếu một tập con hình ảnh có một dấu chú thích tinh tế, mạng có thể sử dụng dấu đó thay vì các tính năng bệnh tăng nhãn áp thực sự. Điều này dẫn đến “sự lừa dối của giảm độ dốc”. Để giảm thiểu:
- Luôn sử dụng các tập kiểm tra riêng biệt (hoàn toàn tách biệt khỏi bất kỳ lần điều chỉnh nào) để đánh giá cuối cùng.
- Hạn chế độ phức tạp: giữ các mô hình khiêm tốn, và theo dõi xem tác nhân có làm sâu hoặc rộng mạng quá mức một cách không hợp lý hay không.
- Nếu một mô hình đạt được điểm gần như hoàn hảo quá nhanh, hãy đặt câu hỏi về nó.
- Sử dụng các kiểm tra hợp lý: ví dụ: xáo trộn nhãn và xem AUC có giảm xuống mức ngẫu nhiên không (nếu không, có sự rò rỉ).
Thiên vị và chất lượng dữ liệu: Các tập dữ liệu bệnh tăng nhãn áp công khai thường đến từ các quần thể hẹp (ví dụ: ORIGA từ Singapore) (pubmed.ncbi.nlm.nih.gov). Một mô hình được điều chỉnh theo những dữ liệu đó có thể không tổng quát hóa. Các thí nghiệm công dân nên lưu ý hạn chế này. Lý tưởng nhất là sử dụng nhiều tập dữ liệu (từ các nhóm khác nhau) để kiểm tra xem các phát hiện có mạnh mẽ không.
Lối đi sai lệch (“Nghiên cứu hình thức”): Việc chạy hàng tấn thí nghiệm có vẻ hiệu quả, nhưng nếu mọi cải tiến chỉ dựa trên dữ liệu tổng hợp hoặc tầm thường, nó có thể không mang lại lợi ích cho bệnh nhân. Để tránh điều này:
- Tập trung vào các nhiệm vụ có liên quan lâm sàng (ví dụ: phát hiện sớm từ OCT thường quy).
- Gắn kết quả với các biện pháp thực tế khi có thể (ví dụ: AUC cho tiến triển, không chỉ là delta mất mát nhỏ).
- Ưu tiên khả năng giải thích: nếu tác nhân “tìm thấy” một dấu ấn sinh học mới, hãy cố gắng đảm bảo nó có ý nghĩa (ví dụ: nó có tập trung vào những thay đổi giải phẫu đã biết không?).
Không có đảm bảo lâm sàng: Phải cực kỳ rõ ràng: kết quả từ các vòng lặp này là tạo giả thuyết, không phải lời khuyên y tế. Một mô hình đề xuất một loại thuốc mới phải được kiểm tra trong phòng thí nghiệm trước khi sử dụng cho bệnh nhân. Việc tuyên bố quá mức là nguy hiểm. Dán nhãn tất cả các kết quả được chia sẻ bằng các tuyên bố từ chối trách nhiệm: “Đây là một khám phá AI và không phải là một phát hiện đã được đánh giá bởi các đồng nghiệp.”
Hạn chế của “Mô hình nhỏ”: Các mạng rất nhỏ có khả năng hạn chế. Chúng có thể bỏ lỡ các mẫu phức tạp. Ngược lại, các mô hình lớn thường thấy những đột phá nhưng yêu cầu dữ liệu khổng lồ. Ở đây chúng ta chấp nhận phạm vi hạn chế: hy vọng là ngay cả những cải tiến nhỏ cũng có thể hướng dẫn nghiên cứu. Nhưng chúng ta không nên mong đợi những mô hình này thay thế học sâu trên dữ liệu lớn. Chúng tốt nhất để nhanh chóng thử các ý tưởng rõ ràng.
Độ tin cậy của tác nhân: Tác nhân (ví dụ: GPT-4) có thể bị ảo giác hoặc sai lệch. Điều quan trọng là kết quả phải có thể tái tạo: sau một lần chạy của tác nhân, con người nên kiểm tra những thay đổi nào đã được giữ lại và chạy lại huấn luyện để xác nhận chỉ số. Giữ cho tác nhân trung thực bằng cách bao gồm các tuyên bố trong program.md như “chỉ chấp nhận những cải thiện thực tế trong chỉ số đánh giá”.

Mặc dù có những thách thức này, biện pháp bảo vệ chính là tính minh bạch và theo dõi nghiêm ngặt. Ghi lại mọi thứ. Khi một mô hình cho thấy một mẫu, hãy xác minh nó. Nếu nhiều nhà khoa học công dân thấy cùng một sự bất thường (ví dụ: tất cả các mô hình AUC cao cho một nhiệm vụ OCT đều nhấn mạnh vùng võng mạc mũi), điều đó củng cố trường hợp. Mục tiêu là đẩy nhanh giai đoạn tạo ý tưởng, chứ không phải tránh khoa học cẩn thận sau đó.

Kết luận

Bệnh tăng nhãn áp là một căn bệnh gây mù lòa phức tạp, âm thầm với nhiều nhu cầu nghiên cứu chưa được đáp ứng – từ bảo vệ tế bào thần kinh đến phục hồi thị lực. Đồng thời, AI đã dân chủ hóa việc thử nghiệm: một người với một GPU và sự quyết tâm có thể chạy các tìm kiếm siêu tham số tự động mà các nhóm sẽ mất hàng tuần để làm thủ công. Khung autoresearch của Karpathy về cơ bản trao cho mỗi công dân một trợ lý phòng thí nghiệm AI. Bằng cách viết các mục tiêu cấp cao rõ ràng trong Markdown, các nhà nghiên cứu cộng đồng có thể để tác nhân xử lý các sản phẩm và trực tiếp đi đến những gợi ý đầy hứa hẹn.

Chúng tôi đã phác thảo cách thực hiện điều này trong thực tế: xác định các nhiệm vụ ML về bệnh tăng nhãn áp, chọn dữ liệu (hình ảnh đáy mắt và OCT, trường thị giác, tập dữ liệu phân tử), định nghĩa các mô hình và chỉ số, và sử dụng các hướng dẫn chương trình để hướng dẫn tìm kiếm. Chúng tôi đã phác thảo một lộ trình cộng đồng 90 ngày và lưu ý các cầu nối đến các bác sĩ lâm sàng để đảm bảo rằng các kết quả có giá trị có thể cung cấp thông tin cho khoa học bệnh tăng nhãn áp thực tế. Cách tiếp cận này rất giống “khoa học công dân”: mở ra các công cụ khám phá khoa học một cách dễ tiếp cận, đồng thời vẫn dựa vào sự giám sát của chuyên gia ở những nơi cần thiết.

Trích dẫn: Chúng tôi đã tham khảo các tài nguyên mới nhất trong cả nghiên cứu bệnh tăng nhãn áp và AI. Các sự kiện chính (tỷ lệ mắc bệnh, một nửa không được chẩn đoán (physionet.org)), các liệu pháp đầy hứa hẹn (cấy ghép CNTF (pmc.ncbi.nlm.nih.gov), chỉnh sửa gen (pmc.ncbi.nlm.nih.gov)), và những cạm bẫy tiềm ẩn (AI trong hình ảnh (pmc.ncbi.nlm.nih.gov)) đều dựa trên tài liệu hiện tại. Bản thân Autoresearch được mô tả trong bài hướng dẫn của Karpathy (medium.com) và bài đánh giá (www.theneuron.ai). Những điều này sẽ tăng thêm độ tin cậy cho tầm nhìn được phác thảo ở đây.

Đến cuối cùng, chúng tôi hy vọng người đọc cảm thấy được trao quyền: nếu bạn là bệnh nhân, người chăm sóc hoặc người đam mê, bạn có thể là một phần của việc thúc đẩy nghiên cứu bệnh tăng nhãn áp tiến lên. Các công cụ và dữ liệu đã có, các vấn đề rõ ràng, và với sự phối hợp và một tác nhân AI, chúng ta có thể tăng tốc học hỏi. Giống như bất kỳ nghiên cứu nào, hành trình sẽ có những khởi đầu sai lầm, nhưng ngay cả những thất bại cũng dạy chúng ta điều gì đó – thường là hướng tâm trí con người đến những cách tiếp cận đúng đắn. Với đôi mắt mở rộng trước cả những khả năng và những cạm bẫy, autoresearch do công dân dẫn dắt có thể trở thành một bổ sung mạnh mẽ cho khoa học tăng nhãn áp truyền thống.

Bắt đầu từ đây

Cách dễ nhất để bắt đầu làm quen với autoresearch cho bệnh tăng nhãn áp ngay hôm nay: Chạy một phân loại nhỏ trên hình ảnh đáy mắt ORIGA.

Lấy dữ liệu: Tải xuống tập dữ liệu ORIGA-light (650 hình ảnh đáy mắt được dán nhãn bình thường so với tăng nhãn áp) (pubmed.ncbi.nlm.nih.gov). Chia ~80% huấn luyện / 20% xác thực.
Mô hình ban đầu: Sử dụng hoặc điều chỉnh tập lệnh mẫu từ [karpathy/autoresearch] để phân loại hình ảnh. Ví dụ, một đoạn mã để tải hình ảnh ORIGA và huấn luyện một CNN nhỏ (2–3 lớp tích chập) để phân biệt bệnh tăng nhãn áp so với khỏe mạnh.
Viết program.md: Trong văn bản, đặt mục tiêu là “tối đa hóa AUC xác thực để phát hiện bệnh tăng nhãn áp”, và hướng dẫn tác nhân có thể điều chỉnh độ sâu mô hình, tốc độ học, v.v. Chẳng hạn:

Mục tiêu: Tối đa hóa AUC trên bệnh tăng nhãn áp so với bình thường cho tập dữ liệu ORIGA.

Tác nhân nên thử điều chỉnh kích thước lớp tích chập, số lượng bộ lọc và tốc độ học. Mỗi lần thử nghiệm là 5 phút huấn luyện. Nếu AUC xác thực cải thiện, hãy giữ lại thay đổi. Lặp lại.
Chạy vòng lặp: Khởi động autoresearch (trỏ nó đến prepare.py, train.py, và program.md của bạn). Để nó chạy trong vài giờ hoặc qua đêm trên RTX 3060 của bạn. Nó sẽ tự động thực hiện khoảng 100 thí nghiệm.
Kiểm tra kết quả: Kiểm tra bảng điều khiển hoặc nhật ký để xem AUC xác thực tốt nhất đạt được (nên >0.8 nếu mọi việc suôn sẻ). Giờ đây, bạn có một mô hình và tập lệnh huấn luyện mà tác nhân AI đã tinh chỉnh.

Thí nghiệm cuối tuần đơn giản này đã mang lại cho bạn kinh nghiệm thực tế về việc xây dựng một quy trình ML mà không cần viết mã mới bằng tay. Ghi lại những gì bạn đã thử và chia sẻ program.md cũng như kết quả của bạn với cộng đồng. Mỗi thành công nhỏ (tăng AUC, thay đổi mạng thú vị) là một viên gạch xây dựng. Bạn đang hướng dẫn một AI thực hiện nghiên cứu về vấn đề tăng nhãn áp bạn chọn – và khi làm như vậy, bạn học được cả khoa học dữ liệu tăng nhãn áp và có hy vọng tạo ra sự khác biệt trong việc hiểu hoặc điều trị mất thị lực.

Chúc may mắn! Giữ các câu hỏi và phát hiện mã nguồn mở, và hãy nhớ: đây là các công cụ nghiên cứu thử nghiệm, không phải lời khuyên y tế. Kiểm tra các lần chạy của bạn cẩn thận và tận hưởng quá trình khám phá.

**`

Mở Rộng Tầm Mắt: Khung Autoresearch của Karpathy Có Thể Dân Chủ Hóa Nghiên Cứu Bệnh Tăng Nhãn Áp Như Thế Nào — Một Kế Hoạch Chi Tiết cho Khám Phá do Bệnh Nhân Dẫn Dắt, Dựa trên AI trong Phục Hồi Thị Lực