Yapay zeka sohbet robotları, sınırlı bakım olan yerlerde tıbbi teşhisleri dönüştürüyor. Ruanda ve Pakistan’da yapılan çalışmalar, sohbet robotlarının sadece kıyaslama testlerinde değil, yetersiz fonlanan kliniklerde de gerçek dünyadaki faydasını ortaya koyuyor.
Büyük dil modelleri (LLM’ler), en azından kontrollü kıyaslama testlerinde, tıp yüksek lisans sınavlarını geçebilir ve klinisyenlerin teşhis koymasına yardımcı olabilir. Ancak, cevapları kontrol edecek yeterli sayıda hekimin olmadığı, uzun hasta listelerinin ve sınırlı kaynakların bulunduğu gerçek dünya ortamlarında da faydalı mıdırlar?
AI sohbet robotları tıbbi teşhisler için en kolay ulaşılabilen araç
6 Şubat’ta Nature Health’te yayınlanan iki çalışma, bu görevi yerine getirebileceklerini öne sürüyor. Çalışma, ucuz LLM’lerin Ruanda1 ve Pakistan2’deki sağlık hizmeti ortamlarında teşhis başarı oranlarını artırabileceğini, hatta eğitimli klinisyenlerden bile daha iyi performans gösterebileceğini ortaya koyuyor. Ruanda’da, sohbet robotu cevapları, değerlendirilen her ölçütte yerel klinisyenlerin cevaplarından daha yüksek puan aldı. Pakistan’da ise, teşhislerine yardımcı olmak için LLM kullanan hekimler, geleneksel kaynakları kullananlara kıyasla %71’lik ortalama bir teşhis akıl yürütme puanı elde etti (%43).
İngiltere’deki Oxford Üniversitesi Yapay Zeka Etiği Enstitüsü’nde araştırma direktörü Caroline Green: “Bu makaleler, LLM’lerin düşük ve orta gelirli ülkelerdeki klinisyenlere bakım düzeyini iyileştirmede nasıl destek olabileceğini vurguluyor” diyor. Ruanda çalışmasında, araştırmacılar LLM’lerin dört bölgedeki düşük kaynaklı sağlık sistemlerinde hastalara doğru klinik bilgi sağlayıp sağlayamayacağını test ettiler. Çalışmanın ortak yazarı ve sağlıkta eşitliğe adanmış küresel bir kar amacı gütmeyen kuruluş olan PATH’ın Londra merkezli baş yapay zeka sorumlusu Bilal Mateen, orada yaygın bir sorunun, tüm hastaları görecek yeterli doktor ve hemşire olmaması olduğunu, bu nedenle çoğu insanın az eğitimli toplum çalışanları tarafından muayene edilip önceliklendirildiğini söylüyor.
Mateen’in ekibi, yaklaşık 100 toplum sağlık çalışanından hastalardan aldıkları 5.600’den fazla klinik sorunun bir listesini derlemelerini istedi. Araştırmacılar, bu soruların yaklaşık 500’üne beş LLM tarafından üretilen yanıtları, eğitimli yerel klinisyenlerin yanıtlarıyla karşılaştırdı. Yanıtların 5 puanlık bir ölçekte değerlendirilmesi, tüm LLM’lerin, yerleşik tıbbi konsensüsle uyum, soruyu anlama ve yanıtın zarara yol açma olasılığı da dahil olmak üzere 11 ölçütün tamamında yerel klinisyenlerden daha iyi performans gösterdiğini ortaya koydu. Ekip ayrıca, LLM’lerin Ruanda’nın ulusal dili olan Kinyarwanda dilinde yaklaşık 100 soruyu yanıtlayabildiğini de gösterdi.









