Araştırma makalelerinin sonundaki kaynaklar, belirli bir alan hakkında mevcut bilginin sağlam bir temelini, yıllarca süren araştırma ve çalışmalar sonucunda oluşturulmuş hakemli kaynaklardan oluşan bir havuzu temsil etmelidir. Bununla birlikte, araştırma makalelerinin yazımında yapay zeka ve büyük dil modellerinin artan kullanımıyla, birinin tıkladığı kaynağın aslında var olmama ve çalışmanın, kaynağın veya hatta araştırmacıların kendilerinin tamamen sahte olma olasılığı artmaktadır.
Büyük dil modelleri sahte kaynaklar ile hatalı bilgiler üretiyor
arXiv ön baskı sunucusunda yayınlanan yakın tarihli bir çalışmada, araştırmacılar milyonlarca makaleyi denetledi ve dört büyük bilimsel veri deposunda (arXiv, bioRxiv, SSRN ve PubMed Central) barındırılan araştırma makalelerinde tahmini 146.900 sahte kaynak bulunduğunu tespit etti. Bu rakamlar yalnızca 2025 yılı için geçerliydi.
Sahte kaynaklar, birkaç kötü örnekle sınırlı kalmayıp, her biri az sayıda sahte referans içeren birçok makalede ortaya çıktı ve bu da araştırmacıların yapay zekayı kullanmalarına rağmen çıktıyı doğrulamada başarısız olduklarına dair daha geniş bir örüntüye işaret ediyor.
Bilimsel araştırmalar, her yeni bulgunun daha önce ortaya konmuş olanlara bağlı olduğu önceki keşifler üzerine inşa edilerek ilerler. Bu alanda, yapay zekanın kullanımındaki hızlı büyüme ve beraberindeki yanılsamalar yavaşlama belirtisi göstermiyor ve bu da ciddi endişelere yol açıyor.
Büyük dil modelleri üzerine kurulu üretken yapay zeka araçları, akla yatkın ve gerçekçi görünen, ancak tamamen uydurma veya yanlış olan bilgiler üretmede oldukça başarılıdır. Bu modeller, kalıpları öğrenmek için büyük veri kümeleri üzerinde eğitilir ve daha sonra bu kalıpları kullanarak bir sonraki kelimeyi tahmin eder ve yeni içerik üretir. Sonuç olarak, bazen gerçek olgulara dayanmaktan ziyade kalıp tahminine dayalı çıktılar üretebilirler.

