ChatGPT’nin piyasaya sürülmesiyle beraber gündeme gelen büyük dil modelleri, ardından Gemini, DeepSeek, Llama ve Grok gibi farklı örneklerin de tanıtılmasıyla günlük yaşamda önemli bir yer edindi.
Bu büyük dil modellerinin yetenekleri dünya genelinde dikkat çekici bir etki yaratırken, kullandıkları kaynaklar da uzun süredir tartışmaların merkezinde bulunuyor.
Derlenen verilere göre, birçok büyük dil modeli, özellikle ChatGPT, cevaplarını oluştururken kamuya açık internet sitelerinden faydalanıyor.
Reddit yüzde 40 ile zirvede
Online istatistik platformu Statista, yapay zeka dil modellerinin hangi kaynakları ne ölçüde kullandığını araştırdı. Statista’nın haziran ayında gerçekleştirdiği araştırmada, yılın ilk çeyreğinde en çok alıntı yapılan web siteleri arasında Reddit, yüzde 40,11 ile ilk sırada yer aldı.
Uzmanlar, yapay zekanın belli konular üzerine gerçek kişilerin tartışmalara katıldığı Reddit platformundan alıntı yapmasının, bu modellerin geliştiricilerinin resmi bilgilerden çok gerçek kişilerin doğal konuşmalarını tercih ettiğini ortaya koyduğunu belirtiyor.
Reddit’in ardından büyük dil modelleri en çok alıntıyı yüzde 26,3 ile Wikipedia’dan, yani “internet ansiklopedisi” olarak tanımlanan kaynaktan alıyor.
Araştırmaya göre, düzenlenmiş makaleleri kullanabilen Wikipedia, herhangi bir düzenleme süzgecinden geçmeyen Reddit verileri ile kıyaslandığında oldukça geride kalmış durumda.
Hangi dil modelinin hangi kaynağı ne sıklıkla kullandığını gösteren listede, üçüncü sırada yüzde 23,5 ile YouTube, yüzde 23,2 ile Google, yüzde 21 ile yelp.com, yüzde 19,9 ile Facebook, yüzde 18,7 ile Amazon, yüzde 12,4 ile Tripadvisor, yüzde 11,2 ile mapbox.com ve yine yüzde 11,2 ile openstreetmap.com yer almakta.
Google ile Reddit arasında yapay zekayı eğitme anlaşması
Öte yandan, yapay zeka modellerinin eğitimiyle ilgili sosyal medya devleri ve yapay zeka üreticileri arasında çeşitli anlaşmalar yapılmakta.
2024 yılında Google ile Reddit arasında gerçekleştirilen anlaşma ile, Google’ın yapay zekalarının Reddit verileriyle de beslenileceği duyuruldu.
Reuters’te yer alan habere göre, bu anlaşma kapsamında Google, Reddit’e yıllık 60 milyon dolar ödeme yapacak. Yine bir başka Reuters haberi, Reddit’in OpenAI ile ChatGPT için bir veri paylaşımı anlaşması yaptığını ortaya koyuyor.
Bu gelişmeler, yapay zekanın sağladığı cevaplardaki Reddit etkisini daha da güçlendirmiş durumda.


