Yapay Zekanın Saat ve Takvimleri Okuma Konusundaki Güçsüzlüğü Araştırma İle Gözler Önüne Serildi

Edinburgh Üniversitesi’nden Rohit Saxena liderliğinde yürütülen bir araştırma, Uluslararası Temsillerin Öğrenimi Konferansı (ICLR) 2025’te sunuldu ve 18 Mart’ta arXiv platformunda yayımlandı. Yapılan araştırma, yapay zekanın analog saatleri ve takvim tarihlerini okuma konusunda ne kadar başarısız olduğunu ortaya koydu. Ancak, bulgular henüz hakem değerlendirmesinden geçmedi.

Saxena, yapılan araştırma ile ilgili olarak “Çoğu insan erken yaşta saat okumayı ve takvim kullanmayı öğrenir. Bu çalışma, yapay zeka sistemlerinin gerçek dünyadaki zamana duyarlı görevlerde ne kadar eksik olduğunu gözler önüne seriyor” dedi.

Araştırma kapsamında Meta’nın Llama 3.2-Vision, Anthropic’in Claude-3.5 Sonnet, Google’ın Gemini 2.0 ve OpenAI’ın GPT-4o modellerine özel hazırlanan saat ve takvim görselleri sunuldu. Ancak yapılan testler sonucunda, modellerin saatleri yalnızca %38,7 oranında, takvim tarihlerini ise sadece %26,3 oranında doğru okuyabildiği ortaya çıktı.

Yapılan değerlendirmelerde, yapay zekanın görsel algılama ve mekânsal düşünme konularında yetersiz kaldığı belirtildi. Saxena, “Analog saat okumak, yalnızca görüntü tanıma değil; açı ölçmek, örtüşen akrep-yelkovanı ayırt etmek ve farklı tasarımlarla başa çıkmak anlamına gelir” açıklamasında bulundu.

Araştırma aynı zamanda takvim hesaplamalarında da benzer zayıf sonuçlar elde edildiğini ortaya koydu. Örneğin, “Yılın 153. günü hangi güne denk gelir?” gibi sorulara yapay zeka sistemlerinin çoğu zaman hatalı yanıt verdiği görüldü. Bu tür sorular, sadece bilgiye değil, tutarlı mantıksal düşünme becerisine dayanmaktadır.

Sonuç olarak, araştırma yapay zeka sistemlerinin hala insan benzeri sezgi, soyutlama ve mantık ile hareket edemediğini ve özellikle zaman algısı gibi temel görevlerde insan varlığına duyulan ihtiyacı açıkça ortaya koyuyor.