OpenAI, yapay zeka araştırmalarındaki hızlı gelişmelere bir yenisini daha ekleyerek, Uluslararası Matematik Olimpiyatları’nda (IMO) “altın madalya seviyesinde performans” sergiledi.
Şirketin büyük dil modelleri (LLM) ve akıl yürütme üzerine çalışan araştırmacısı Alexander Wei, sosyal medya platformu X’te yaptığı bir paylaşımda, deneysel bir araştırma modelinin yapay zeka alanındaki uzun zaman beklenen büyük zorluğu başarıyla aştığını açıkladı.
GİZLİ BİR MODEL
Wei, kamuya henüz tanıtılmamış bir OpenAI modelinin, dünyanın en köklü ve prestijli matematik yarışmalarından biri olan IMO’da, altı sorudan beşini çözerek toplamda 42 üzerinden 35 puan aldığını belirtti.
IMO, her ülkenin altışar öğrencisini gönderdiği ve son derece zor cebir ile ön-kalkülüs (pre-calculus) problemleriyle tanınan bir yarışmadır. Sorular ilk bakışta basit gibi görünse de, tam puan almak için yaratıcı ve derinlemesine çözüm yöntemleri gerekmektedir. Bu yılki yarışmada 630 katılımcıdan yalnızca 67’si altın madalya kazanmayı başardı; bu oran yaklaşık yüzde 10 düzeyinde bir başarıyı ifade ediyor.
İNSAN BENZERİ AKIL YÜRÜTME
Yapay zeka sistemleri genellikle büyük veri setlerini analiz etmek veya tekrarlayan işleri yerine getirmek gibi alanlarda başarılı olsa da, yaratıcı düşünme veya karmaşık karar verme gerektiren durumlarda yetersiz kalabiliyorlar.
Ancak OpenAI, bu son başarıyla birlikte geliştirdikleri modelin karmaşık matematik problemlerini insan benzeri bir akıl yürütme ile çözebildiğini vurguluyor.
OpenAI CEO’su Sam Altman, “Bu başarı sayesinde, insan matematikçilerin seviyesinde detaylı ve sağlam mantık zincirleri kurabilen bir model elde ettik,” dedi.
Şirket, modelin yakın bir zamanda kamuya sunulmayacağını da açıkladı. Bu durum, merakla beklenen GPT-5’in bir önceki versiyonuna göre daha gelişmiş olacağı anlamını taşırken, IMO seviyesinde matematik çözme yeteneğine henüz sahip olmayacağına işaret ediyor.