September 21, 2024

OpenAI o1 nedir?

OpenAI o1 nedir?

OpenAI o1, OpenAI'nin yeni bir model serisidir. Birçok açıdan GPT-4o gibi diğer OpenAI modellerine benzer olsalar da - ve hala transformatörler ve bir sinir ağı gibi temel teknolojileri kullanıyorlar - o1 modelleri, mantıksal akıl yürütme gerektiren karmaşık görevler ve daha zor sorunlar üzerinde çalışmada önemli ölçüde daha iyidir.

Şu anda üç o1 modeli var:

  • OpenAI o1: En yetenekli o1 modeli, şu anda mevcut değil, ancak OpenAI performansı hakkında bilgi yayınladı.
  • OpenAI o1-preview: Tam model kadar güçlü olmasa da, tam o1 modelinin önizleme sürümü. ChatGPT Plus aboneleri tarafından ve OpenAI API aracılığıyla kullanılabilir.
  • OpenAI o1-mini: Hız için optimize edilmiş bir o1 sürümü.

o1 modelleri GPT-4o ve GPT-4o mini'nin yerine geçmez: daha gelişmiş görevler için mantıklı olan farklı bir fiyat-performans takası sunarlar. Bunun neye benzediğini araştıralım.

OpenAI o1 nasıl çalışır?

OpenAI'ye göre, o1 modelleri yanıt vermeden önce sorunları "düşünmek" için eğitildi. Aslında bu, Düşünce Akılcı Zinciri (CoT) adı verilen hızlı bir mühendislik tekniğini doğrudan modele entegre ettikleri anlamına gelir.

Bir o1 modeline hemen bir yanıt oluşturmaya çalışmak yerine karmaşık bir istem verdiğinizde, yapmasını istediğiniz şeyi birden fazla basit adıma ayırır. Daha sonra çıktısını oluşturmadan önce bu düşünce zinciri boyunca adım adım çalışır.

OpenAI'nin blogundaki tanıtım gönderisinde, o1-önizleme modelinin bir şifre metnini çözme, bir bulmaca çözme ve matematik, kimya ve İngilizce sorularını doğru yanıtlama gibi karmaşık problemleri analiz etmek için CoT akıl yürütmeyi nasıl kullandığına dair birkaç örnek görebilirsiniz. Bunlara bakmaya değer—o1 modellerinin nasıl çalıştığı hakkında size çok daha iyi bir fikir verecekler.

Ne yazık ki, OpenAI bu düşünce zincirlerini kullanıcılara göstermemeye karar verdi. Bunun yerine, kilit noktaların yapay zeka tarafından oluşturulan bir özetini alırsınız. Modelin farklı sorunlarla nasıl başa çıktığını anlamak için hala yararlıdır, ancak size ne yapmaya çalıştığına dair daha fazla ayrıntı vermeyecektir.

Yapay zekanın ne yaptığını tanımlamak için "düşünme" gibi antropomorfize edici bir kelime kullanmanın zor olduğunu iddia etmekten her zaman mutlu olsam da, yeni modellerin size doğrudan yanıt vermeden önce isteminizi işlemek için zaman aldığı gerçeğini yakalar. Araştırmalar, CoT'nin yapay zeka modellerinin doğruluğunu güvenilir bir şekilde artırdığını göstermiştir, bu nedenle OpenAI o1'in karmaşık zorluklarda GPT-4o modellerinden önemli ölçüde daha iyi olması şaşırtıcı değildir.

Güçlendirme öğrenimini (modelin işleri doğru yaptığı için ödüllendirildiği) kullanarak, OpenAI o1 modellerini birden fazla yaklaşım denemek, hataları tanımak ve düzeltmek ve iyi bir cevap bulmak için karmaşık sorunlar üzerinde çalışmak için zaman ayırmak için eğitti.

OpenAI, o1 modellerinin performansının hem eğitim süresi hem de bir cevap vermeden önce akıl yürütmelerine ne kadar süre izin verildiği ile arttığını tespit etti. Bu, o1'in ne kadar çok bilgi işlem kaynağına erişimi olursa, o kadar iyi performans gösterdiği anlamına gelir - bu yüzden bu kadar pahalıdır (birazdan buna geleceğiz).

Aksi takdirde, OpenAI o1 diğer modern LLM'lerle hemen hemen aynı şekilde çalışıyor gibi görünüyor. OpenAI, mimarisi, parametre sayısı veya diğer değişiklikler hakkında anlamlı bir ayrıntı yayınlamadı, ancak şimdi büyük yapay zeka şirketlerinden beklediğimiz şey bu. İsmine rağmen, OpenAI aslında açık yapay zeka modelleri üretmiyor.GPT-4o ve OpenAI o1

Mantıksal akıl yürütme gerektiren görevler söz konusu olduğunda, OpenAI o1 ve OpenAI o1-mini, GPT-4o'dan (ve dolayısıyla neredeyse tüm diğer AI modellerinden) önemli ölçüde daha iyidir. MMLU gibi GPT-4o'nun gerçekten iyi performans gösterdiği bazı mantık gerektiren tipik yapay zeka kıyaslamalarında, OpenAI o1 hala daha yüksek puanlar alıyor.

Daha da ilginç bir şekilde, yüksek düzeyde mantıksal akıl yürütme gerektiren görevlerde GPT-4o oldukça kötü performans gösterme eğilimindedir. OpenAI'nin kullandığı bir örnek 2024 ABD Matematik Olimpiyatı (AIME) makalesidir. GPT-4o, 15 zor matematik sorusundan yalnızca ikisini doğru cevaplayabildi. Ancak o1, 13'ünü doğru almayı başardı ve bu da onu ABD'de makaleyi alan en iyi 500 öğrenci arasına yerleştirecekti. Durum, rekabetçi kodlama platformu Codeforces'ta da benzer. GPT-4o yalnızca yüzde 11'de puan alırken, tam o1 modeli yüzde 89'da puan alır.

Openai o1 MLT DİGİTAL

OpenAI o1 buna değer mi?

Hem o1-preview hem de o1-mini modellerinin çoğu yapay zeka modelini rahatsız eden türdeki sorunları çözme yeteneğinden çok etkilenmiş olsam da, aksi takdirde göze çarpmadılar. Hatta birçok kullanışlı özellik bile eksik: örneğin yüklenen görüntüleri veya dosyaları işleyemezler veya internetten içerik çekemezler.

Yani, en azından şimdilik, o1 modelleri süper heyecan verici bir gelişmedir - ancak mevcut LLM'ler ve büyük çok modlu modeller hala kullanımları olacaktır. OpenAI, istemlerinizi otomatik olarak en uygun modele yönlendirmek için bir sistem üzerinde çalıştığını söylüyor, bu da kesinlikle işlerin daha sorunsuz çalışmasını sağlayacak.

haydi konusalım