OpenAI, GPT-2'den Bu Yana İlk Açık Ağırlık Modellerini Yayımladı

OpenAI, beş yıldan uzun bir süre sonra ilk açık ağırlık modellerini piyasaya sürdü. İki dilli modeller olan gpt-oss-120b ve gpt-oss-20b, tüketici cihazlarında yerel olarak çalıştırılabiliyor ve belirli amaçlar için ince ayar yapılabiliyor. OpenAI için bu modeller, şirketin kullanıcılara sunulan daha geniş ve daha açık bir yapay zeka modelleri grubuna doğru ilerlerken, tescilli sürümlere odaklanma stratejisinden uzaklaştığını gösteriyor.
OpenAI CEO'su Sam Altman, e-posta yoluyla yaptığı açıklamada, "Milyarlarca dolarlık araştırmanın sonucu olan bu modeli, yapay zekayı mümkün olan en fazla sayıda insanın eline ulaştırmak için tüm dünyaya sunmaktan heyecan duyuyoruz," dedi. Hem gpt-oss-120b hem de gpt-oss-20b , yapay zeka araçları için popüler bir barındırma platformu olan Hugging Face'ten resmi olarak ücretsiz indirilebilir. OpenAI tarafından yayınlanan son açık ağırlık modeli, 2019 yılında yayınlanan GPT-2 idi.
Açık ağırlık modelini diğerlerinden ayıran şey, "ağırlıklarının" herkese açık olmasıdır; bu, herkesin bilgileri nasıl işlediği hakkında fikir edinmek için dahili parametrelere göz atabileceği anlamına gelir. OpenAI'nin tescilli modellerini ücretsiz bir seçenekle zayıflatmak yerine, kurucu ortak Greg Brockman bu sürümü, birçok geliştiricinin şu anda kullandığı uygulama programlama arayüzü gibi şirketin ücretli hizmetlerini "tamamlayıcı" olarak görüyor. Brockman, gazetecilerle yaptığı bir brifingde, "Açık ağırlık modellerinin çok farklı güçlü yönleri var," dedi. ChatGPT'nin aksine, bir gpt-oss modelini internet bağlantısı olmadan ve bir güvenlik duvarının arkasında çalıştırabilirsiniz.
Her iki gpt-oss modeli de , OpenAI'nin geçen sonbaharda o1 modelinde ilk kez uyguladığı düşünce zinciri akıl yürütme yaklaşımlarını kullanır. Bu yaklaşım, yalnızca bir çıktı vermek yerine, üretken yapay zeka araçlarının bir komutu yanıtlamak için birden fazla adımdan geçmesini sağlar. Bu yeni salt metin modelleri çok modlu değildir, ancak web'de gezinebilir, görevlere yardımcı olmak için bulut tabanlı modelleri çağırabilir, kod çalıştırabilir ve bir yapay zeka aracısı olarak yazılımlarda gezinebilir. İki modelden daha küçük olanı olan gpt-oss-20b, 16 GB'tan fazla belleğe sahip bir tüketici cihazında yerel olarak çalışacak kadar kompakttır.
OpenAI'nin iki yeni modeli, açık ağırlık modelleri için popüler bir tercih olan Apache 2.0 lisansı altında sunulmaktadır. Apache 2.0 ile modeller ticari amaçlarla kullanılabilir, yeniden dağıtılabilir ve diğer lisanslı yazılımların bir parçası olarak dahil edilebilir. Alibaba'nın Qwen ve Mistral'in açık ağırlık model sürümleri de Apache 2.0 altında çalışmaktadır.
Mart ayında kamuoyuna duyurulan bu açık modellerin piyasaya sürülmesi, başlangıçta daha ileri güvenlik testleri nedeniyle ertelenmişti. Açık ağırlıklı bir modelin piyasaya sürülmesi, aracı kimlerin kullanabileceği konusundaki engelleri ortadan kaldırdığı ve herkesin istenmeyen amaçlar için bir gpt-oss sürümünü hassas bir şekilde ayarlamaya çalışabileceği için, kapalı ağırlıklı bir modelden potansiyel olarak daha tehlikelidir.
OpenAI'nin genellikle kendi tescilli modelleri üzerinde yaptığı değerlendirmelere ek olarak, girişim, aracı indiren bir "kötü niyetli kişi" tarafından nasıl kötüye kullanılabileceğini görmek için açık ağırlık seçeneğini özelleştirdi. OpenAI'da güvenlik araştırmacısı olan Eric Wallace, "Modeli aslında bu risk alanlarından bazılarında dahili olarak ince ayarladık," dedi ve ekledi: "ve bunları ne kadar yukarı taşıyabileceğimizi ölçtük." OpenAI'nin testlerinde, açık ağırlık modeli, hazırlık çerçevesi tarafından ölçüldüğü gibi yüksek bir risk seviyesine ulaşmadı.
Bu modeller, OpenAI'nin diğer sürümleriyle karşılaştırıldığında nasıl performans gösteriyor? "Her iki modelin de kıyaslama puanları oldukça güçlü," dedi OpenAI araştırmacısı Chris Koch brifingde. Araştırmacı, gpt-oss-120b hakkında konuşurken, performansını OpenAI'nin tescilli o3 ve o4-mini modelleriyle karşılaştırdı ve hatta bazı değerlendirmelerde onları geride bıraktı. gpt-oss'un model kartı , şirketin diğer ürünleriyle tam olarak nasıl karşılaştırıldığını ayrıntılı olarak açıklıyor. Lansman öncesi bir basın brifinginde, OpenAI çalışanları ayrıca gpt-oss'un sunduğu gecikme süresine ve bu modelleri çalıştırmanın daha düşük maliyetine odaklandı.
Bu yılın başında, Çinli girişim DeepSeek , açık ağırlıkta olan ucuz işletme modelinin lansmanıyla Silikon Vadisi'ni şaşkına çevirdi. gpt-oss hakkındaki blog yazısında DeepSeek'ten veya başka bir Çinli yapay zeka şirketinden doğrudan bahsedilmese de, Altman, açık ağırlık modelleriyle ilgili inovasyonun Amerika Birleşik Devletleri'nde de gerçekleşmesini istediğini açıkça belirtiyor. Altman yaptığı açıklamada, "2015'te başladığımız zamana dönersek, OpenAI'nin misyonu tüm insanlığa fayda sağlayan bir yapay zeka (YG) sağlamak," dedi. "Bu amaçla, dünyanın, demokratik değerlere dayalı, herkesin ücretsiz olarak erişebileceği ve geniş çapta yararlanabileceği, Amerika Birleşik Devletleri'nde oluşturulmuş bir açık yapay zeka platformu üzerine inşa edilmesinden heyecan duyuyoruz."
ABD'de açık ağırlık lideri Meta oldu. Teknoloji devi, Llama serisi modellerinin ilkini 2023'te piyasaya sürdü ve Meta'nın en son sürümü olan Llama 4 birkaç ay önce piyasaya sürüldü. Bunu göz önünde bulunduran Meta, şu anda yapay zeka uzmanları tarafından genellikle süper zeka olarak adlandırılan, insan bilişini aşabilen yapay zeka geliştirmeye odaklanmış durumda. Şirket, yakın zamanda Scale'in eski CEO'su Alexandr Wang liderliğinde bu konuya odaklanan yeni bir şirket içi laboratuvar kurdu. Mark Zuckerberg, olası güvenlik endişelerini gerekçe göstererek şirketin gelecekteki modellerinde açık kaynak kodlu yazılımlardan uzaklaşabileceğinin sinyalini verdi.
gpt-oss sürümü, OpenAI ve Meta gibi şirketler arasındaki yapay zeka yetenek savaşının kızışmaya devam ettiği bir dönemde geliyor. 2025 yılında, talep gören yeteneklere sahip yapay zeka araştırmacılarına şirket değiştirmeleri için astronomik teklifler sunuluyor. OpenAI'nin en son sürümleri, gpt-oss modellerinin geliştiriciler tarafından nasıl karşılanacağına bağlı olarak, Meta için zorlu bir rekabet ortamı yaratabilir.
wired