Meta, En Gelişmiş Açık Kaynak AI Modelini Piyasaya Sürdü
Geçtiğimiz Nisan ayında Meta, AI endüstrisi için bir ilk olacağını duyurmuştu: OpenAI gibi şirketlerin en iyi özel modelleriyle eşleşen bir açık kaynak modeli üzerinde çalışıyordu. Bugün, o model nihayet ortaya çıktı. Meta, şirketin GPT-4o ve Anthropic’in Claude 3.5 Sonnet modellerini çeşitli ölçütlerde geride bıraktığını iddia ettiği, şimdiye kadarki en büyük açık kaynaklı AI modeli olan Llama 3.1’i yayınladı. Ayrıca Meta, Llama tabanlı Meta AI asistanını daha fazla ülke ve dilde kullanıma sunarken, kişinin belirli bir benzerliğine dayalı görüntüler oluşturabilen bir özelliği de ekliyor. CEO, Meta AI’nin yıl sonuna kadar ChatGPT’yi geçerek en yaygın kullanılan asistan olacağını tahmin ediyor.
Llama 3.1, birkaç ay önce çıkan daha küçük Llama 3 modellerinden önemli ölçüde daha karmaşıktır. En büyük versiyonu 405 milyar parametreye sahiptir ve Nvidia’nın son derece pahalı H100 GPU’larından 16.000’den fazlasıyla eğitilmiştir. Meta, Llama 3.1’in geliştirme maliyetini açıklamıyor, ancak yalnızca Nvidia çiplerinin maliyetine dayanarak, bu maliyetin yüz milyonlarca dolar olduğu tahmin edilebilir.
Peki, bu maliyete rağmen Meta neden Llama’yı yalnızca yüz milyonlarca kullanıcısı olan şirketlerin onayıyla kullanılabilen bir lisansla dağıtmaya devam ediyor? CEO, Meta’nın şirket blogunda yayınlanan bir mektupta, açık kaynak AI modellerinin, tıpkı Linux’un bugün çoğu telefon, sunucu ve cihazı çalıştıran açık kaynak işletim sistemi haline gelmesi gibi, özel modellerin önüne geçeceğini ve zaten daha hızlı bir şekilde geliştiğini savunuyor. Sektördeki birçok geliştiricinin öncelikle açık kaynağı kullanmaya başlayacağı bir dönüm noktası olarak nitelendiriyor.
Llama 3.1’i dünyaya tanıtmak için Meta, Microsoft, Amazon, Google, Nvidia ve Databricks gibi iki düzineden fazla şirketle işbirliği yapıyor. Meta, Llama 3.1’in üretimde çalıştırılmasının OpenAI’nin GPT-4o’sunun maliyetinin yaklaşık yarısı kadar olduğunu iddia ediyor. Model ağırlıklarını yayınlayarak, şirketlerin kendi verileri üzerinde eğitip istedikleri gibi ayarlamalar yapabilmelerine olanak tanıyor. Meta, Llama 3.1’i eğitmek için hangi verileri kullandığını pek açıklamasa da, bunu bir ticari sır olarak sakladıklarını belirtiyor. Ancak eleştirmenler, bunun kaçınılmaz telif hakkı davalarını geciktirme taktiği olduğunu savunuyor.
Meta, 405 milyar parametreli Llama 3.1 versiyonunun, daha küçük 70 milyar ve 8 milyar versiyonları geliştirmek için sentetik veri (model tarafından üretilen veri) kullandığını belirtiyor. Meta’nın Generative AI’dan Sorumlu Başkan Yardımcısı, Llama 3.1’in, “daha küçük modeller için bir öğretmen” olarak popüler olacağını ve bu modellerin daha maliyet etkin bir şekilde dağıtılacağını öngörüyor. Başkan yardımcısı, endüstrinin modeller için kaliteli eğitim verilerinin tükenmekte olduğu konusunda büyüyen bir konsensüse katılıp katılmadığı sorulduğunda, bir tavanın yaklaştığını ancak bunun düşünüldüğünden daha uzak olabileceğini söylüyor. “Kesinlikle birkaç tane daha [eğitim] çalışmamız olduğunu düşünüyoruz,” diyor. “Ama bunu söylemek zor.”
Meta, Llama 3.1’in “agentik” davranışlar sergilemesini incelemek amacıyla siber güvenlik ve biyokimyasal kullanım senaryoları için adversaryal testler (red teaming) uygulamış. Örneğin, Al-Dahle, Llama 3.1’in bir arama motoru API’si ile entegre olabilip internetten karmaşık bir sorguya dayalı bilgi alabileceğini ve görevlerinizi tamamlamak için ardışık olarak birden fazla aracı çağırabileceğini söylüyor. Bir başka örnek olarak, son beş yılda yurtdışında satılan evlerin sayısını çizmesini istediğinizde, aramayı gerçekleştirebileceğini, Python kodunu oluşturabileceğini ve çalıştırabileceğini belirtiyor.
Meta’nın kendi uygulaması olan Meta AI asistanı, genel amaçlı bir sohbet botu olarak konumlandırılıyor ve Instagram, Facebook ve WhatsApp’ın hemen her köşesinde bulunabiliyor. Bu hafta itibarıyla, Llama 3.1 ilk olarak WhatsApp ve Meta AI web sitesinde yurtdışında erişilebilir olacak, ardından önümüzdeki haftalarda Instagram ve Facebook’a da gelecek. Ayrıca Fransızca, Almanca, Hintçe, İtalyanca ve İspanyolca gibi yeni dilleri desteklemek için güncelleniyor.
Llama 3.1’in en gelişmiş 405 milyar parametreli modeli Meta AI’de ücretsiz olarak kullanılabilirken, asistan belirli bir hafta içindeki belirtilmemiş sayıda sorguyu aştığınızda sizi daha küçültülmüş 70 milyar modeline geçirecek. Bu, 405 milyar modelinin Meta için tam ölçekli çalıştırılmasının çok pahalı olduğunu göstermektedir.
Sözcü , şirketin erken kullanım değerlendirmelerinden sonra sorgu eşiği hakkında daha fazla bilgi vereceğini söylüyor.
Meta AI’deki yeni “Imagine Me” özelliği, telefonunuzun kamerası aracılığıyla yüzünüzü tarayarak görüntülerdeki benzerliğinizi eklemenize olanak tanır. Meta, bu şekilde benzerliğinizi fotoğraf profilinizdeki fotoğraflardan değil, doğrudan kameradan alarak deepfake makinesi yaratma olasılığından kaçınmayı umuyor. Şirket, insanların daha fazla AI medyası oluşturup bunları beslemelerine olan talebi görerek, bu durumun neyin gerçek olup olmadığını ayırt etmenin zorlaşmasına rağmen, daha fazla türde AI medyası yaratıp bunları beslemelerine yönelik talebi karşılamayı hedefliyor.
Meta AI, önümüzdeki haftalarda Quest başlığına da geliyor ve mevcut sesli komut arayüzünün yerini alıyor. Meta Ray-Ban gözlüklerdeki uygulama gibi, Quest’te de Meta AI’yi başlığın gerçek dünyayı gösteren ekran modundayken neye baktığınızı tanımlamak ve öğrenmek için kullanabileceksiniz.
CEO’un Meta AI’nin yıl sonuna kadar en çok kullanılan sohbet botu olacağına dair tahmininin (ChatGPT’nin 100 milyondan fazla kullanıcısı var) yanı sıra, Meta, asistanının kullanım rakamlarını henüz paylaşmadı. “Sanırım tüm endüstri hala ürün-pazar uyumuna doğru erken aşamalarında,” diyor başkan yardımcı. AI’nin zaten ne kadar abartılmış hissedilebileceğine rağmen, Meta ve diğer oyuncuların yarışın henüz yeni başladığını düşündüğü açık.
Etiketlendi:
- yapayzeka
Ne düşünüyorsunuz?
Fikrini bilmek güzel. Yorum bırakın.