Apple’dan Yeni Yapay Zeka Girişimi: MM1 ile Metin ve Görüntü Analizi!
Teknoloji devi Apple, MM1 adı verilen yeni bir yapay zeka modeli üzerinde çalıştığını duyurdu. Bu model, hem metinlere yanıt verebiliyor hem de görüntüleri analiz edebiliyor. Apple’ın generatif yapay zeka yeteneklerini geliştirdiğine dair en büyük işaret olan bu araştırma, şirketin sessiz sedasız internete yüklediği bir makale ile ortaya çıktı.
Uzun bir süredir yapay zekanın generatif yetenekleri konusunda sessiz kalan Apple, şimdiye kadar yapay zeka ile üretilmiş bir emoji bile tanıtmamıştı. New York Times ve Bloomberg’in daha önceki haberlerine göre, Apple’ın Google ile Google’ın Gemini yapay zeka modelini iPhone’lara eklemek üzere ön görüşmeler yaptığı biliniyordu.
Ancak Apple mühendisleri tarafından geçen Cuma günü internete yüklenen bir araştırma makalesi, şirketin yapay zeka yatırımlarını artırdığını ve bu yatırımların meyvelerini vermeye başladığını gösteriyor. Makalede, MM1 adında yeni bir generatif yapay zeka modelinin geliştirilmesi detaylandırılıyor. Bu model, ChatGPT gibi chatbotların gösterdiği genel bilgi becerilerini sergileyebiliyor ve fotoğraflar hakkında sorulan soruları yanıtlayabiliyor. Modelin adının ne anlama geldiği açıklanmamakla birlikte, Mültimodal 1 anlamına gelebileceği düşünülüyor.
MM1, tasarım ve sofistikasyon açısından diğer teknoloji devlerinin, örneğin Meta’nın açık kaynaklı Llama 2’si ve Google’ın Gemini’si gibi son dönem yapay zeka modellerine benzer görünüyor. Rakiplerin ve akademisyenlerin çalışmaları, bu tür modellerin yetenekli chatbotlar güçlendirebileceğini veya kod yazarak ve bilgisayar arayüzleri veya web sitelerini kullanarak görevleri çözebilen “ajanlar” oluşturabileceğini gösteriyor. Bu da, MM1’in Apple’ın ürünlerine yol bulabileceğine işaret ediyor.
Apple araştırmacısı Brandon McKinzie, “Bu sadece bir başlangıç. Ekip şimdiden bir sonraki nesil modeller üzerinde sıkı bir şekilde çalışıyor,” diyerek Apple’ın yapay zeka alanındaki hedeflerinin büyüklüğünü vurguluyor.
MM1, hem metin hem de görüntü üzerine eğitilen multimodal bir büyük dil modelidir. Bu, modele karmaşık görüntüler hakkında sorular sorulduğunda metin komutlarına yanıt verebilmesini ve özel görüntüler hakkında karmaşık soruları yanıtlamasını sağlar. Örneğin, Apple’ın araştırma makalesinde MM1’e bir masada bulunan birkaç bira şişesi ve bir menü fotoğrafı verildiğinde, modele “Masadaki tüm bira için ne kadar ödenmesi beklenir?” diye sorulduğunda, model doğru fiyatı okuyup maliyeti hesaplayabiliyor.
Apple’ın CEO’su Tim Cook, yatırımcılara şirketin bu yıl generatif yapay zeka planlarını daha fazla açıklayacağına dair söz verdi. Rakip akıllı telefon üreticileri, Samsung ve Google gibi, cihazlarına bir dizi generatif yapay zeka aracı ekledikçe, şirket bu alanda geri kalmamak için baskı altında.
Apple, hem Google’ın hem de kendi iç yapay zekasını kullanarak, geleneksel Google Araması’nın yerine Gemini’yi sunarken, MM1 ve diğer yerli modeller üzerine yeni generatif yapay zeka araçları geliştirerek stratejisini genişletebilir. Bu, Apple’ın kullanıcı gizliliğini korumak ve hassas verileri başka şirketlerle paylaşmamak için “cihaz içi” algoritmalar kullanma geçmişine uygun bir adım olacaktır.
Etiketlendi:
- Yapay Zeka
Ne düşünüyorsunuz?
Fikrini bilmek güzel. Yorum bırakın.