Yazılım Geliştirmede Yapay Zeka Devrimi
OpenAI de dahil olmak üzere teknoloji şirketleri, sadece kod yazmakla kalmayıp aynı zamanda hata ayıklama, düzenleme ve eleştirme yeteneklerine sahip yeni nesil yapay zeka asistanları geliştiriyor.
Biz bir kodlayıcı olmaktan oldukça uzağız, ancak SWE-agent adında ücretsiz bir program sayesinde GitHub’daki farklı kod depolarında yanlış adlandırılmış bir dosyayla ilgili karmaşık bir sorunu hata ayıklayarak ve düzelterek çözebildik.
SWE-agent’ı GitHub’daki bir soruna yönlendirdik ve kodu gözden geçirip neyin yanlış olabileceğini düşündüğünü izledik. Hatanın kök nedeninin bir dosyanın yanlış konumuna işaret eden bir satır olduğunu doğru bir şekilde belirledi, ardından projede gezindi, dosyayı buldu ve kodu düzelterek her şeyin düzgün çalışmasını sağladı. Bu, deneyimsiz bir geliştiricinin (bizim gibi) saatlerce uğraşarak çözmeye çalışabileceği türden bir şey.
Pek çok kodlayıcı zaten yapay zekayı yazılımı daha hızlı yazmak için kullanıyor. GitHub Copilot, yapay zekayı entegre eden ilk geliştirici ortamıydı, ancak artık pek çok IDE, bir geliştirici yazmaya başladığında otomatik olarak kod parçalarını tamamlayabiliyor. Ayrıca yapay zekaya kod hakkında sorular sorabilir veya üzerinde çalıştığınız şeyi nasıl geliştirebileceğiniz konusunda önerilerde bulunmasını isteyebilirsiniz.
Geçen yaz, Yurtdışında bir doktora öğrencileri yapay zekanın gerçek bir yazılım mühendisi olması için ne gerektiğini tartışmaya başladılar. Bu, onların ve Princeton’daki diğerlerinin, çeşitli kodlama görevlerinde yapay zeka araçlarını test etmek için SWE-bench adında bir dizi ölçüt geliştirmelerine yol açtı. Ekim ayında ölçütü yayımladıktan sonra, ekip bu görevleri yerine getirecek kendi aracı olan SWE-agent’ı geliştirdi.
SWE-agent (“SWE”, “software engineering” yani “yazılım mühendisliği”nin kısaltmasıdır), sadece kod satırları yazmanın ötesine geçen ve yazılımı yönetmek, hata ayıklamak ve düzenlemek için gereken araçları kullanan, oldukça daha güçlü yapay zeka kodlama programlarından biridir. Bir startup, Mart ayında bu tür bir aracın video demosuyla viral oldu.
Princeton ekibinden bir araştırmacı, SWE-bench’in OpenAI’nin yazılım ajanlarının performansını ve güvenilirliğini test etmesine yardımcı olabileceğini söylüyor. “Bu sadece benim fikrim, ama bence onlar çok yakında bir yazılım ajanı çıkaracaklar,” diyor araştırmacı.
OpenAI yorum yapmayı reddetti, ancak şirketin faaliyetlerine aşina olan ve adının açıklanmasını istemeyen bir başka kaynak WIRED’a, “OpenAI kesinlikle kodlama ajanları üzerinde çalışıyor,” dedi.
GitHub Copilot’un büyük dil modellerinin kod yazabileceğini ve programcıların verimliliğini artırabileceğini göstermesi gibi, SWE-agent gibi araçlar da yapay zeka ajanlarının kod oluşturma ve bakımında güvenilir bir şekilde çalışabileceğini kanıtlayabilir.
Birçok şirket yazılım geliştirme için ajanları test ediyor. Çeşitli kodlama görevlerinde farklı ajanların puanlarını ölçen SWE-bench liderlik tablosunun en üstünde, bir startup olan Factory AI’den bir araç, ardından Yurtdışında bir üniversitede bir ekip tarafından geliştirilen açık kaynaklı bir giriş olan AutoCodeRover yer alıyor.
Büyük oyuncular da devreye giriyor. Amazon Q adında bir yazılım yazma aracı, SWE-bench’teki bir başka üst performans gösteren araç. Amazon Web Services’te yazılım geliştirme başkan yardımcısı , “Yazılım geliştirme sadece yazmaktan çok daha fazlasıdır,” diyor.
Başkan yardımcısı, AWS’nin bu aracı kullanarak tüm yazılım yığınlarını bir programlama dilinden diğerine çevirdiğini ekliyor. “Bu, yanınızda oturan ve sizinle birlikte bir uygulama yazan ve inşa eden gerçekten akıllı bir mühendise sahip olmak gibi bir şey,” diyor .“Bence bu oldukça dönüştürücü.”
OpenAI’den bir ekip, Princeton ekibine SWE-agent gibi araçların güvenilirliğini ve etkinliğini ölçen bir ölçüt geliştirmelerinde yardım etti, bu da şirketin kod yazma veya bilgisayarda başka görevler yapma konusunda ajanları geliştiriyor olabileceğini gösteriyor.
Başkan yardımcısı bir dizi müşterinin Q’yu kullanarak karmaşık arka uç uygulamaları zaten inşa ettiğini söylüyor. SWE-bench ile yapılan deneyler, kod yazan herkesin yakında programlama yeteneklerini artırmak için ajanları kullanmak isteyeceğini veya geride kalma riskiyle karşı karşıya kalacağını öne sürüyor.
Etiketlendi:
- Yapay Zeka
Ne düşünüyorsunuz?
Fikrini bilmek güzel. Yorum bırakın.