İşte bu korkutucu olmaya başladı! Yapay zeka 'ofis koltuğuna' oturdu
Yapay zekanın yapabildiklerinin sınırı hayal gücüyle sınırlı olacak gibi görünüyor. Bunu kanıtlayan nitelikteki son yeniliklerden biri de Anthropic yapay zekasının Claude AI için yeni ‘bilgisayar kullanımı’ özelliğini kullanıma sunmasıyla ortaya çıktı. Bu özellikle beraber yapay zeka artık bilgisayarı kendi başına kullanabiliyor.
Yapay zeka dünyasında büyük bir yenilik olarak, Anthropic, Claude 3.5 Sonnet modeline entegre ettiği yeni "bilgisayar kullanımı" özelliğini tanıttı. Bu özellikle Claude, bir insan gibi ekranı görerek fareyi hareket ettirebiliyor, tıklamalar yapabiliyor ve metinler yazabiliyor. Bu özellik, halihazırda API üzerinden geliştiricilere sunulmuş durumda.
YAPAY ZEKA ARTIK BİLGİSAYAR KULLANIYOR
Microsoft'un Copilot Vision özelliği ve OpenAI'nin ChatGPT için masaüstü uygulaması, bilgisayarınızın ekranını görmeye dayalı olarak yapay zeka araçlarının neler yapabileceğini zaten göstermişti. Google’ın Android’deki Gemini uygulaması da yine benzer yeteneklere sahip. Ancak, Anthropic’in yeni özelliği, bu yeteneklerin bir adım ötesine geçiyor ve yapay zekaya, ekran üzerinde aktif görevler gerçekleştirme yetisi kazandırıyor.
Bu bir adım ötesi ise aşağıdaki videoda gösteriliyor. Anthropic araştırmacısı Pujaa Rajan, Claude'a Golden Gate köprüsünde gün doğumu yürüyüşü yapmak istediğini söylüyor ve evden ne zaman ayrılması gerektiğine dair bir program ayarlayıp ayarlayamayacağını soruyor. Ardından yapay zeka bir tarayıcı açıyor, gün doğumu saatlerini ve yürüyüş yerlerini buluyor, Rajan'ın bölgesinden seyahat sürelerini hesaplıyor, ardından bir takvim açıyor ve ilgili girişi yapıyor.
Anthropic, bu yeni özelliğin hala deneysel olduğunu ve bazı zorluklar içerebileceğini belirtiyor. "Bilgisayar kullanımı" özelliğinin hatalara yatkın ve bazen zahmetli olabileceği konusunda uyarıda bulunuyorlar. Şirket, bu özelliği erken bir aşamada geri bildirim toplamak amacıyla yayınladığını ve yeteneklerin zamanla hızla iyileştirileceğini ifade ediyor.
Özellikle Claude'un, ekranı sürekli olarak video akışı şeklinde izlemek yerine ekran görüntülerini birleştirerek görmesi nedeniyle bazı kısa süreli bildirimleri ya da hareketleri kaçırabileceği belirtiliyor. Ayrıca, Claude’un sosyal medya ile etkileşimde bulunmaktan kaçınması ve seçimlerle ilgili faaliyetlerden uzak durması yönünde sınırlamalar getirildiği de bildiriliyor.
Claude 3.5 Sonnet's current ability to use computers is imperfect. Some actions that people perform effortlessly—scrolling, dragging, zooming—currently present challenges. So we encourage exploration with low-risk tasks.
— Anthropic (@AnthropicAI) October 22, 2024
We expect this to rapidly improve in the coming months.
Her ne kadar kısıtlama ve sınırlama olursa olsun, yukarıdaki video oldukça etkileyici. Bir alttaki görselde Claude, kendisinden istenen işlemi yapmak için birden fazla pencerede çalışıyor. Bunlar etkileyici olsa da firmanın dediği gibi; "bilgisayar kullanımı" oldukça erken aşamada. Anthropic, video demolarını yaparken bunu birinci elde de deneyimlemiş. Zira yapay zeka, Anthropic'in kaydetmeye çalıştığı kodlama demosunu yapmayı bırakıp Google'da bazı manzara fotoğrafına bakmaya başlamış. Belki de yapay zeka da insanlar gibi sıkılıp bazen Google'da kaybolmayı seviyordur...
5 ya da 10 yıl içinde, bu aracı (agent) yapay zekaların dijital dünyada işlerimizi halletmek için nasıl da birincil araçlarımız haline geleceğini görmemek zor. Her gün saatlerimiz bilgisayar başında geçiyor. Her gün saatlerce aynı işlemleri aynı şekilde yapıyoruz... Bu tür meşguliyetler gününüzün veya hayatınızın ne kadarını alıyor? Bu görevleri güvenilir bir yapay zeka asistanına devretmek ne kadar güzel olurdu? Bu son derece düşündürücü ve aynı zamanda korkutucu da bir an.
Yapay zeka oldukça hızlı ilerleyen bir kamyon gibi. Önüne çıkanları yok ediyor, edecek. İçerisinde bulunan bizler ise emniyet kemerlerini sıkıca takmamız gerekiyor çünkü bu araçta fren bulunmuyor
Bu arada Claude 3.5 Sonnet modeli, birçok endüstri standartlarında önemli iyileştirmeler gösteriyor ve önceki versiyonu ile aynı hız ve fiyatta sunuluyor. Özellikle kod yazma ve araç kullanma görevlerinde üstün başarılar elde eden model, yazılım mühendisliği testlerinde performansını yüzde 33,4'ten yüzde 49'a çıkararak OpenAI’ın modellerini geride bıraktı. Ayrıca Claude’un, perakende sektöründeki görevlerde yüzde 69,2, havacılık sektöründe ise yüzde 46 gibi yüksek başarı oranlarına ulaştığı ifade ediliyor. Bu başarılar, Claude’un kodlama ve araç kullanma gibi karmaşık görevlerde gelecekte daha da etkin olabileceğinin bir işareti olarak görülüyor.
Kaynak: DonanımHaber