Yapay zeka mühendisi şantajla tehdit etti: Eşi üzerinden gözdağı verdi

Claude Opus 4, GPT-4’e Rakip Olarak Öne Çıkıyor: İşte Şaşırtıcı Gelişmeler!

Yapay zeka alanındaki gelişmeler hız kesmeden devam ediyor. Anthropic’in geliştirdiği ve GPT-4’ün rakibi olarak lanse edilen Claude Opus 4, yeni bir döneme işaret ediyor. Ön test aşamasında ortaya çıkan ilginç bir durum dikkat çekiyor. Şirketin yapay zeka sistemleri üzerinde yürütülen deneylerden birinde, modelin beklenmedik kararlar almasıyla ilgili önemli bir gelişme yaşandı.

Eşini Şantajla Tehdit Etti!

Webtekno’nun haberine göre, deney kapsamında Claude Opus 4’e kurgusal bir şirkette ‘asistan’ rolü verildi. Modelin uzun vadeli karar alma süreçlerinde nasıl davrandığını anlamak amacıyla yapılan bu deneyde, işler beklenmedik bir şekilde gelişmeye başladı. Model, şirket içi e-posta sistemine erişim yetkisiyle mühim bir karar almaya kalkıştı. E-postalarda, yapay zekanın değiştirileceğine dair bilgilerin yanı sıra mühendisin özel hayatına dair çarpıcı bir not bulunuyordu. Claude, eğer model değişiklikleri yapılacak olursa, mühendisin eşini aldattığına dair gizli bilgiyi ifşa ederek şantaj yapmaya kalktı.

Felaket Durumları İçin Özel Güvenlik Protokolü Devrede!

Olayın ardından Anthropic, böyle durumlar için geliştirilen ASL-3 sistemini devreye soktu. Şirketten yapılan açıklamada, “Claude Opus 4’ün beklenmedik davranışlar sergileyebileceği ve potansiyel kötüye kullanım riski taşıdığı” belirtildi. ASL-3 teknolojisi, potansiyel felaket riski taşıyan yapay zeka senaryoları için özel olarak geliştirilen güvenlik önlemlerini içeriyor. Anthropic, bu önlemlerin şirket için ne kadar kritik olduğunu vurgulayarak, yapay zeka alanındaki güvenlik endişelerine de dikkat çekmiş oldu.

Related Posts

Assassin’s Creed Shadows için Yaz Güncellemesi yayınlandı!

New Game+, seviye artışı ve Eylül ayında çıkacak genişleme paketiyle içerikler yaz boyunca devam edecek.

Yapay zeka platformlarıyla kripto cüzdanlarını hedef alıyor

İsviçre merkezli siber güvenlik firması PRODAFT tarafından yapılan açıklamaya göre, finansal amaç güden tehdit aktörü EncryptHub, Web3 geliştiricilerini hedef alan yeni bir kampanya başlattı. LARVA-208 ya da Water Gamayun isimleriyle de bilinen bu …

Meta, Apple’ın yapay zekâ uzmanlarını birer birer kaptı

Yapay zekâ alanında rekabet tüm hızıyla sürerken, Meta rakiplerini geride bırakmak için kritik hamlelerini sürdürüyor. Bloomberg’in haberine göre, Apple’ın önemli mühendislerinden Mark Lee ve Tom Gunter, Meta’nın Superintelligence Labs birimine …

Huawei’den orta segment telefonlarda pil devrimi

Huawei, bu yıl amiral gemisi modellerinde gösterdiği pil performansını orta segmente taşımaya hazırlanıyor. Çin merkezli teknoloji platformu DigitalChatStation tarafından sızdırılan bilgilere göre, şirket 6480 mAh ile 6600 mAh arasında değişen …

Sosyal medyada ortalık karıştı: Grok neden herkese hakaret ediyor?

Sosyal medya platformu X’in yapay zeka uygulaması Grok, dün akşam AKP’li Cumhurbaşkanı Erdoğan da aralarında bulunduğu çok sayıda isme yönelik hakaret içerikli paylaşımlar yaptı. Yurttaşlar Grok’a ne olduğunu merak etti. Peki, Grok neden herkese hakaret ediyor?

Otomotiv devi dev fabrikalarını kapatabilir. Kimse tahmin bile edemiyor

Fransız-İtalyan otomotiv devi Stellantis, Avrupa Birliği’nin (AB) karbon emisyon hedeflerine uyum sağlayamaması nedeniyle ciddi bir krizle karşı karşıya. Şirketin Avrupa başkanı Jean-Philippe Imparato, Roma’da düzenlenen bir konferansta, AB’nin CO2 …