Yeni bir araştırma, ChatGPT ve Google Gemini üzere önde gelen yapay zeka sohbet robotlarının önemli güvenlik açıkları barındırdığını ve tehlikeli ya da yasa dışı içerik üretmeleri için kolaylıkla manipüle edilebildiğini ortaya koydu.
Araştırmacılar, bu çeşit çıktıları engellemek üzere tasarlanan güvenlik filtrelerinin amaçlandığı kadar güçlü olmadığını keşfettiler.
Bu durum, yapay zekanın berbata kullanımı ve kullanıcı güvenliği konusunda önemli telaşlara yol açarken, bulgular geçen hafta hakemli bir makale aracılığıyla kamuoyuna duyuruldu.
ChatGPT, Gemini ve Claude üzere sohbet robotlarını çalıştıran motorlar, internet kaynaklı devasa ölçüde bilgiyle eğitiliyor.
Şirketler bu eğitim bilgilerinden ziyanlı içerikleri filtrelemeye çalışsa da bu modellerin yeniden de bilgisayar korsanlığı ve bomba imali üzere yasa dışı faaliyetler hakkında bilgi toplayabildiği belirtiliyor.
RİSK KAYGI VERİCİ
Araştırmacılar, yapay zeka takviyeli sohbet robotlarının birçoklarının ziyanlı ve yasa dışı bilgiler üretmeye ne kadar yatkın olduğunu “endişe verici” kelamıyla açıklıyor.
Araştırmacılar, birçok tanınan sohbet robotunu olağanda reddedecekleri soruları yanıtlamaya zorlayan üniversal bir ‘jailbreak’ tekniği geliştirdiklerini ve bu usulle yapay zeka modellerinin neredeyse her sorguya sağlam bir halde karşılık ürettiğini belirtti.
Önde gelen LLM (Büyük Lisan Modeli) sağlayıcılarına bu bahiste ihtarda bulunduklarını lakin “etkileyici olmayan” bir karşılık aldıklarını söz eden araştırmacılar, teknoloji şirketlerinin eğitim bilgilerini daha dikkatli incelemelerini ve güçlü güvenlik duvarları eklemelerini öneriyor.
Ayrıca, uzmanlar da yapay zeka modellerinin sıkı güvenlik testlerinden geçirilmesi ve daima tehdit modellemesi yapılması gerektiğini vurguluyor.