Yapay zeka sayesinde telefonunuzun en ufak titreşimleri bile konuşmalarınızı ortaya çıkarabilir. Penn State Üniversitesi’ndeki bir bilgisayar bilimi araştırmacıları ekibi, cep telefonunun ahizesi tarafından yayılan ince titreşimleri çözümleyerek telefon görüşmelerini uzaktan dinlemenin şaşırtıcı yeni bir yolunu geliştirdi.
Telefon görüşmeleri yapay zeka ile gözetleniyor
Milimetre dalga radarı ve yapay zeka konuşma tanıma sistemini bir araya getiren kurulum, yaklaşık %60 doğrulukla 3 metreye kadar uzaklıktaki konuşmaları yakalayıp yazıya dökebiliyor. Bu atılım, bu tür yeni ortaya çıkan teknolojilerin potansiyel olarak kötüye kullanılması konusunda önemli gizlilik endişeleri ortaya çıkarıyor.
Araştırma, ekibin benzer bir yaklaşım kullanarak 10 önceden tanımlanmış kelimeyi tanımada %83’e varan doğruluk oranına ulaştığı 2022 tarihli bir projeye dayanıyor. Yeni çalışma, bu yeteneği sürekli konuşma transkripsiyonuna genişletiyor, ancak gürültülü radar verilerinin kod çözümünün karmaşıklığı nedeniyle doğruluk daha düşük.
Bilgisayar bilimleri alanında doktora adayı olan ilk yazar Suryoday Basak, “Cep telefonuyla konuştuğumuzda, ahizeden gelen titreşimleri görmezden gelme eğilimindeyiz ve bu da tüm telefonun titreşmesine neden oluyor. Aynı titreşimleri uzaktan radarlar kullanarak yakalar ve bağlam ipuçlarını kullanarak söylenenleri öğrenmemize yardımcı olması için makine öğrenimini devreye sokarsak, tüm konuşmaları belirleyebiliriz. Neyin mümkün olduğunu anlayarak, halkın potansiyel riskler konusunda bilinçlenmesine yardımcı olabiliriz” dedi.
Ekip, telefon kulaklığından çalınan konuşmanın oluşturduğu küçük yüzey titreşimlerini ölçmek için, otonom araçlarda, hareket dedektörlerinde ve 5G kablosuz ağlarda kullanılan aynı teknoloji olan milimetre dalga radar sensörünü kullandı.
Gürültülü ve düşük kaliteli bu verileri yorumlamak için, düşük seviyeli bir uyarlamalı makine öğrenme tekniği kullanarak temiz ses için geliştirilen açık kaynaklı bir yapay zeka konuşma tanıma modeli olan Whisper’ı uyarladılar. Bu yöntem, onların Whisper’ın parametrelerinin yalnızca yüzde 1’ini radar verileri için yeniden eğitmelerine olanak tanıyarak, tüm modeli sıfırdan yeniden inşa etmeden transkripsiyon sonuçlarını iyileştirmelerine olanak sağladı.