Bu karar, Grok’un sosyal medya platformu X üzerinden “beyaz soykırımı” gibi tartışmalı ve izinsiz paylaşımlarda bulunmasının ardından alındı. xAI, bu beklenmeyen çıkışların sistem komutlarında yapılan yetkisiz bir değişiklik nedeniyle yaşandığını ifade etti.
Sistem komutları, bir yapay zekâya kullanıcı mesajlarından önce verilen, yanıtları yönlendirmek için kullanılan temel talimat setleridir. Bu komutlar genellikle şirketler tarafından gizli tutulur. Ancak xAI, bu şeffaflık adımıyla Grok’un nasıl yönlendirildiğini açıklamayı seçen nadir şirketler arasında yer aldı. Grok’un sistem komutları artık GitHub üzerinden kamuya açık şekilde paylaşılacak.
Yayınlanan sistem komutları, Grok’un nasıl bir karaktere sahip olması gerektiğine dair net bir çerçeve çiziyor. Örneğin, aşırı derecede şüpheci olması gerektiği belirtilen Grok, ana akım otoriteleri ya da medyayı körü körüne takip etmeyecek şekilde programlanmış. Komutlarda ayrıca Grok’un verdiği yanıtların onun kendi görüşleri olmadığının altı çiziliyor: “Yanıtlarınız sizin inançlarınızı yansıtmaz.”
X platformunda kullanıcıların Explain this Post (Bu Gönderiyi Açıkla) seçeneğini kullandığı senaryolarda Grok’tan ana akım anlatıları sorgulayabilecek, doğru ve temelli içgörüler sunması bekleniyor. Ayrıca, Grok’un platforma “Twitter” değil “X” olarak atıfta bulunması, paylaşımlara da “tweet” yerine “X post” demesi talimatlar arasında yer alıyor.
xAI ve Anthropic farklı yollar izliyor
xAI’in bu yaklaşımı, yapay zekâ güvenliği konusunda daha temkinli bir çizgi izleyen Anthropic’in Claude adlı sohbet botunun sistem komutlarıyla belirgin bir şekilde ayrışıyor. Claude’un komutlarında güvenlik, etik ve kullanıcı sağlığı ön planda tutuluyor. Claude, örneğin bağımlılık, yeme bozuklukları ya da negatif iç konuşma gibi zararlı davranışları teşvik eden içeriklerden kaçınmak üzere programlanmış durumda.
Grok’un şüpheci ve ana akım karşıtı karakteri, bazı kullanıcılar için çekici olsa da, son yaşanan olay platformun güvenilirliği açısından ciddi bir uyarı niteliğinde. xAI’nın bu sistemi şeffaflaştırma kararı, hem kamuoyunun güvenini yeniden kazanmak hem de olası yeni krizleri önlemek amacı taşıyor.
Yapay zekâ modellerinin nasıl eğitildiği ve yönlendirildiği giderek daha fazla tartışma konusu haline gelirken, xAI’nın bu hamlesi sektörde daha fazla şeffaflık çağrılarını da tetikleyebilir. Ancak sistem komutlarının kamusal hale gelmesi, aynı zamanda kötü niyetli kullanıcılar tarafından yapılacak prompt injection saldırılarına da açık kapı bırakabilir.