Deal ini menjadi gambaran kekhawatiran yang kian meningkat di kalangan perusahaan teknologi bahwa model-model yang lebih canggih akan disalahgunakan oleh penjahat siber dan peretas guna mencari celah dalam kode sumber dan melewati pertahanan siber. Pesaing Anthropic, OpenAI, juga sebelumnya menekankan kemampuan siber yang semakin meningkat dari model-modelnya dan memperkenalkan program percontohan yang dimaksudkan untuk menempatkan alat-alatnya “di tangan para pembela terlebih dahulu.”
“Kami berpandangan bahwa ini bukan sekadar masalah Anthropic. Ini adalah masalah industri, yang harus dapat ditangani baik oleh perusahaan swasta maupun pemerintah,” kata Newton Cheng, pemimpin inisiatif siber di dalam Frontier Red Team Anthropic. “Yang kami coba lakukan dengan Glasswing adalah memberi keunggulan awal bagi para pertahanan.”
Anthropic mengatakan telah mendiskusikan kemampuan Mythos terkait keamanan dengan pejabat AS, namun menolak menyebutkan lembaga yang dimaksud. Cheng merujuk pada kerja sama perusahaan yang sudah ada dengan Cybersecurity and Infrastructure Security Agency dan National Institute of Standards and Technology.
Mythos adalah model AI termutakhir dan tidak dikembangkan secara khusus untuk tujuan keamanan siber, kata Anthropic. Namun, Mythos telah menemukan sejumlah masalah keamanan, kata Cheng, termasuk bug berusia 27 tahun yang digunakan dalam software internet kritis. Sistem AI tersebut juga menemukan kerentanan berusia 16 tahun dalam baris kode software game populer yang telah dipindai lima juta kali oleh alat pengujian otomatis namun tidak pernah terdeteksi, kata Anthropic.
Dianne Penn, kepala manajemen produk untuk penelitian di Anthropic, mengatakan bahwa ada perlindungan yang diterapkan untuk memastikan bahwa anggota Project Glasswing mengontrol dengan ketat akses ke model Mythos, tetapi menolak untuk membagikan detail lebih lanjut karena alasan keamanan.
Keberadaan Mythos pertama kali terungkap berkat bocoran pada akhir bulan lalu, setelah draf postingan blog tersebut tertinggal di repositori data yang dapat dicari oleh publik.
(bbn)























