Anthropic Tuai Protes Usai Pasang Sensor Terlalu Ketat di AI Claude Fable 5

14 Juni 2026 3 Min Read

Tak lama setelah dirilis, model kecerdasan buatan (AI) terbaru Anthropic, Claude Fable 5, justru menuai gelombang protes dari komunitas keamanan siber. Alih-alih dipuji karena kemampuannya yang mumpuni, model ini dikritik karena dianggap terlalu “dikebiri” dengan pagar pengaman atau sensor yang sangat ketat, sehingga mengganggu tugas-tugas dasar yang tidak berbahaya sekalipun.

Dua Wajah AI Tercanggih Anthropic

Claude Fable 5 menarik perhatian karena dibangun di atas fondasi teknologi yang sama dengan Claude Mythos 5, model AI paling canggih milik Anthropic saat ini. Model Mythos mencatat skor benchmark tertinggi di berbagai bidang sensitif seperti biologi, kesehatan, dan keamanan siber. Kekhawatiran akan potensi penyalahgunaan untuk membuat malware atau bahkan senjata biologis mendorong Anthropic untuk membagi teknologinya ke dalam dua versi.

Versi pertama, Claude Mythos 5, hanya diberikan kepada organisasi tertentu yang lolos verifikasi ketat. Sementara itu, Claude Fable 5 menjadi versi yang tersedia untuk publik dan pelanggan perusahaan. Di sinilah Anthropic secara sengaja memasang pagar pengaman (guardrail) yang super ketat agar akses ke kemampuan AI tingkat lanjut tidak meningkatkan risiko penyalahgunaan.

Protes Peneliti Keamanan Siber

Pendekatan keamanan ini rupanya dianggap kebablasan oleh sejumlah peneliti. Para ahli mengeluhkan bahwa Claude Fable 5 terlalu agresif dalam menyaring permintaan, sehingga banyak tugas yang sesungguhnya tidak berbahaya ikut diblokir. Peneliti keamanan IBM X-Force, Valentina “Chompie” Palmiotti, menyampaikan keluhannya secara terbuka.

Ia menyebut bahwa Fable 5 menolak hampir semua permintaan yang sedikit saja berkaitan dengan keamanan siber. Bahkan untuk tugas sederhana seperti membaca artikel blog, sistem langsung menghentikan percakapan dan menampilkan peringatan. Hal ini tentu sangat membatasi para profesional yang hanya ingin meminta bantuan meninjau kode program atau menerapkan praktik keamanan dasar dalam pengembangan perangkat lunak.

Masalah pada Sistem Penyaring Kata Kunci

Peneliti keamanan siber lainnya, Matt Suiche, mengamati bahwa sistem penyaring pada model bahasa besar ini terlihat terlalu bergantung pada kata kunci. Ia menjelaskan, jika pengguna meminta model untuk menulis kode yang aman, sistem akan langsung mengategorikannya sebagai pekerjaan keamanan siber dan kemampuan model akan diturunkan secara drastis. Hampir semua istilah yang masuk dalam rumpun kata cybersecurity dapat langsung memicu mekanisme pengamanan berlebihan tersebut.

Meski begitu, Suiche tetap optimis bahwa Claude Fable 5 akan berevolusi menjadi lebih baik seiring waktu. Menurutnya, model AI ini memang masih berada di tahap awal dan Anthropic sedang dalam proses menyesuaikan batasan-batasan yang diterapkan.

Harga Mahal di Balik Pembatasan

Claude Fable 5 tetap diposisikan sebagai salah satu model AI publik terkuat milik Anthropic. Perusahaan mengklaim keunggulannya dalam rekayasa perangkat lunak, analisis data, pekerjaan berbasis pengetahuan, hingga pemrosesan gambar. Keamanannya juga telah diuji secara intensif melalui lebih dari 1.000 jam pengujian bug bounty dan red teaming eksternal tanpa ditemukan metode universal untuk menjebol sistem.

Namun, akses ke kecerdasan buatan ini dibanderol dengan harga yang cukup mahal. Anthropic mematok biaya 10 dolar AS per 1 juta token input dan 50 dolar AS per 1 juta token output. Jika dikonversi ke rupiah dengan kurs sekitar Rp 17.956, biayanya mencapai sekitar Rp 180.000 untuk input dan Rp 898.000 untuk output per juta token. Angka ini dua kali lipat lebih mahal dibanding model andalan mereka sebelumnya, Claude Opus 4.8.

Meskipun menuai kritik tajam terkait sensornya yang berlebihan, sejumlah perusahaan yang telah mengujinya mengaku terkesan. Claude Fable 5 menjadi model AI pertama yang mampu menembus skor 90 persen pada benchmark analisis data kompleks dari perusahaan analitik Hex. Platform pengembangan aplikasi Base44 juga menyebut model ini lebih baik dalam membuat aplikasi secara otomatis dalam satu perintah dibanding model AI lain yang pernah mereka uji.