Error Cloudflare Picu Gangguan Internet Global, Apa Penyebabnya?

Ilustrasi gangguan cloudflare. (Dok. Cloudflare)

Error Cloudflare Picu Gangguan Internet Global, Apa Penyebabnya?

Riza Aslam Khaeron • 19 November 2025 09:15

Jakarta: Gangguan besar melanda infrastruktur internet global pada Selasa, 18 November 2025, setelah Cloudflare mengalami gangguan sistem yang berdampak luas.

Sejumlah situs populer termasuk X dan OpenAI dilaporkan mengalami error secara bersamaan, memicu kekhawatiran di kalangan pengguna internet di berbagai negara.

Layanan dashboard kinerja untuk para pemilik situs juga ikut terdampak, membuat akses terhadap layanan inti menjadi terhambat selama beberapa jam.

Insiden ini menyoroti pentingnya peran Cloudflare sebagai salah satu "penjaga gerbang" utama dalam lalu lintas internet dunia.

Perusahaan asal Amerika Serikat ini dikenal luas sebagai penyedia layanan pengamanan dan akselerasi situs web, aplikasi, hingga sistem berbasis AI, serta pelindung terhadap serangan siber.

Berikut penjelasan mengenai penyebab error Cloudflare.
 

Penyebab Teknis Gangguan Cloudflare

Cloudflare menjelaskan bahwa gangguan pada 18 November 2025 bukan disebabkan oleh serangan siber atau aktivitas jahat, melainkan dipicu oleh perubahan pada sistem pengaturan izin (permissions) salah satu basis data internal mereka.

Perubahan tersebut menyebabkan sistem secara tidak sengaja menghasilkan entri duplikat dalam file konfigurasi fitur (feature file) yang digunakan oleh sistem manajemen bot (Bot Management).

Akibatnya, file tersebut membengkak hingga dua kali lipat dari ukuran yang semestinya dan disebarkan ke seluruh jaringan server Cloudflare.

Perangkat lunak yang bertugas merutekan lalu lintas jaringan memiliki batas ukuran tertentu terhadap file konfigurasi tersebut. Ketika file yang melebihi ambang batas ini dimuat, perangkat lunak gagal berfungsi sebagaimana mestinya. Hal inilah yang menyebabkan munculnya error HTTP 5xx secara masif di berbagai layanan pelanggan Cloudflare.
 

Peran Bot Management dan Kesalahan di ClickHouse


Ilustrasi bot check Cloudflare. (Dok. Cloudflare)

Sistem Bot Management di Cloudflare bekerja dengan mengandalkan file konfigurasi fitur yang diperbarui setiap beberapa menit.

File ini terdiri dari serangkaian atribut yang digunakan oleh model machine learning untuk menentukan apakah suatu permintaan jaringan berasal dari pengguna manusia atau bot otomatis. File ini dibangun berdasarkan hasil kueri terhadap basis data ClickHouse.

Ketika Cloudflare melakukan pembaruan terhadap pengelolaan izin dan keamanan kueri terdistribusi, mereka secara bertahap mengubah cara sistem mengenali metadata dari tabel-tabel yang digunakan dalam kueri tersebut. Perubahan ini, tanpa disadari, menyebabkan sistem menghasilkan data duplikat sehingga jumlah baris dalam file fitur meningkat drastis.

Salah satu modul di dalam core proxy, yaitu modul Bot Management, memiliki batas jumlah maksimum fitur yang dapat diproses. Ketika file yang melebihi kapasitas ini diterapkan ke sistem, terjadi kesalahan pemrosesan (panic) yang menyebabkan kegagalan fatal dan menimbulkan gangguan menyeluruh pada layanan inti.
 

Pola Gangguan dan Kronologi Insiden

Perubahan konfigurasi basis data dimulai pada pukul 11.05 UTC (18.05 WIB). Dampak nyata pertama kali terlihat pada pukul 11.28 UTC (18.28 WIB) ketika versi file konfigurasi yang bermasalah mulai memengaruhi lingkungan produksi dan mengganggu lalu lintas jaringan pelanggan.

Selama beberapa waktu, grafik status sistem Cloudflare menunjukkan pola naik-turun yang tidak biasa. Hal ini terjadi karena file fitur baru dibuat setiap lima menit dan tidak semua node basis data langsung terdampak.

Node yang telah menerima pembaruan menghasilkan file bermasalah, sementara yang belum diperbarui masih menghasilkan file yang benar. Akibatnya, jaringan mengalami kondisi fluktuatif antara pulih dan gagal secara berulang.

Tim teknis sempat mengira bahwa gangguan tersebut merupakan dampak dari serangan DDoS berskala besar, mengingat gejala yang muncul menyerupai lonjakan lalu lintas berbahaya. Namun setelah penyelidikan lebih lanjut, mereka berhasil mengidentifikasi bahwa penyebab utama berasal dari file konfigurasi Bot Management yang salah.

Pada pukul 13.05 UTC, Cloudflare mulai menerapkan langkah mitigasi dengan melakukan bypass terhadap layanan seperti Workers KV dan Cloudflare Access agar tidak lagi bergantung langsung pada core proxy.

Perbaikan definitif dilakukan pada pukul 14.30 UTC dengan menghentikan distribusi file bermasalah dan menggantinya dengan versi yang telah terbukti stabil. Seluruh sistem dinyatakan pulih sepenuhnya pada pukul 17.06 UTC.
 
Baca Juga:
Cloudflare Tumbang! Layanan X, BMKG, hingga ChatGPT Tak Bisa Dibuka
 

Layanan yang Terdampak dan Dampaknya ke Pengguna

Gangguan ini menyebabkan berbagai layanan Cloudflare tidak dapat berfungsi dengan baik. Bagi pengguna, gangguan tampak dalam bentuk kegagalan mengakses situs yang dilindungi oleh Cloudflare dan munculnya pesan error HTTP 5xx.

Layanan inti seperti Content Delivery Network (CDN), sistem keamanan siber, serta Turnstile — sistem verifikasi pengguna Cloudflare — mengalami gangguan berat. Banyak pengguna gagal melewati halaman autentikasi karena Turnstile tidak dapat dimuat.

Sistem penyimpanan key-value (Workers KV) juga terdampak, memicu tingginya error karena gateway depan tidak merespons akibat gangguan pada core proxy.

Cloudflare Dashboard turut terkena dampak. Walau sebagian besar fungsionalitasnya tetap aktif, banyak pengguna tidak dapat login karena Turnstile yang digunakan pada halaman masuk ikut terganggu. Layanan Cloudflare Access mengalami kegagalan autentikasi secara menyeluruh.

Upaya login oleh pengguna selama periode gangguan berakhir pada halaman error sehingga mereka tidak pernah berhasil mengakses aplikasi yang dituju.

Layanan Email Security Cloudflare juga mengalami dampak minor, terutama hilangnya akses sementara terhadap sumber reputasi IP yang menyebabkan sistem deteksi spam berbasis domain baru tidak berjalan optimal.

Meski begitu, perusahaan memastikan tidak ada dampak kritis terhadap data atau keamanan pelanggan. Selain itu, sistem debugging internal yang aktif selama insiden turut mengonsumsi sumber daya CPU secara signifikan, mengakibatkan peningkatan latensi pada respon CDN selama periode gangguan.
 

Langkah Pemulihan dan Rencana Pencegahan ke Depan

Setelah mengidentifikasi akar masalah, Cloudflare menghentikan pembuatan dan penyebaran file fitur yang salah dan menggantikannya dengan versi yang telah diuji stabil. Proses ini disertai dengan restart paksa pada sistem core proxy untuk memastikan seluruh trafik diarahkan menggunakan konfigurasi yang benar.

Layanan-layanan yang terdampak mulai menunjukkan pemulihan segera setelah langkah tersebut diterapkan, dan seluruh sistem operasional kembali normal pada pukul 17.06 UTC (00.06 WIB).

Cloudflare menyatakan bahwa insiden ini merupakan gangguan terburuk yang mereka alami sejak 2019. Mereka mengakui bahwa meskipun telah membangun sistem yang tahan gangguan, masih ada celah yang harus diperbaiki.

Untuk itu, perusahaan akan memperketat kontrol terhadap file konfigurasi internal, menerapkan tombol pemutus (kill switch) global untuk modul kritis, serta mencegah agar laporan error atau core dump tidak membebani sistem secara berlebihan.

Langkah-langkah ini diambil guna memastikan ketahanan yang lebih kuat di masa depan dan menjaga kepercayaan para pelanggan terhadap peran vital Cloudflare dalam infrastruktur internet global.

Jangan lupa ikuti update berita lainnya dan follow  akun
Google News Metrotvnews.com
Viral!, 18 Kampus ternama memberikan beasiswa full sampai lulus untuk S1 dan S2 di Beasiswa OSC. Info lebih lengkap klik : osc.medcom.id
(Arga Sumantri)