Logo Bloomberg Technoz

Selanjutnya, server yang berada di dalam pusat data bersama ratusan ribu server Google lainnya, memeriksa permintaan dan mengalirkan paket data yang relevan kembali ke pengguna melalui jaringan infrastruktur global yang sama.

Gangguan bisa saja terjadi jika ada masalah di sepanjang rantai terhubung tersebut. Dan sebagian besar alasan mengapa gangguan terjadi secara besar-besaran saat ini adalah karena perkembangan cloud computing.

Pusat data AWS di Ashburn, Virginia, AS (Bloomberg)

Gangguan internet kini amat mengganggu

Perubahan besar dalam cara kerja internet terletak pada tempat penyimpanan data dan infrastruktur. Pada tahun 1990-an dan awal 2000-an, perusahaan yang memiliki situs web sendiri kemungkinan besar memiliki server mandiri (terletak di kantor pusat) — disebut on-premises.

Alternatif lain, mereka menyewa server dari perusahaan lain tetapi tetap mengelola hardware dan software. Pada tingkat pengguna individu, segala hal yang melibatkan komputer juga melibatkan penyimpanan informasi secara lokal: Musik, foto, dan file semuanya disimpan di hard drive. Gangguan mungkin disebabkan oleh satu file yang rusak, dan meskipun kehilangan ribuan foto digital mungkin mengganggu, hal itu tidak akan memengaruhi pengguna lain. 

Cloud computing kian populer setelah Amazon, yang dikenal sebagai raksasa ritel online, menyadari bahwa insinyurnya menghabiskan waktu yang tidak proporsional untuk menyelesaikan masalah yang sama seputar infrastruktur komputasi dan penyimpanan data. Mereka membangun infrastruktur bersama untuk meringankan beban tersebut, lalu menyadari konsep ini dapat diterapkan pada sebagian besar internet. 

Ide tersebut berkembang pesat, dan kini sebagian besar pengguna internet dan bisnis bergantung pada komputasi awan dalam berbagai cara. Setelah Amazon Web Services, Microsoft Corp., dan Google milik Alphabet Inc. meluncurkan layanan mereka sendiri, ketiga perusahaan teknologi tersebut menjadi dominan dalam cloud computing secara global.

Dalam praktiknya, hal ini berarti mengoperasikan jutaan server di pusat data. Server-server ini umumnya diorganisir ke dalam “berbagai region” — kluster terpisah dari pusat data yang melayani negara atau wilayah tertentu. Beberapa wilayah mungkin menangani lalu lintas yang lebih besar, artinya jika salah satunya mengalami gangguan, dampaknya akan tidak proporsional. Beberapa perusahaan mungkin memiliki ketergantungan regional yang tidak mereka sadari, yang dapat menyebabkan layanan gagal akibat gangguan di luar wilayah mereka. 

Gangguan AWS pada Oktober lalu disebabkan oleh bug yang memengaruhi salah satu layanan utamanya, menyebabkan kegagalan berantai dan menonaktifkan beberapa situs dan layanan besar. Karena internet tidak hanya terdiri dari paket data tetapi juga infrastruktur fisik yang luas, insiden semacam ini dapat disebabkan oleh berbagai faktor seperti bug perangkat lunak, pusat data yang overheat, atau kabel yang rusak. Menariknya, hal ini tidak terjadi lebih sering.

Mengapa cloud macam AWS, Microsoft Azure, Google Cloud dominan?

Di Inggris, misalnya, AWS dan layanan cloud Microsoft Azure menguasai lebih dari 70% pasar komputasi awan. Hal ini disebabkan oleh keunggulan sebagai pelopor, posisi dominan Microsoft di teknologi perusahaan, dan kekuatan finansial yang besar. 

Meski demikian, ketergantungan pada sejumlah kecil penyedia cloud dominan memiliki beberapa dampak berantai. Gangguan pada layanan cloud dapat menyebabkan gangguan luas pada internet.

Penyedia cloud berskala besar, yang dikenal sebagai hyperscalers, juga telah dikritik karena praktik bisnis yang mempersulit masuknya pemain baru ke pasar dan memindahkan kontrak komputasi awan ke penyedia lain. Karena infrastruktur teknologi yang dibutuhkan untuk setiap layanan cloud berbeda, berpindah penyedia dapat sangat mahal bagi bisnis. Insinyur cloud juga sering mengikuti proses sertifikasi untuk satu penyedia tertentu, menambah biaya dan kesulitan dalam diversifikasi. 

Apa yang bisa salah dengan layanan cloud besar?

Salah satu alasan penyedia cloud besar begitu populer adalah karena mereka, secara umum, dapat diandalkan. Komputasi awan adalah aspek yang tumbuh pesat dalam bisnis mereka, dan mereka memiliki kepentingan untuk menjaga layanan berjalan lancar. 

Tetap saja, hal itu tidak dapat menjelaskan sifat teknologi layanan yang semakin terhubung secara saling terkait, terutama ketika beberapa perusahaan mendominasi lapisan-lapisan berbeda dari infrastruktur.

CrowdStrike Holdings Inc., misalnya, bukanlah perusahaan teknologi besar, tetapi mendominasi bidang keamanan siber. Popularitasnya membuatnya berjalan di jutaan sistem Microsoft Windows — seringkali sistem yang menjalankan operasi kritis di organisasi besar. Ketika perusahaan tersebut mengeluarkan pembaruan perangkat lunak yang bermasalah melalui pembaruan cloud pada Juli 2024, hal itu secara instan menyebabkan “Blue Screen of Death” pada jutaan komputer. Meskipun masalahnya bukan pada cloud, sifat pembaruan berbasis cloud yang simultan menyebabkan jutaan mesin mati secara bersamaan.

Papan iklan digital kosong di Times Square, New York. (Bloomberg)

Apa yang dapat dilakukan untuk melindungi diri dari risiko gangguan? 

Hal paling krusial yang dapat dilakukan perusahaan adalah memastikan mereka memikirkan apa yang akan dilakukan jika terjadi gangguan sebelum hal itu benar-benar terjadi. Hal itu mungkin berarti menghabiskan lebih banyak uang untuk memastikan mereka mendapatkan layanan cadangan jika wilayah utama mereka down, atau menyesuaikan infrastruktur mereka sehingga ada server cadangan internal untuk layanan yang paling kritis.

Bagi kita yang lain, tidak banyak yang bisa dilakukan selama kegagalan sistem besar kecuali menunggu penyedia cloud memperbaikinya. Jauhkan diri dari layar, sentuh rumput, dan kagumi infrastruktur kompleks di balik komputer yang menjaga semuanya berjalan lancar. 

(bbn)

No more pages