Logo Bloomberg Technoz

Startup China terus beroperasi di bawah batasan signifikan, dengan Amerika Serikat (AS) mencegah akses ke chip canggih yang esensial guna mengembangkan dan menjalankan AI. Pembatasan tersebut memaksa peneliti untuk mengejar metode dan arsitektur yang tidak konvensional.

Menurut Robert Lea dan Jasmine Lyu dari Bloomberg Intelligence, model AI terbaru DeepSeek kembali berpotensi mengguncang industri AI secara global sekali lagi, terlepas Google belum lama mempertontonkan ragam kemajuan atas teknologi serupa. Model yang disebut R2 DeepSeek mungkin resmi muncul dalam beberapa bulan ke depan.

“Model Gemini 3 Google mengalahkan OpenAI pada November untuk menduduki peringkat ketiga dalam daftar performa LLM global LiveBench. Model-model berbiaya rendah China, yang dikembangkan dengan biaya sepersekian dari pesaingnya, menduduki dua posisi di 15 besar,” jelas dia.

DeepSeek, yang dikenal dengan inovasinya, menerbitkan paper terbarunya pekan ini melalui repositori terbuka arXiv dan platform open source Hugging Face. Paper tersebut mencantumkan 19 penulis, dengan nama Liang tercantum terakhir. 

Pendiri, yang secara konsisten mengarahkan agenda penelitian DeepSeek, telah mendorong timnya untuk mempertimbangkan ulang cara sistem AI berskala besar dirancang dan dibangun.

Penelitian terbaru ini membahas tantangan seperti ketidakstabilan pelatihan dan skalabilitas terbatas, dengan mencatat bahwa metode baru ini mengintegrasikan “optimasi infrastruktur yang ketat untuk memastikan efisiensi.” Uji coba dilakukan pada model dengan parameter mulai dari 3 miliar hingga 27 miliar, berdasarkan penelitian ByteDance Ltd. pada 2024 tentang arsitektur hyper-connection.

Teknik ini menjanjikan “untuk evolusi model AI,” kata para penulis.

(bbn)

No more pages