Bagi Rosenberg, investasi dalam pelatihan membutuhkan set data yang sangat besar. Hal tersebut bertujuan agar model AI mampu terus mempelajari dan mengasah akurasi atas setiap informasi.
“Fokus pada biaya pelatihan mentah ini menyesatkan. Meskipun inovasi teknis DeepSeek dalam efisiensi pelatihan sangat mengesankan, total investasi yang diperlukan untuk mengembangkan model yang kompetitif jauh melampaui biaya komputasi langsung,” jelas dia.
Argumen Rosenberg berkaca dari penjelasan Dario Amodei, CEO Anthropic, bahwa investasi atas laboratorium koding tercanggih pun membutuhkan jutaan dolar AS untuk pekerjaan melatih model AI.
Amodei menjadi salah satu perwakilan di industri AI yang mendukung keunggulan teknologi perusahaan Amerika dibandingkan China.
Amodei membedah dinamika pengembangan AI menjadi tiga bagian; hukum skala, pergeseran kurva, serta paradigma. Mencuplik pernyataannya via blog, Amodei menekankan bahwa peningkatan pelatihan pada sistem AI akan menghasilkan sesuatu yang lebih baik, lancar dalam berbagai tugas kognitif, secara keseluruhan.
“Kita ambil contoh, model AI [dengan biaya investasi] US$1 juta dapat menyelesaikan 20% dari tugas-tugas pengkodean yang penting, US$10 juta dapat menyelesaikan 40%, US$100 juta dapat menyelesaikan 60%, dan seterusnya,” terang dia.
“Perbedaan ini cenderung memiliki implikasi yang sangat besar dalam praktiknya - faktor lain sebesar 10 mungkin sesuai dengan perbedaan antara tingkat keterampilan sarjana dan PhD - dan dengan demikian perusahaan berinvestasi besar-besaran dalam melatih model-model ini.”
David Sacks, investor teknologi lain yang masuk dalam pemerintahan Presiden Donald Trump sebagai penasihat teknologi AI, pun tegas menyatakan DeepSeek sejatinya menghabiskan lebih banyak dana yang yang diklaim mereka.
“Laporan terbaru dari analis semikonduktor terkemuka, Dylan Patel, menunjukkan bahwa DeepSeek menghabiskan lebih dari US$1 miliar untuk cluster komputasinya,” jelas Sacks dalam sebuah unggahan di media sosial X.
“Angka US$6 juta yang dilaporkan secara luas sangat menyesatkan, karena angka tersebut tidak termasuk belanja modal dan biaya riset dan pengembangan, dan paling nyata hanya menggambarkan biaya di pelatihan akhir saja.”
SemiAnalysis published an analysis on DeepSeek, addressing recent claims about its cost and performance. $NVDA
— Wall St Engine (@wallstengine) January 31, 2025
The report states that the widely circulated $6M training cost for DeepSeek V3 is incorrect, as it only accounts for GPU pre-training expenses and excludes R&D,… pic.twitter.com/VcE6jRvonz
DeepSeek sebelumnya mengatakan mempergunakan cip Nvidia H8000 yang kurang canggih, yang diizinkan dijual ke China hingga Oktober 2023, dalam membangun model yang tampaknya setara dengan AI tercanggih dari OpenAI. Namun mereka juga mengakui bahwa terdapat biaya lain yang sengaja tidak diungkap.
“Perlu dicatat bahwa biaya yang disebutkan di atas hanya mencakup pelatihan resmi DeepSeek-V3.” Hasil riset perusahaan yang didirikan di Hangzhou ini diklaim bisa diakses secara luas, bahkan perusahaan-perusahaan Amerika bisa menanfaatkannya untuk inovasi teknologi mereka, sekaligus memperoleh manfaat dari kekuatan komputasi yang jauh lebih besar.
Terobososan DeepSeek yang dirilis di hari Trump mulai berkuasa ini menggambarkan satu tantangan baru bagi presiden itu. Timnya tidak hanya harus memutuskan apakah pembatasan baru penjualan cip secara global yang diterapkan di akhir masak jabatan Joe Biden, tetapi apakah mereka harus terus menekan China dengan memperluas kendali ekspor yang juga meliputi cip Nvidia lain seperti H2O.
(prc/wep)

































