دیپسیک: انقلابی در هوش مصنوعی و تغییر معادلات جهانی
چگونه یک استارتاپ چینی با کاهش هزینهها و رویکرد متنباز غولهای فناوری را به چالش کشیده است
زمانی که یک استارتاپ چینی موفق به آموزش مدلهایی در سطح GPT-4 با هزینهای بالغ بر ۵ میلیون دلار (به جای ۱۰۰ میلیون دلار)، استفاده از کارتهای گرافیک گیمینگ به جای سرورهای عظیم دیتاسنتر و انتشار یافتههای خود به صورت متنباز (open-source) میشود، توجه جهانی را به خود معطوف میکند. دیپسیک نه تنها در عرصه نوآوری گام برمیدارد، بلکه به طور جدی فرضیات دیرینه در مورد برتری فناوری ایالات متحده، ارزشگذاریهای بازار و جریانهای سرمایه جهانی را به چالش میکشد. در ادامه، بررسی خواهیم کرد که چگونه یک تیم ۲۰۰ نفره در حال دگرگونی بنیادهای سیلیکون ولی، والاستریت و فراتر از آنها است.
معجزه ۵ میلیون دلاری: رمزگشایی دیپسیک از هزینههای هوش مصنوعی:
رویکردهای سنتی توسعه هوش مصنوعی، شباهت زیادی به یک رقابت تسلیحاتی دارد: استفاده از سختافزارهای گرانقیمت، مانند کارتهای گرافیک ۴۰ هزار دلاری انویدیا، برای آموزش مدلهای پیچیدهتر. اما دیپسیک این پرسش را مطرح کرد: «چه میشود اگر از این روند دست برداریم؟»
۱. دقت ۸ بیتی به جای ۳۲ بیتی: با کاهش دقت محاسباتی از ۳۲ بیت به ۸ بیت - مشابه تغییر استفاده از میکروسکوپ به عینک مطالعه - دیپسیک توانست نیاز به حافظه را تا ۷۵٪ کاهش دهد و در عین حال، دقت را حفظ کند.
۲. پردازش چندتوکنی (Multi-Token Processing): به جای پردازش متن به صورت کلمه به کلمه (مانند «گربه... نشست...»)، دیپسیک کل عبارات را به صورت همزمان پردازش میکند. این رویکرد منجر به دو برابر شدن سرعت با حفظ ۹۰٪ دقت میشود که تحولی چشمگیر در پردازش حجم عظیمی از دادهها به شمار میرود.
۳. سیستم خبره (Expert System): مدلهای سنتی مانند GPT-4، تمامی ۱.۸ تریلیون پارامتر خود را برای هر درخواست فعال میکنند. در مقابل، دیپسیک تنها از ۳۷ میلیارد پارامتر در هر لحظه استفاده میکند و فقط زیرمدلهای مورد نیاز را فعال میسازد. این رویکرد، مشابه داشتن تیمی از متخصصان است که فقط در صورت لزوم فراخوانده میشوند.
۴. دموکراتیزاسیون متنباز (Open-Source Democratization): دیپسیک تمامی کدها، وزنها و مقالات خود را به صورت عمومی منتشر کرده است. یکی از کاربران حتی توانست مدل R1 را به صورت محلی (Local) بر روی پردازنده و حافظه رم با استفاده از llama.cpp اجرا کند و به سرعت ۳.۴ توکن بر ثانیه دست یابد - این امر، گواهی بر امکان اجرای هوش مصنوعی پیشرفته بدون نیاز به زیرساختهای عظیم دیتاسنتر است.
آمار و ارقام:
هزینه آموزش: ۵ میلیون دلار (در مقایسه با ۱۷.۹ میلیارد دلار سرمایهگذاری OpenAI)
تعداد کارتهای گرافیک مورد نیاز: ۱۰۰,۰۰۰ ← ۲,۰۰۰
کاهش هزینههای API: ۹۵٪
سختافزار: اجرا بر روی کارتهای گرافیک گیمینگ معمولی
تعداد کارمند: ۲۰۰ نفر (OpenAi ۲۲ برابر این تعداد کارمند دارد)
تأثیر بر بازارها: سقوط نزدک، انویدیا و ارزهای دیجیتال
ظهور دیپسیک همزمان با افت ۳٪ در معاملات آتی نزدک و فروش گسترده ارزهای دیجیتال رخ داد. دلیل این امر چیست؟
۱. چالش انویدیا: ارزش ۲ تریلیون دلاری انویدیا بر پایه فروش کارتهای گرافیک بسیار گران به شرکتهای هوش مصنوعی استوار است. اگر استارتاپها بتوانند با استفاده از کارتهای گرافیک گیمینگ به نتایجی مشابه OpenAI دست یابند، حاشیه سود ۹۰٪ انویدیا با تهدید جدی مواجه خواهد شد.
۲. خطر «حباب فناوری آمریکا»: سرمایهگذاران برای مدتها بر این باور بودند که شرکتهای فناوری آمریکایی در زمینه هوش مصنوعی پیشرو هستند. اما دیپسیک این باور را به چالش کشید و نگرانیهایی را در مورد ارزشگذاری بیش از حد به وجود آورد.
۳. نوسانات ارزهای دیجیتال: بازارهای ارز دیجیتال تحت تأثیر نوسانات بازارهای سهام قرار گرفتند. با این حال، برخی پروژهها مانند ai16z در حال پیادهسازی مدلهای دیپسیک هستند که نشان از ظهور فرصتهای جدید در حوزه هوش مصنوعی غیرمتمرکز دارد.
جمعبندی
دیپسیک صرفاً یک استارتاپ هوش مصنوعی نیست، بلکه عاملی برای ایجاد تغییرات بنیادین در سه حوزه است:
فناوری: کاهش هزینهها و گسترش دموکراسی در عرصه هوش مصنوعی.
مالی: تغییر نگرش سرمایهگذاران به بازارهای آمریکا.
ژئوپلیتیک: نشان دادن ظرفیتهای نوآوری فراتر از سیلیکون ولی.


