شرکت چینی یک شبه گوی سبقت را از همه رقبا ی جهانی ربود
«دیپ سیک» زیر تیغ اتهام
در ۴۸ ساعت گذشته جهان زیرورو شده و سهام فناوری یک تریلیون دلار از دست داد ؛ با اتفاقی که افتاده امریکا دیگر آنطور که ادعا میکند تنها متولی یا رهبر هوش مصنوعی در دنیا نیست و هم زمان، هند نیز با این واقعیت مواجه شد که نباید خود را در حال رقابت شانه به شانه در مسابقه تسلیحاتی هوش مصنوعی بداند. همه این اتفاقهای بزرگ تنها به دلیل یک تحقیق کوچک و تولد هوش مصنوعی دیپ سیک(DeepSeek) رخ داده است که پس از موفقیت دو روز گذشته، حالا شرکت Deep Seek در مظان اتهام تقلب از سوی رقبای امریکایی خود قرار گرفته است.
میترا جلیلی
دبیر گروه فناوری
تقلبی به نام تقطیر دانش
«دیوید ساکس»، تزار رمزارز و هوش مصنوعی دولت امریکا در مصاحبه جدید خود از شواهد قابلتوجهی خبر داده که نشان میدهد شرکت چینی DeepSeek از هوش مصنوعی OpenAI برای آموزش مدلهای خود استفاده کرده است. وی بدون اشاره به این شواهد، تنها توضیح داد این احتمال وجود دارد که مدلهای دیپسیک از طریق «تقطیر دانش»، اطلاعات لازم برای آموزش را از مدلهای OpenAI دریافت کرده باشند.(در دنیای یادگیری ماشین(ML)، به فرآیند انتقال دانش از یک مدل نسبتاً بزرگ به یک مدل کوچک، تقطیر دانش (Knowledge distillation) گفته میشود). «اپن ای آی» هم در بیانیهای چین را متهم به تقلب کرده و یادآور شد: ما بهعنوان سازنده پیشرو هوش مصنوعی، اقدامات متقابلی را برای محافظت از مالکیتهای معنوی خود انجام میدهیم تا رقبای فناوری امریکا، آنها را در اختیار نگیرند. درحالی شاهد این صحبتها هستیم که تقطیر دانش، موضوعی عادی در دنیای یادگیری ماشین است.
ظهور از دنیای مالی
فارغ از واکنشهای رقبای دنیای هوش مصنوعی به دیپ سیک، شاید شناختن کسی که پشت یک تحقیق کوچک اما با تأثیر بزرگ در جهان قرار دارد، چندان خالی از لطف نباشد.
هوش مصنوعی چینی که سیلیکون ولی و واشنگتن دی سی را تکان داده، یک سال پیش توسط «لیانگ ونفنگ» متولد شد و حالا به یک رقیب جدی برای OpenAI تبدیل شده و ابرقدرتهای هوش مصنوعی و سلطه امریکا در فناوری را به چالش کشیده است. در واقع نحوه عملکرد مدل DeepSeek R1 در معیارهای جهانی، ونفنگ را به «سم آلتمن» چین تبدیل کرده است آن هم در شرایطی که امریکا همه تلاش خود را برای محدود کردن دسترسی چین به تراشههای هوش مصنوعی به کار گرفته است. در چنین وضعیتی، ظهور DeepSeek نشان میدهد که چگونه تکنیکهای نوآورانه و راهحلهای مقرون به صرفه، میتواند با وجود محدودیتها، غولهای یک فناوری را کنار بزند.
برخلاف ستارههای «سیلیکون ولی» که در فناوری پیشینهای قوی دارند، «ونفنگ» از دنیای مالی میآید. ونفنگ 40ساله یک بنیانگذار فناوری معمولی نیست و همین مشخصات، وی را جالبتر میکند. وی که حالا دیگر به یکی از ثروتمندان جهان تبدیل شده، سال 1985 در Zhanjiang، شهری فقیر در استان جنوبی گوانگدونگ چین به دنیا آمد. پدرش معلم دبستان بود و وی مهندسی الکترونیک را در دانشگاه ژجیانگ، یک کالج معتبر در شهر هانگژو، به پایان رساند. وی همچنین مدرک کارشناسی ارشد خود را در مهندسی اطلاعات و ارتباطات در آنجا گرفت.
پس از فارغ التحصیلی از دانشگاه ژجیانگ، صندوق سرمایهگذاری High-Flyer را در سال 2015 تأسیس کرد که برخلاف تحلیل انسانی، از الگوریتمهای پیچیده ریاضی برای معاملات استفاده میکند. به لطف مدل سرمایهگذاری منحصر به فرد و علاقهاش به پیشبینی روند بازار با استفاده از هوش مصنوعی، توانست پروژههای هوش مصنوعی را بدون فشار سرمایهگذاران خارجی، با اولویتبندی دنبال کند. پرتفوی این صندوق تا پایان سال 2021 به بیش از 100 میلیارد یوآن (13.79 میلیارد دلار) رسید اما وی در آوریل 2023، در حساب ویچت خود اعلام کرد وظایفش را فراتر از صنعت سرمایهگذاری گسترش خواهد داد و منابع را برای AGI (هوش عمومی مصنوعی) متمرکز خواهد کرد؛ در نهایت هم DeepSeek یک ماه بعد ایجاد شد.
احتکار تراشههای انویدیا
یکی از کارهای وی که برای بسیاری عجیب به نظر میرسید این بود که در سال 2021، مدتها قبل از اینکه دولت بایدن عرضه تراشههای هوش مصنوعی پیشرفته به چین را محدود کند، شروع به خرید هزاران تراشه انویدیا به عنوان بخشی از یک پروژه جانبی هوش مصنوعی کرد. در آن زمان بسیاری به کارهای وی با دیده تردید نگاه میکردند و هیچ کس فکرش را هم نمیکرد که کار «ونفنگ» برای احتکار پردازندههای گرافیکی منطقی باشد. تا زمانی که ونفنگ DeepSeek را در سال 2023 راهاندازی کرد، هیچ برنامه مشخصی وجود نداشت و همین امر باعث شده بود تا بسیاری، وی را فردی بیتوجه به امور مالی بدانند.
وی ازسوی همکارانش به عنوان فردی کمحرف، عصبی با یک مدل موی نهچندان محبوب توصیف میشود. یکی از شرکای تجاری لیانگ در مصاحبهای با فایننشال تایمز گفت: وقتی وی درباره ساخت یک خوشه 10000 تراشهای برای آموزش مدلهای خود صحبت میکرد ما او را جدی نگرفتیم. او نمیتوانست دیدگاه خود را بیان کند جز اینکه بگوید: «من میخواهم این را بسازم و این یک تغییر بازی خواهد بود.» ما فکر میکردیم که این کار فقط توسط غولهایی مانند بایت دنس و علی بابا در چین امکانپذیر است ولی حالا از اتفاقات چند روز اخیر شگفتزده هستیم.
جذب استعدادهای چینی
اگرچه دیپ سیک در ابتدا یک پروژه جانبی بود، «ونفنگ» علاقه زیادی به هوش مصنوعی داشت و شخصاً در این استارتاپ با تمرکز عمده بر تحقیق و توسعه، مشارکت داشت. در واقع وی دیپسیک را به عنوان یک رهبر داخلی در هوش مصنوعی تصور میکرد که میتواند با بزرگترین شرکتهای فناوری چین و همچنین شرکتهای بزرگ فناوری امریکا رقابت کند.
جالب اینجاست که ونفنگ برای تشکیل تیمی از محققان هوش مصنوعی، استعدادهای جوان برتر را تنها از دانشگاههای محلی چین به خدمت گرفت و به فراتر از چین نگاه نکرد. وی حقوقی همتراز با آنچه شرکتهای فناوری چینی مانند بایت دنس میپردازند، برای آنها تعیین کرد تا با این استراتژی، بتواند بهترین استعدادها را از چین جذب کند؛ افرادی که ممکن است تجربه چندانی در ساخت هوش مصنوعی نداشته باشند اما دارای مهارتهای فنی لازم برای توسعه هوش مصنوعی باشند.
بــــرش
استفاده از مدل متن باز
چانگ زو، دانشیار دانشگاه سیدنی که در یادگیری ماشین و بینایی کامپیوتر تخصص دارد، گفت: دلیل موفقیت دیپ سیک، استفاده از متن باز است که میتواند منجر به بزرگترین تغییر در صنعت هوش مصنوعی شود. وی با مقایسه بازار گوشیهای هوشمند، جایی که رقابت بین سیستم بسته و پلتفرمهای منبع باز مانند اندروید وجود دارد، یادآورشد: فکر میکنم این در واقع نوعی شروع دوران اندروید برای مدلهای بزرگتر هوش مصنوعی است که توسط دیپ سیک مشخص شده است. بنابراین چهارچوب متنباز آن برای یادگیری تفاوتها با پردازندههای بسته مانند «اپنایآی» و مدلهای بزرگ هوش مصنوعی گوگل، کاملاً موفق است و ما میتوانیم آزادی دسترسی به مدل ساختمان تحقیقاتی را داشته باشیم.
بــــرش
راهی که دیپ سیک پیمود
اولین مدل هوش مصنوعی دیپ سیک، DeepSeek Coder بود که در نوامبر 2023 به عنوان یک مدل متن باز برای کارهای کدنویسی طراحی شد. به دنبال آن DeepSeek LLM،
با هدف رقابت با سایر مدلهای زبانی بزرگ(LLM) دنبال شد. در ماه مه2024، DeepSeek-V2 منتشر شد که به دلیل عملکرد قوی و هزینه کم با استقبال خوبی روبهرو شد. این جنگ قیمتی، غولهای بزرگ فناوری چینی مانند بایت دنس، تنسنت، بایدو و علی بابا را مجبور کرد قیمت مدلهای هوش مصنوعی خود را کاهش دهند.
پس از آن از DeepSeek-Coder-V2 به عنوان مدلی بسیار پیشرفتهتر با 236 میلیارد پارامتر که برای چالشهای کدنویسی پیچیده طراحی شده که تا 128 هزار توکن دارد، رونمایی شد. این مدل از طریق یک API مقرون به صرفه با قیمت 0.14 دلار برای هر میلیون توکن ورودی و 0.28 دلار برای هر میلیون توکن خروجی در دسترس قرار گرفت. اما برگ برنده «ونفنگ»، DeepSeek-R1 بود که در ژانویه 2025 منتشر شد و بر وظایف استدلال تمرکز داشت. این هوش مصنوعی توانست تنها با هزینه 5.6 میلیون دلار و تیمی متشکل از 200 نفر، هوش مصنوعی GPT-4 مربوط به شرکت «اپن ای آی» را به چالش بکشد. هزینه کم این عملیات، سیلیکون ولی را شوکه کرد و در کمترین زمان، برنامه DeepSeek با کنار زدن چت جی پی تی، محبوبترین برنامه فروشگاههای اپ در امریکا شد.

