دیپسیک به سرعت در حال فراگیر شدن است.
آزمایشگاه هوش مصنوعی چینی دیپسیک (DeepSeek) این هفته پس از صعود اپلیکیشن چتبات آن به صدر جدول اپ استور اپل (و گوگل پلی)، به کانون توجه عمومی تبدیل شد. مدلهای هوش مصنوعی دیپسیک، که با استفاده از تکنیکهای محاسباتی بهینه آموزش داده شدهاند، تحلیلگران وال استریت و متخصصان فناوری را بر آن داشتهاند تا این سوال را مطرح کنند که آیا ایالات متحده میتواند رهبری خود را در عرصه هوش مصنوعی حفظ کند و آیا تقاضا برای تراشههای هوش مصنوعی پایدار خواهد ماند یا خیر.
اما دیپسیک از کجا آمده و چگونه به این سرعت به شهرت بینالمللی دست یافته است؟
ریشههای معاملاتی دیپسیک
دیپسیک توسط شرکت High-Flyer Capital Management، یک صندوق پوشش ریسک کمی چینی که از هوش مصنوعی برای تصمیمگیریهای معاملاتی خود استفاده میکند، پشتیبانی میشود.
لیانگ ونفنگ، علاقهمند به هوش مصنوعی، در سال ۱۳۹۴ شرکت High-Flyer را تأسیس کرد. ونفنگ، که بنا به گزارشها، در دوران دانشجویی در دانشگاه ژجیانگ به معاملات مشغول بود، در سال ۱۳۹۸ شرکت High-Flyer Capital Management را به عنوان یک صندوق پوشش ریسک با تمرکز بر توسعه و استقرار الگوریتمهای هوش مصنوعی راهاندازی کرد.
در سال ۱۴۰۲، High-Flyer، دیپسیک را به عنوان آزمایشگاهی اختصاص داده شده به تحقیق در مورد ابزارهای هوش مصنوعی جدا از تجارت مالی خود، ایجاد کرد. با سرمایهگذاری High-Flyer، این آزمایشگاه به یک شرکت مستقل به نام دیپسیک تبدیل شد.
دیپسیک از همان ابتدا خوشههای مرکز داده خود را برای آموزش مدل ایجاد کرد. اما مانند سایر شرکتهای هوش مصنوعی در چین، دیپسیک نیز تحت تأثیر ممنوعیتهای صادرات سختافزار توسط ایالات متحده قرار گرفته است. برای آموزش یکی از جدیدترین مدلهای خود، این شرکت مجبور شد از تراشههای Nvidia H800، یک نسخه ضعیفتر از تراشه H100 که در دسترس شرکتهای آمریکایی است، استفاده کند.
گفته میشود تیم فنی دیپسیک جوان است. بنا به گزارشها، این شرکت به طور جدی محققان دکترای هوش مصنوعی را از دانشگاههای برتر چین استخدام میکند. به گزارش نیویورک تایمز، دیپسیک همچنین افرادی را بدون هیچ پیشینه علوم کامپیوتر استخدام میکند تا به فناوری خود کمک کند تا طیف گستردهتری از موضوعات را بهتر درک کند.
مدلهای قدرتمند دیپسیک
دیپسیک اولین مجموعه مدلهای خود – DeepSeek Coder، DeepSeek LLM و DeepSeek Chat – را در آبان ۱۴۰۲ رونمایی کرد. اما تا بهار گذشته، زمانی که این استارتاپ نسل بعدی مدلهای DeepSeek-V2 خود را منتشر کرد، صنعت هوش مصنوعی شروع به توجه کرد.
DeepSeek-V2، یک سیستم تجزیه و تحلیل متن و تصویر با کاربرد عمومی، در بنچمارکهای مختلف هوش مصنوعی عملکرد خوبی داشت – و اجرای آن در آن زمان بسیار ارزانتر از مدلهای مشابه بود. این امر باعث شد که رقبای داخلی دیپسیک، از جمله ByteDance و Alibaba، قیمت استفاده از برخی از مدلهای خود را کاهش دهند و برخی دیگر را کاملاً رایگان کنند.
DeepSeek-V3، که در آذر ۱۴۰۳ راه اندازی شد، تنها به بدنامی دیپسیک افزود.
بر اساس آزمایشهای بنچمارک داخلی دیپسیک، DeepSeek V3 از مدلهای قابل دانلود و در دسترس عموم مانند Llama متا و مدلهای “بسته” که فقط از طریق API قابل دسترسی هستند، مانند GPT-4o اوپنایآی، بهتر عمل میکند.
به همان اندازه چشمگیر، مدل “استدلال” R1 دیپسیک است. دیپسیک ادعا میکند که R1 که در دی ماه عرضه شد، در بنچمارکهای کلیدی به خوبی مدل o1 اوپنایآی عمل میکند.
R1 به عنوان یک مدل استدلال، به طور موثر خود را مورد بررسی قرار میدهد، که به آن کمک میکند تا از برخی از مشکلاتی که معمولاً مدلها را دچار مشکل میکند، جلوگیری کند. مدلهای استدلال در مقایسه با یک مدل غیر استدلالی معمولی، کمی بیشتر طول میکشد – معمولاً چند ثانیه تا چند دقیقه بیشتر – تا به راه حل برسند. مزیت این است که آنها در زمینههایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.
با این حال، یک نقطه ضعف در R1، DeepSeek V3 و سایر مدلهای دیپسیک وجود دارد. هوش مصنوعی توسعه یافته در چین، مشمول بنچمارک توسط تنظیم کننده اینترنت چین است تا اطمینان حاصل شود که پاسخهای آن “ارزشهای اصلی سوسیالیستی را تجسم میکند.” به عنوان مثال، در برنامه چتبات دیپسیک، R1 به سؤالات مربوط به میدان تیانآنمن یا خودمختاری تایوان پاسخ نمیدهد.
در اسفندماه، دیپسیک از 16.5 میلیون بازدید فراتر رفت. دیوید کار، ویراستار Similarweb، به خبرنگار گفت: “برای ماه مارس، دیپسیک با وجود کاهش 25 درصدی بازدید روزانه نسبت به بهمن ماه، در جایگاه دوم قرار دارد.” با این حال، در مقایسه با ChatGPT، که در اسفندماه از 500 میلیون کاربر فعال هفتگی فراتر رفت، بسیار ناچیز است.
در اردیبهشتماه، دیپسیک نسخه به روز شده مدل هوش مصنوعی استدلال R1 خود را در پلتفرم توسعهدهنده Hugging Face منتشر کرد.
دیپسیک یک مدل آزمایشی جدید به نام V3.2-exp را در شهریور ماه رونمایی کرد که برای کاهش چشمگیر هزینههای استنتاج هنگام استفاده در عملیاتهای طولانیمدت طراحی شده است.
رویکردی نوآورانه
اگر دیپسیک یک مدل کسب و کار داشته باشد، دقیقاً مشخص نیست که این مدل چیست. این شرکت محصولات و خدمات خود را بسیار پایینتر از ارزش بازار قیمتگذاری میکند – و برخی دیگر را به صورت رایگان ارائه میدهد. همچنین با وجود علاقه زیاد VC، سرمایه سرمایهگذاران را دریافت نمیکند.
به گفته دیپسیک، پیشرفتهای کارایی به آن امکان داده است تا رقابتپذیری هزینه شدید را حفظ کند. با این حال، برخی از کارشناسان در مورد ارقامی که شرکت ارائه کرده است، اختلاف نظر دارند.
در هر صورت، توسعه دهندگان به مدلهای دیپسیک روی آوردهاند، که همانطور که معمولاً درک میشود، متن باز نیستند، اما تحت مجوزهای مجاز در دسترس هستند که امکان استفاده تجاری را فراهم میکنند. به گفته کلم دلاانگ، مدیرعامل Hugging Face، یکی از پلتفرمهایی که مدلهای دیپسیک را میزبانی میکند، توسعه دهندگان در Hugging Face بیش از 500 مدل “مشتق” از R1 ایجاد کردهاند که در مجموع 2.5 میلیون بار دانلود شدهاند.
موفقیت دیپسیک در برابر رقبای بزرگتر و مستقرتر به عنوان “برهم زدن هوش مصنوعی” و “بیش از حد تبلیغ شده” توصیف شده است. موفقیت این شرکت حداقل تا حدی مسئول کاهش 18 درصدی قیمت سهام Nvidia در دی ماه و برانگیختن پاسخ عمومی از مدیرعامل OpenAI، سم آلتمن، بود. به گفته رویترز، در اسفندماه، دفاتر وزارت بازرگانی ایالات متحده به کارکنان اعلام کردند که دیپسیک در دستگاههای دولتی آنها ممنوع خواهد شد.
مایکروسافت اعلام کرد که دیپسیک در سرویس Azure AI Foundry خود، پلتفرم مایکروسافت که خدمات هوش مصنوعی را برای شرکتها تحت یک بنر واحد گرد هم میآورد، در دسترس است. هنگامی که در مورد تأثیر دیپسیک بر هزینههای هوش مصنوعی متا در طول گزارش درآمد سه ماهه اول خود پرسیده شد، مدیرعامل مارک زاکربرگ گفت که هزینهها برای زیرساختهای هوش مصنوعی همچنان یک “مزیت استراتژیک” برای متا خواهد بود. در اسفندماه، OpenAI دیپسیک را “یارانه دولتی” و “کنترل شده توسط دولت” نامید و توصیه میکند که دولت ایالات متحده مدلهای دیپسیک را ممنوع کند.
در طول گزارش درآمد سه ماهه چهارم Nvidia، مدیرعامل جنسن هوانگ بر “نوآوری عالی” دیپسیک تأکید کرد و گفت که آن و سایر مدلهای “استدلال” برای Nvidia عالی هستند زیرا به محاسبات بسیار بیشتری نیاز دارند.
در عین حال، برخی از شرکتها دیپسیک را ممنوع میکنند و همینطور کشورها و دولتهای کامل، از جمله کره جنوبی. ایالت نیویورک نیز استفاده از دیپسیک را در دستگاههای دولتی ممنوع کرد.
در اردیبهشتماه، برد اسمیت، معاون رئیس و رئیس مایکروسافت، در یک جلسه استماع سنا گفت که کارمندان مایکروسافت به دلیل نگرانیهای مربوط به امنیت دادهها و تبلیغات، مجاز به استفاده از دیپسیک نیستند.
در مورد اینکه آینده دیپسیک چه چیزی ممکن است باشد، مشخص نیست. بهبود مدلها یک امر مسلم است. اما به نظر میرسد دولت ایالات متحده نسبت به آنچه که به عنوان نفوذ خارجی مضر تلقی میکند، محتاطتر میشود. در اسفندماه، وال استریت ژورنال گزارش داد که ایالات متحده احتمالاً دیپسیک را در دستگاههای دولتی ممنوع خواهد کرد.
این مطلب در اصل در ۸ بهمن ۱۴۰۳ منتشر شده است و به طور مرتب به روز میشود.