دیپ‌سیک به سرعت در حال فراگیر شدن است.

آزمایشگاه هوش مصنوعی چینی دیپ‌سیک (DeepSeek) این هفته پس از صعود اپلیکیشن چت‌بات آن به صدر جدول اپ استور اپل (و گوگل پلی)، به کانون توجه عمومی تبدیل شد. مدل‌های هوش مصنوعی دیپ‌سیک، که با استفاده از تکنیک‌های محاسباتی بهینه آموزش داده شده‌اند، تحلیلگران وال استریت و متخصصان فناوری را بر آن داشته‌اند تا این سوال را مطرح کنند که آیا ایالات متحده می‌تواند رهبری خود را در عرصه هوش مصنوعی حفظ کند و آیا تقاضا برای تراشه‌های هوش مصنوعی پایدار خواهد ماند یا خیر.

اما دیپ‌سیک از کجا آمده و چگونه به این سرعت به شهرت بین‌المللی دست یافته است؟

ریشه‌های معاملاتی دیپ‌سیک

دیپ‌سیک توسط شرکت High-Flyer Capital Management، یک صندوق پوشش ریسک کمی چینی که از هوش مصنوعی برای تصمیم‌گیری‌های معاملاتی خود استفاده می‌کند، پشتیبانی می‌شود.

لیانگ ون‌فنگ، علاقه‌مند به هوش مصنوعی، در سال ۱۳۹۴ شرکت High-Flyer را تأسیس کرد. ون‌فنگ، که بنا به گزارش‌ها، در دوران دانشجویی در دانشگاه ژجیانگ به معاملات مشغول بود، در سال ۱۳۹۸ شرکت High-Flyer Capital Management را به عنوان یک صندوق پوشش ریسک با تمرکز بر توسعه و استقرار الگوریتم‌های هوش مصنوعی راه‌اندازی کرد.

در سال ۱۴۰۲، High-Flyer، دیپ‌سیک را به عنوان آزمایشگاهی اختصاص داده شده به تحقیق در مورد ابزارهای هوش مصنوعی جدا از تجارت مالی خود، ایجاد کرد. با سرمایه‌گذاری High-Flyer، این آزمایشگاه به یک شرکت مستقل به نام دیپ‌سیک تبدیل شد.

دیپ‌سیک از همان ابتدا خوشه‌های مرکز داده خود را برای آموزش مدل ایجاد کرد. اما مانند سایر شرکت‌های هوش مصنوعی در چین، دیپ‌سیک نیز تحت تأثیر ممنوعیت‌های صادرات سخت‌افزار توسط ایالات متحده قرار گرفته است. برای آموزش یکی از جدیدترین مدل‌های خود، این شرکت مجبور شد از تراشه‌های Nvidia H800، یک نسخه ضعیف‌تر از تراشه H100 که در دسترس شرکت‌های آمریکایی است، استفاده کند.

گفته می‌شود تیم فنی دیپ‌سیک جوان است. بنا به گزارش‌ها، این شرکت به طور جدی محققان دکترای هوش مصنوعی را از دانشگاه‌های برتر چین استخدام می‌کند. به گزارش نیویورک تایمز، دیپ‌سیک همچنین افرادی را بدون هیچ پیشینه علوم کامپیوتر استخدام می‌کند تا به فناوری خود کمک کند تا طیف گسترده‌تری از موضوعات را بهتر درک کند.

مدل‌های قدرتمند دیپ‌سیک

دیپ‌سیک اولین مجموعه مدل‌های خود – DeepSeek Coder، DeepSeek LLM و DeepSeek Chat – را در آبان ۱۴۰۲ رونمایی کرد. اما تا بهار گذشته، زمانی که این استارتاپ نسل بعدی مدل‌های DeepSeek-V2 خود را منتشر کرد، صنعت هوش مصنوعی شروع به توجه کرد.

DeepSeek-V2، یک سیستم تجزیه و تحلیل متن و تصویر با کاربرد عمومی، در بنچمارک‌های مختلف هوش مصنوعی عملکرد خوبی داشت – و اجرای آن در آن زمان بسیار ارزان‌تر از مدل‌های مشابه بود. این امر باعث شد که رقبای داخلی دیپ‌سیک، از جمله ByteDance و Alibaba، قیمت استفاده از برخی از مدل‌های خود را کاهش دهند و برخی دیگر را کاملاً رایگان کنند.

DeepSeek-V3، که در آذر ۱۴۰۳ راه اندازی شد، تنها به بدنامی دیپ‌سیک افزود.

بر اساس آزمایش‌های بنچمارک داخلی دیپ‌سیک، DeepSeek V3 از مدل‌های قابل دانلود و در دسترس عموم مانند Llama متا و مدل‌های “بسته” که فقط از طریق API قابل دسترسی هستند، مانند GPT-4o اوپن‌ای‌آی، بهتر عمل می‌کند.

به همان اندازه چشمگیر، مدل “استدلال” R1 دیپ‌سیک است. دیپ‌سیک ادعا می‌کند که R1 که در دی ماه عرضه شد، در بنچمارک‌های کلیدی به خوبی مدل o1 اوپن‌ای‌آی عمل می‌کند.

R1 به عنوان یک مدل استدلال، به طور موثر خود را مورد بررسی قرار می‌دهد، که به آن کمک می‌کند تا از برخی از مشکلاتی که معمولاً مدل‌ها را دچار مشکل می‌کند، جلوگیری کند. مدل‌های استدلال در مقایسه با یک مدل غیر استدلالی معمولی، کمی بیشتر طول می‌کشد – معمولاً چند ثانیه تا چند دقیقه بیشتر – تا به راه حل برسند. مزیت این است که آنها در زمینه‌هایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.

با این حال، یک نقطه ضعف در R1، DeepSeek V3 و سایر مدل‌های دیپ‌سیک وجود دارد. هوش مصنوعی توسعه یافته در چین، مشمول بنچمارک توسط تنظیم کننده اینترنت چین است تا اطمینان حاصل شود که پاسخ‌های آن “ارزش‌های اصلی سوسیالیستی را تجسم می‌کند.” به عنوان مثال، در برنامه چت‌بات دیپ‌سیک، R1 به سؤالات مربوط به میدان تیان‌آن‌من یا خودمختاری تایوان پاسخ نمی‌دهد.

در اسفندماه، دیپ‌سیک از 16.5 میلیون بازدید فراتر رفت. دیوید کار، ویراستار Similarweb، به خبرنگار گفت: “برای ماه مارس، دیپ‌سیک با وجود کاهش 25 درصدی بازدید روزانه نسبت به بهمن ماه، در جایگاه دوم قرار دارد.” با این حال، در مقایسه با ChatGPT، که در اسفندماه از 500 میلیون کاربر فعال هفتگی فراتر رفت، بسیار ناچیز است.

در اردیبهشت‌ماه، دیپ‌سیک نسخه به روز شده مدل هوش مصنوعی استدلال R1 خود را در پلتفرم توسعه‌دهنده Hugging Face منتشر کرد.

دیپ‌سیک یک مدل آزمایشی جدید به نام V3.2-exp را در شهریور ماه رونمایی کرد که برای کاهش چشمگیر هزینه‌های استنتاج هنگام استفاده در عملیات‌های طولانی‌مدت طراحی شده است.

رویکردی نوآورانه

اگر دیپ‌سیک یک مدل کسب و کار داشته باشد، دقیقاً مشخص نیست که این مدل چیست. این شرکت محصولات و خدمات خود را بسیار پایین‌تر از ارزش بازار قیمت‌گذاری می‌کند – و برخی دیگر را به صورت رایگان ارائه می‌دهد. همچنین با وجود علاقه زیاد VC، سرمایه سرمایه‌گذاران را دریافت نمی‌کند.

به گفته دیپ‌سیک، پیشرفت‌های کارایی به آن امکان داده است تا رقابت‌پذیری هزینه شدید را حفظ کند. با این حال، برخی از کارشناسان در مورد ارقامی که شرکت ارائه کرده است، اختلاف نظر دارند.

در هر صورت، توسعه دهندگان به مدل‌های دیپ‌سیک روی آورده‌اند، که همانطور که معمولاً درک می‌شود، متن باز نیستند، اما تحت مجوزهای مجاز در دسترس هستند که امکان استفاده تجاری را فراهم می‌کنند. به گفته کلم دلاانگ، مدیرعامل Hugging Face، یکی از پلتفرم‌هایی که مدل‌های دیپ‌سیک را میزبانی می‌کند، توسعه دهندگان در Hugging Face بیش از 500 مدل “مشتق” از R1 ایجاد کرده‌اند که در مجموع 2.5 میلیون بار دانلود شده‌اند.

موفقیت دیپ‌سیک در برابر رقبای بزرگتر و مستقرتر به عنوان “برهم زدن هوش مصنوعی” و “بیش از حد تبلیغ شده” توصیف شده است. موفقیت این شرکت حداقل تا حدی مسئول کاهش 18 درصدی قیمت سهام Nvidia در دی ماه و برانگیختن پاسخ عمومی از مدیرعامل OpenAI، سم آلتمن، بود. به گفته رویترز، در اسفندماه، دفاتر وزارت بازرگانی ایالات متحده به کارکنان اعلام کردند که دیپ‌سیک در دستگاه‌های دولتی آنها ممنوع خواهد شد.

مایکروسافت اعلام کرد که دیپ‌سیک در سرویس Azure AI Foundry خود، پلتفرم مایکروسافت که خدمات هوش مصنوعی را برای شرکت‌ها تحت یک بنر واحد گرد هم می‌آورد، در دسترس است. هنگامی که در مورد تأثیر دیپ‌سیک بر هزینه‌های هوش مصنوعی متا در طول گزارش درآمد سه ماهه اول خود پرسیده شد، مدیرعامل مارک زاکربرگ گفت که هزینه‌ها برای زیرساخت‌های هوش مصنوعی همچنان یک “مزیت استراتژیک” برای متا خواهد بود. در اسفندماه، OpenAI دیپ‌سیک را “یارانه دولتی” و “کنترل شده توسط دولت” نامید و توصیه می‌کند که دولت ایالات متحده مدل‌های دیپ‌سیک را ممنوع کند.

در طول گزارش درآمد سه ماهه چهارم Nvidia، مدیرعامل جنسن هوانگ بر “نوآوری عالی” دیپ‌سیک تأکید کرد و گفت که آن و سایر مدل‌های “استدلال” برای Nvidia عالی هستند زیرا به محاسبات بسیار بیشتری نیاز دارند.

در عین حال، برخی از شرکت‌ها دیپ‌سیک را ممنوع می‌کنند و همینطور کشورها و دولت‌های کامل، از جمله کره جنوبی. ایالت نیویورک نیز استفاده از دیپ‌سیک را در دستگاه‌های دولتی ممنوع کرد.

در اردیبهشت‌ماه، برد اسمیت، معاون رئیس و رئیس مایکروسافت، در یک جلسه استماع سنا گفت که کارمندان مایکروسافت به دلیل نگرانی‌های مربوط به امنیت داده‌ها و تبلیغات، مجاز به استفاده از دیپ‌سیک نیستند.

در مورد اینکه آینده دیپ‌سیک چه چیزی ممکن است باشد، مشخص نیست. بهبود مدل‌ها یک امر مسلم است. اما به نظر می‌رسد دولت ایالات متحده نسبت به آنچه که به عنوان نفوذ خارجی مضر تلقی می‌کند، محتاط‌تر می‌شود. در اسفندماه، وال استریت ژورنال گزارش داد که ایالات متحده احتمالاً دیپ‌سیک را در دستگاه‌های دولتی ممنوع خواهد کرد.

این مطلب در اصل در ۸ بهمن ۱۴۰۳ منتشر شده است و به طور مرتب به روز می‌شود.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *