مدل‌های پایه چقدر اهمیت دارند؟

شاید این سوال احمقانه به نظر برسد، اما در گفتگوهایم با استارتاپ‌های هوش مصنوعی، این موضوع بارها مطرح شده است. استارتاپ‌ها به طور فزاینده‌ای با کسب‌وکارهایی که قبلاً به عنوان “پوشش‌های GPT” یا شرکت‌هایی که رابط‌هایی را بر روی مدل‌های هوش مصنوعی موجود مانند ChatGPT می‌سازند، راحت‌تر هستند. امروزه، تیم‌های استارتاپی بر سفارشی‌سازی مدل‌های هوش مصنوعی برای وظایف خاص و کار با رابط‌ها تمرکز دارند و مدل پایه را به عنوان کالایی می‌بینند که در صورت لزوم می‌توان آن را تعویض کرد. این رویکرد به ویژه در کنفرانس Boxworks هفته گذشته به نمایش گذاشته شد، که به نظر می‌رسید کاملاً به نرم‌افزارهای کاربرمحوری ساخته شده بر روی مدل‌های هوش مصنوعی اختصاص داده شده بود.

بخشی از این موضوع به این دلیل است که مزایای مقیاس‌پذیری پیش‌آموزش (فرایند اولیه آموزش مدل‌های هوش مصنوعی با استفاده از مجموعه‌داده‌های عظیم، که تنها در حوزه مدل‌های پایه قرار دارد) کند شده است. این بدان معنا نیست که هوش مصنوعی از پیشرفت باز ایستاده است، اما مزایای اولیه مدل‌های پایه‌ای مقیاس‌پذیر به بازده نزولی رسیده‌اند و توجه به پس‌آموزش و یادگیری تقویتی به عنوان منابع پیشرفت آینده معطوف شده است. اگر می‌خواهید ابزار کدنویسی هوش مصنوعی بهتری بسازید، بهتر است روی تنظیم دقیق و طراحی رابط کار کنید تا اینکه چند میلیارد دلار دیگر صرف زمان سرور برای پیش‌آموزش کنید. همانطور که موفقیت Claude Code شرکت Anthropic نشان می‌دهد، شرکت‌های مدل پایه در این زمینه‌های دیگر نیز بسیار خوب عمل می‌کنند، اما این مزیت به اندازه گذشته پایدار نیست.

به طور خلاصه، چشم‌انداز رقابتی هوش مصنوعی به گونه‌ای در حال تغییر است که مزایای بزرگ‌ترین آزمایشگاه‌های هوش مصنوعی را تضعیف می‌کند. به جای رقابت برای یک AGI تمام‌قدرت که بتواند با توانایی‌های انسانی در تمام وظایف شناختی مطابقت داشته باشد یا از آن فراتر رود، آینده نزدیک به نظر می‌رسد مجموعه‌ای از کسب‌وکارهای مجزا باشد: توسعه نرم‌افزار، مدیریت داده‌های سازمانی، تولید تصویر و غیره. به غیر از مزیت پیشگامی، مشخص نیست که ساخت یک مدل پایه به شما مزیتی در این کسب‌وکارها می‌دهد یا خیر. بدتر از آن، فراوانی جایگزین‌های متن‌باز به این معنی است که مدل‌های پایه ممکن است در صورت از دست دادن رقابت در لایه کاربردی، هیچ اهرمی برای قیمت‌گذاری نداشته باشند. این امر شرکت‌هایی مانند OpenAI و Anthropic را به تامین‌کنندگان پشتیبان در یک تجارت کالایی با حاشیه سود پایین تبدیل می‌کند – همانطور که یکی از بنیانگذاران به من گفت: “مانند فروش دانه‌های قهوه به استارباکس.”

به سختی می‌توان گفت که این تغییر چقدر چشمگیر برای تجارت هوش مصنوعی خواهد بود. در طول رونق معاصر، موفقیت هوش مصنوعی از موفقیت شرکت‌هایی که مدل‌های پایه می‌سازند (به طور خاص، OpenAI، Anthropic و Google) جدایی‌ناپذیر بوده است. خوش‌بین بودن نسبت به هوش مصنوعی به این معنی بود که باور داشته باشیم تاثیر دگرگون‌کننده هوش مصنوعی این شرکت‌ها را به شرکت‌های مهم در نسل‌های آینده تبدیل می‌کند. می‌توانستیم بحث کنیم که کدام شرکت در صدر قرار می‌گیرد، اما واضح بود که یک شرکت مدل پایه در نهایت کلیدهای پادشاهی را به دست خواهد آورد.

در آن زمان، دلایل زیادی وجود داشت که فکر کنیم این درست است. سال‌ها، توسعه مدل پایه تنها تجارت هوش مصنوعی بود و سرعت بالای پیشرفت باعث شده بود که برتری آنها غیرقابل عبور به نظر برسد. و سیلیکون ولی همیشه عشق عمیقی به مزیت پلتفرم داشته است. فرض بر این بود که هر طور که مدل‌های هوش مصنوعی در نهایت پول در می‌آورند، سهم شیر از این سود به شرکت‌های مدل پایه باز می‌گردد، که سخت‌ترین کار را برای تکرار انجام داده‌اند.

سال گذشته این داستان را پیچیده‌تر کرده است. خدمات هوش مصنوعی شخص ثالث موفق زیادی وجود دارد، اما آنها تمایل دارند از مدل‌های پایه به صورت متقابل استفاده کنند. برای استارتاپ‌ها، دیگر مهم نیست که محصول آنها بر روی GPT-5، Claude یا Gemini قرار دارد، و آنها انتظار دارند که بتوانند مدل‌ها را در اواسط انتشار بدون اینکه کاربران نهایی متوجه تفاوت شوند، تغییر دهند. مدل‌های پایه به پیشرفت واقعی ادامه می‌دهند، اما دیگر برای هیچ شرکتی قابل قبول به نظر نمی‌رسد که مزیت کافی برای تسلط بر صنعت را حفظ کند.

ما در حال حاضر نشانه های زیادی داریم که مزیت پیشگامی چندانی وجود ندارد. همانطور که مارتین کاسادو، سرمایه‌گذار خطرپذیر از a16z در یک پادکست اخیر اشاره کرد، OpenAI اولین آزمایشگاهی بود که یک مدل کدنویسی و همچنین مدل‌های مولد برای تصویر و ویدیو منتشر کرد، اما هر سه دسته را به رقبا واگذار کرد. کاسادو نتیجه گرفت: “تا آنجا که ما می توانیم بگوییم، هیچ مزیت ذاتی در پشته فناوری برای هوش مصنوعی وجود ندارد.”

البته، ما نباید شرکت‌های مدل پایه را هنوز کنار بگذاریم. هنوز مزایای پایدار زیادی در طرف آنها وجود دارد، از جمله شناخت برند، زیرساخت و ذخایر نقدی غیرقابل تصوری. ممکن است تکرار کسب‌وکار مصرف‌کننده OpenAI دشوارتر از کسب‌وکار کدنویسی آن باشد، و با بلوغ بخش، مزایای دیگری نیز ممکن است ظاهر شوند. با توجه به سرعت بالای توسعه هوش مصنوعی، علاقه فعلی به پس‌آموزش به راحتی می‌تواند در شش ماه آینده معکوس شود. از همه نامطمئن‌تر، رقابت برای هوش عمومی می‌تواند با پیشرفت‌های جدید در داروسازی یا علم مواد به نتیجه برسد و ایده‌های ما را در مورد آنچه مدل‌های هوش مصنوعی را ارزشمند می‌کند، به شدت تغییر دهد.

اما در این میان، استراتژی ساخت مدل‌های پایه بزرگ‌تر از آنچه که سال گذشته بود، جذابیت کمتری دارد – و ولخرجی میلیارد دلاری متا به نظر می‌رسد بسیار پرخطر باشد.

منبع : techcrunch.com

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *