مدلهای پایه چقدر اهمیت دارند؟
شاید این سوال احمقانه به نظر برسد، اما در گفتگوهایم با استارتاپهای هوش مصنوعی، این موضوع بارها مطرح شده است. استارتاپها به طور فزایندهای با کسبوکارهایی که قبلاً به عنوان “پوششهای GPT” یا شرکتهایی که رابطهایی را بر روی مدلهای هوش مصنوعی موجود مانند ChatGPT میسازند، راحتتر هستند. امروزه، تیمهای استارتاپی بر سفارشیسازی مدلهای هوش مصنوعی برای وظایف خاص و کار با رابطها تمرکز دارند و مدل پایه را به عنوان کالایی میبینند که در صورت لزوم میتوان آن را تعویض کرد. این رویکرد به ویژه در کنفرانس Boxworks هفته گذشته به نمایش گذاشته شد، که به نظر میرسید کاملاً به نرمافزارهای کاربرمحوری ساخته شده بر روی مدلهای هوش مصنوعی اختصاص داده شده بود.
بخشی از این موضوع به این دلیل است که مزایای مقیاسپذیری پیشآموزش (فرایند اولیه آموزش مدلهای هوش مصنوعی با استفاده از مجموعهدادههای عظیم، که تنها در حوزه مدلهای پایه قرار دارد) کند شده است. این بدان معنا نیست که هوش مصنوعی از پیشرفت باز ایستاده است، اما مزایای اولیه مدلهای پایهای مقیاسپذیر به بازده نزولی رسیدهاند و توجه به پسآموزش و یادگیری تقویتی به عنوان منابع پیشرفت آینده معطوف شده است. اگر میخواهید ابزار کدنویسی هوش مصنوعی بهتری بسازید، بهتر است روی تنظیم دقیق و طراحی رابط کار کنید تا اینکه چند میلیارد دلار دیگر صرف زمان سرور برای پیشآموزش کنید. همانطور که موفقیت Claude Code شرکت Anthropic نشان میدهد، شرکتهای مدل پایه در این زمینههای دیگر نیز بسیار خوب عمل میکنند، اما این مزیت به اندازه گذشته پایدار نیست.
به طور خلاصه، چشمانداز رقابتی هوش مصنوعی به گونهای در حال تغییر است که مزایای بزرگترین آزمایشگاههای هوش مصنوعی را تضعیف میکند. به جای رقابت برای یک AGI تمامقدرت که بتواند با تواناییهای انسانی در تمام وظایف شناختی مطابقت داشته باشد یا از آن فراتر رود، آینده نزدیک به نظر میرسد مجموعهای از کسبوکارهای مجزا باشد: توسعه نرمافزار، مدیریت دادههای سازمانی، تولید تصویر و غیره. به غیر از مزیت پیشگامی، مشخص نیست که ساخت یک مدل پایه به شما مزیتی در این کسبوکارها میدهد یا خیر. بدتر از آن، فراوانی جایگزینهای متنباز به این معنی است که مدلهای پایه ممکن است در صورت از دست دادن رقابت در لایه کاربردی، هیچ اهرمی برای قیمتگذاری نداشته باشند. این امر شرکتهایی مانند OpenAI و Anthropic را به تامینکنندگان پشتیبان در یک تجارت کالایی با حاشیه سود پایین تبدیل میکند – همانطور که یکی از بنیانگذاران به من گفت: “مانند فروش دانههای قهوه به استارباکس.”
به سختی میتوان گفت که این تغییر چقدر چشمگیر برای تجارت هوش مصنوعی خواهد بود. در طول رونق معاصر، موفقیت هوش مصنوعی از موفقیت شرکتهایی که مدلهای پایه میسازند (به طور خاص، OpenAI، Anthropic و Google) جداییناپذیر بوده است. خوشبین بودن نسبت به هوش مصنوعی به این معنی بود که باور داشته باشیم تاثیر دگرگونکننده هوش مصنوعی این شرکتها را به شرکتهای مهم در نسلهای آینده تبدیل میکند. میتوانستیم بحث کنیم که کدام شرکت در صدر قرار میگیرد، اما واضح بود که یک شرکت مدل پایه در نهایت کلیدهای پادشاهی را به دست خواهد آورد.
در آن زمان، دلایل زیادی وجود داشت که فکر کنیم این درست است. سالها، توسعه مدل پایه تنها تجارت هوش مصنوعی بود و سرعت بالای پیشرفت باعث شده بود که برتری آنها غیرقابل عبور به نظر برسد. و سیلیکون ولی همیشه عشق عمیقی به مزیت پلتفرم داشته است. فرض بر این بود که هر طور که مدلهای هوش مصنوعی در نهایت پول در میآورند، سهم شیر از این سود به شرکتهای مدل پایه باز میگردد، که سختترین کار را برای تکرار انجام دادهاند.
سال گذشته این داستان را پیچیدهتر کرده است. خدمات هوش مصنوعی شخص ثالث موفق زیادی وجود دارد، اما آنها تمایل دارند از مدلهای پایه به صورت متقابل استفاده کنند. برای استارتاپها، دیگر مهم نیست که محصول آنها بر روی GPT-5، Claude یا Gemini قرار دارد، و آنها انتظار دارند که بتوانند مدلها را در اواسط انتشار بدون اینکه کاربران نهایی متوجه تفاوت شوند، تغییر دهند. مدلهای پایه به پیشرفت واقعی ادامه میدهند، اما دیگر برای هیچ شرکتی قابل قبول به نظر نمیرسد که مزیت کافی برای تسلط بر صنعت را حفظ کند.
ما در حال حاضر نشانه های زیادی داریم که مزیت پیشگامی چندانی وجود ندارد. همانطور که مارتین کاسادو، سرمایهگذار خطرپذیر از a16z در یک پادکست اخیر اشاره کرد، OpenAI اولین آزمایشگاهی بود که یک مدل کدنویسی و همچنین مدلهای مولد برای تصویر و ویدیو منتشر کرد، اما هر سه دسته را به رقبا واگذار کرد. کاسادو نتیجه گرفت: “تا آنجا که ما می توانیم بگوییم، هیچ مزیت ذاتی در پشته فناوری برای هوش مصنوعی وجود ندارد.”
البته، ما نباید شرکتهای مدل پایه را هنوز کنار بگذاریم. هنوز مزایای پایدار زیادی در طرف آنها وجود دارد، از جمله شناخت برند، زیرساخت و ذخایر نقدی غیرقابل تصوری. ممکن است تکرار کسبوکار مصرفکننده OpenAI دشوارتر از کسبوکار کدنویسی آن باشد، و با بلوغ بخش، مزایای دیگری نیز ممکن است ظاهر شوند. با توجه به سرعت بالای توسعه هوش مصنوعی، علاقه فعلی به پسآموزش به راحتی میتواند در شش ماه آینده معکوس شود. از همه نامطمئنتر، رقابت برای هوش عمومی میتواند با پیشرفتهای جدید در داروسازی یا علم مواد به نتیجه برسد و ایدههای ما را در مورد آنچه مدلهای هوش مصنوعی را ارزشمند میکند، به شدت تغییر دهد.
اما در این میان، استراتژی ساخت مدلهای پایه بزرگتر از آنچه که سال گذشته بود، جذابیت کمتری دارد – و ولخرجی میلیارد دلاری متا به نظر میرسد بسیار پرخطر باشد.
منبع : techcrunch.com