ورود هوش مصنوعی به دوران واقعگرایی در سال ۲۰۲۶

اگر سال ۲۰۲۵ سالی بود که هوش مصنوعی تحت ارزیابی واقعیت قرار گرفت، سال ۲۰۲۶ سالی است که این فناوری به سوی کاربردی شدن حرکت میکند. تمرکز دیگر بر ساخت مدلهای زبانی عظیمتر نیست، بلکه بر کار دشوارتر قابل استفاده کردن هوش مصنوعی معطوف شده است. این موضوع در عمل به معنای استفاده از مدلهای کوچکتر در جاهایی است که مناسب باشند، جا دادن هوش در دستگاههای فیزیکی، و طراحی سیستمهایی است که بهخوبی در جریان کار انسانها ادغام میشوند.
کارشناسانی که خبرنگار با آنها گفتگو کرده، سال ۲۰۲۶ را به عنوان سالی انتقالی میبینند؛ گذر از مقیاسپذیری صرف به سوی تحقیق درباره معماریهای جدید، از نمایشهای پرزرقوبرق تا پیادهسازیهای هدفمند، و از ایجنتهایی که وعده خودمختاری میدهند تا آنهایی که واقعاً به بهبود عملکرد انسانها کمک میکنند.
جشن هنوز به پایان نرسیده اما صنعت دارد واقعبینتر میشود.
قوانین مقیاسپذیری دیگر کافی نیستند

در سال ۲۰۱۲، مقاله الکس کریژفسکی، ایلیا ساتسکیور و جفری هینتون با نام AlexNet نشان داد که سیستمهای هوش مصنوعی میتوانند با دیدن میلیونها عکس، یاد بگیرند اشیا را در تصاویر تشخیص دهند. این رویکرد بسیار هزینهبر بود اما با استفاده از پردازندههای گرافیکی (GPU) امکانپذیر شد. نتیجه آن یک دهه تحقیقات عمیق و جدی در حوزه هوش مصنوعی بود؛ دانشمندان برای ابداع معماریهای جدید برای وظایف مختلف تلاش کردند.
این روند حدود سال ۱۳۹۹ به اوج خود رسید؛ زمانی که OpenAI مدل GPT-3 را عرضه کرد و نشان داد که صرفاً بزرگتر کردن مدل (تا ۱۰۰ برابر) قابلیتهایی مانند کدنویسی و استدلال را بدون نیاز به آموزش صریح، فعال میکند. این دوره همان چیزی است که کیان کتانفروش، مدیرعامل و بنیانگذار سکوی ایجنت هوش مصنوعی Workera، «عصر مقیاس» مینامد: دورهای که در آن باور دارند پردازش بیشتر، داده بیشتر و مدلهای بزرگتر ترنسفورمر، الزاماً پیشرفت اساسی بعدی در هوش مصنوعی را به دنبال خواهد داشت.
امروزه بسیاری از پژوهشگران معتقدند صنعت هوش مصنوعی در حال رسیدن به مرزهای قوانین مقیاسپذیری است و دوباره به سوی «عصر پژوهش» حرکت خواهد کرد.
یان لوکان، رئیس سابق علم هوش مصنوعی در Meta، مدتهاست علیه تکیه بیش از حد به مقیاس صحبت کرده و بر ضرورت توسعه معماریهای بهتر تأکید داشته است. و ساتسکیور نیز اخیراً در مصاحبهای گفته که مدلهای فعلی به اوج خود رسیدهاند و نتایج پیشآموزش ثابت مانده، که نشان از نیاز به ایدههای جدید دارد.
کتانفروش میگوید: «احتمالاً در پنج سال آینده معماری بهتری که بهطور قابلتوجهی از ترنسفورمرها پیشرفتهتر باشد، پیدا خواهیم کرد. اگر چنین نشود، نباید انتظار پیشرفت زیادی از مدلها داشته باشیم.»
گاهی کم، بیشتر است
مدلهای زبانی بزرگ در تعمیم دانش بسیار خوب هستند، اما بسیاری از کارشناسان معتقدند موج بعدی پذیرش هوش مصنوعی در شرکتها با مدلهای زبانی کوچکتر و چابکتری رخ خواهد داد که برای حل مسائل یا حوزههای خاص، قابلیت تنظیم دارند.
اندی مارکوس، مدیر داده شرکت AT&T، به خبرنگار گفت: «مدلهای زبانی کوچک که بهخوبی تنظیم شده باشند، روند غالب و رایج میان شرکتهای بالغان هوش مصنوعی در سال ۲۰۲۶ خواهند شد، زیرا مزایای هزینه و سرعت آنها، امکان برتری بر مدلهای بزرگی که آماده هستند را فراهم میکند. ما قبلاً شاهد آن بودیم که کسبوکارها به دلیل تنظیم صحیح، به مدلهای کوچکتر تکیه میکنند؛ چون برای کاربردهای سازمانی دقیقاً به اندازه مدلهای بزرگ و عمومی دقیقاند و در زمینه هزینه و سرعت هم عالیاند.»
این استدلال را پیشتر از استارتاپ Mistral در فرانسه شنیدهایم: آنها میگویند مدلهای کوچکشان پس از تنظیم، از مدلهای بزرگتر روی چندین معیار، بهتر عمل میکنند.
جون نایزلی، استراتژیست هوش مصنوعی در شرکت ABBYY میگوید: «بهرهوری، مقرون به صرفه بودن و قابلیت انطباق مدلهای زبانی کوچک، آنها را برای کاربردهای خاص که دقت اهمیت بالایی دارد، ایدهآل میکند.»
درحالیکه مارکوس بر این باور است که مدلهای کوچک در عصر ایجنتها کلیدی خواهند بود، نایزلی نیز تأکید میکند که ماهیت مدلهای کوچک برای پیادهسازی در دستگاههای محلی، گزینه مناسبی هستند و این روند با پیشرفت محاسبات لبهای شتاب میگیرد.
یادگیری از طریق تجربه

انسانها فقط از طریق زبان یاد نمیگیرند؛ ما با تجربه کردن چگونگی عملکرد جهان نیز یاد میگیریم. اما مدلهای زبانی بزرگ واقعاً جهان را نمیفهمند؛ فقط بعدیترین واژه یا ایده را پیشبینی میکنند. به همین دلیل بسیاری از پژوهشگران بر این باورند که جهش بزرگ بعدی از مدلهای جهانی ناشی خواهد شد: سیستمهای هوش مصنوعی که میآموزند اشیا در فضای سه بعدی چگونه حرکت و تعامل میکنند تا بتوانند پیشبینی و کنش انجام دهند.
نشانههای آنکه سال ۲۰۲۶ سالی مهم برای مدلهای جهانی باشد، روزبهروز افزایش مییابد. لوکان از Meta جدا شد تا آزمایشگاه مدل جهانی خود را راهاندازی کند و ظاهراً به دنبال سرمایهگذاری ۵ میلیارد دلاری است. DeepMind گوگل بهطور مداوم روی مدل Genie کار میکند و در مرداد ۱۴۰۴، جدیدترین مدل خود را برای ساخت مدلهای جهانی همهمنظوره و تعاملی عرضه کرد. در کنار دموهایی از استارتاپهایی چون Decart و Odyssey، World Labs به رهبری فیفی لی اولین مدل جهانی تجاری خود Marble را معرفی کرده است. تازهواردانی مثل General Intuition در مهر ۱۴۰۳ توانستند ۱۳۴ میلیون دلار جذب سرمایه داشته باشند تا به ایجنتها آموزش دهند استدلال فضایی انجام دهند. استارتاپ Runway در آذر ۱۴۰۳ نیز اولین مدل جهانی خود با نام GWM-1 را معرفی کرد.
در حالی که پژوهشگران پتانسیل بلندمدت را در رباتیک و خودمختاری میبینند، اما تأثیر کوتاهمدت اهمیت بیشتری در صنعت بازیهای ویدیویی خواهد داشت. PitchBook پیشبینی میکند بازار مدلهای جهانی در حوزه بازی میتواند از ۱.۲ میلیارد دلار در سالهای ۱۴۰۱ تا ۱۴۰۴ به ۲۷۶ میلیارد دلار تا سال ۱۴۰۹ رشد کند؛ رشدی که ناشی از توانایی این فناوری برای ساخت دنیاهای تعاملی و شخصیتهای شبهواقعی است.
پیم دو ویت، بنیانگذار General Intuition، به خبرنگار میگوید: محیطهای مجازی نه تنها آینده بازیهای ویدیویی را تغییر میدهند، بلکه به محیطی حیاتی برای آزمایش نسل بعدی مدلهای بنیادی بدل خواهند شد.
ملت ایجنتها
ایجنتها در سال ۲۰۲۵ چندان که انتظار میرفت به موفقیت نرسیدند و دلیل اصلی آن هم دشواری در متصل ساختن آنها به سیستمهایی بود که کار واقعاً در آنها انجام میشود. بدون دسترسی به ابزارها و زمینهی واقعی، بیشتر ایجنتها در محیطهای آزمایشی گرفتار بودند.
پروتکل MCP یا مدل واسط Anthropic، که بهنوعی مانند یک «USB-C برای هوش مصنوعی» عمل میکند، امکان متصل شدن ایجنتهای هوش مصنوعی به ابزارهای خارجی مانند پایگاه دادهها، موتورهای جستجو یا APIها را فراهم کرد و حالا بهسرعت به استاندارد بدل شده است. OpenAI و مایکروسافت به شکل رسمی MCP را پذیرفتهاند و Anthropic نیز آن را به بنیاد جدید Agentic AI Foundation لینوکس اهدا کرده تا ابزارهای ایجنت متنباز را استاندارد کند. گوگل هم شروع به راهاندازی سرورهای مدیریتشده MCP کرده تا ایجنتهای هوش مصنوعی را به محصولات و سرویسهای خود وصل کند.
با کاهش دشواری متصل کردن ایجنتها به سامانههای واقعی توسط MCP، سال ۲۰۲۶ به احتمال زیاد سالی خواهد بود که جریانهای کاری ایجنتیک از حالت آزمایشی به فعالیت روزمره تبدیل شود.
راجیو دام، شریک تجاری در Sapphire Ventures، میگوید این پیشرفتها باعث خواهد شد راهکارهای مبتنی بر ایجنت به «هسته اصلی ثبت وقایع» در صنایع مختلف تبدیل شوند.
او ادامه میدهد: «با انجام وظایف کاملتر توسط ایجنتهای صوتی مثل ثبت اولیه و ارتباط با مشتری، این عاملان به هسته اصلی بسیاری از سیستمها بدل میشوند. این روند را در بخشهایی مثل خدمات منزل، فناوری املاک، سلامت و بخشهای افقی مانند فروش، IT و پشتیبانی خواهیم دید.»
تقویت، نه جایگزینی کامل

هرچند جریانهای کاری مبتنی بر ایجنت شاید نگرانیهایی درباره حذف شغلها ایجاد کند، اما کتانفروش از Workera چنین تصوری ندارد.
او میگوید: «سال ۲۰۲۶ سال انسانها خواهد بود.»
در ۱۴۰۳، هر شرکت هوش مصنوعی پیشبینی میکرد که مشاغل را به طور کامل خودکار و بینیاز از انسان میکند. اما فناوری هنوز به آن سطح نرسیده و در شرایط اقتصادی ناپایدار، این روایت چندان محبوب نیست. کتانفروش اعتقاد دارد سال آینده درخواهیم یافت که: «هوش مصنوعی آنطور که تصور میکردیم خودمختار نبوده است» و بحثها بیشتر درباره این خواهد بود که چگونه هوش مصنوعی میتواند به جریان کار انسانها کمک کند به جای آنکه جایگزینشان شود.
او میافزاید: «فکر میکنم بسیاری از شرکتها دوباره شروع به استخدام کنند»، و اشاره دارد که انتظار دارد سمتهای تازهای در حوزه حاکمیت هوش مصنوعی، شفافیت، ایمنی و مدیریت دادهها به وجود آید. «من نسبت به اینکه نرخ بیکاری تا سال آینده کمتر از ۴ درصد باشد، خوشبین هستم.»
دو ویت میافزاید: «مردم دوست دارند بالاتر از API قرار بگیرند، نه زیر آن و فکر میکنم ۲۰۲۶ سال مهمی برای این موضوع خواهد بود.»
هوش مصنوعی وارد دنیای فیزیکی

کارشناسان میگویند پیشرفتهایی در مدلهای کوچک، مدلهای جهانی و رایانش لبهای باعث میشود کاربردهای فیزیکی هوش مصنوعی در دنیای واقعی، بیش از پیش محقق شود.
ویکرام تانجا، رئیس AT&T Ventures، به خبرنگار میگوید: «هوش مصنوعی فیزیکی در سال ۲۰۲۶ به جریان اصلی میپیوندد و دستههای جدیدی از دستگاههای مجهز به هوش مصنوعی، از جمله رباتیک، وسایل نقلیه خودران، پهپادها و لوازم پوشیدنی وارد بازار میشوند.»
در حالی که وسایل نقلیه خودران و رباتیک موارد استفاده آشکاری برای هوش مصنوعی فیزیکی هستند و قطعاً در ۲۰۲۶ رشد خواهند کرد، اما آموزش و پیادهسازی آنها همچنان پرهزینه است. لوازم پوشیدنی اما راهی مقرون به صرفهتر و با پذیرش بیشتری از سوی مصرفکننده هستند. عینکهای هوشمندی مانند Ray Bans شرکت Meta اکنون مجهز به دستیارانی شدهاند که میتوانند به پرسشهایی درباره چیزی که در برابر شما قرار دارد پاسخ دهند و فرمفکتورهای جدیدی مانند حلقههای سلامتی هوشمند و ساعتهای مجهز به هوش مصنوعی، وجود این فناوری را همیشه و همهجا در دسترس میکنند.
تانجا در پایان میگوید: «ارائهدهندگان ارتباطات برای پشتیبانی از موج جدید دستگاهها، زیرساخت شبکه خود را بهینه میکنند و آنهایی که از نظر نوع ارائه خدمات انعطاف بیشتری دارند، بیشترین موفقیت را خواهند داشت.»



