ابزارهای کدنویسی مبتنی بر هوش مصنوعی به سرعت در حال پیشرفت هستند. اگر در زمینه کدنویسی فعالیت نمی‌کنید، ممکن است متوجه این تغییرات گسترده نشوید، اما GPT-5 و Gemini 2.5 امکانات جدیدی را برای خودکارسازی ترفندهای توسعه‌دهندگان فراهم کرده‌اند و هفته گذشته Sonnet 2.4 بار دیگر این کار را تکرار کرد.

در همین حال، پیشرفت در سایر مهارت‌ها کندتر است. اگر از هوش مصنوعی برای نوشتن ایمیل استفاده می‌کنید، احتمالاً همان ارزشی را دریافت می‌کنید که یک سال پیش دریافت می‌کردید. حتی زمانی که مدل پیشرفته‌تر می‌شود، محصول همیشه از آن بهره‌مند نمی‌شود، به‌ویژه زمانی که محصول یک چت‌بات است که ده‌ها کار مختلف را همزمان انجام می‌دهد. هوش مصنوعی همچنان در حال پیشرفت است، اما این پیشرفت به اندازه گذشته یکنواخت نیست.

تفاوت در پیشرفت ساده‌تر از آن چیزی است که به نظر می‌رسد. برنامه‌های کدنویسی از میلیاردها آزمایش قابل اندازه‌گیری آسان بهره می‌برند که می‌توانند آن‌ها را برای تولید کد کاربردی آموزش دهند. این یادگیری تقویتی (RL) است که احتمالاً بزرگترین عامل پیشرفت هوش مصنوعی در شش ماه گذشته بوده و به طور مداوم پیچیده‌تر می‌شود. شما می‌توانید یادگیری تقویتی را با ارزیاب‌های انسانی انجام دهید، اما اگر یک معیار واضح قبولی-ردی وجود داشته باشد، بهترین عملکرد را دارد، بنابراین می‌توانید آن را میلیاردها بار بدون نیاز به توقف برای ورودی انسانی تکرار کنید.

از آنجایی که صنعت به طور فزاینده‌ای به یادگیری تقویتی برای بهبود محصولات متکی است، ما شاهد تفاوت واقعی بین قابلیت‌هایی هستیم که می‌توانند به طور خودکار ارزیابی شوند و آنهایی که نمی‌توانند. مهارت‌های سازگار با RL مانند رفع اشکال و ریاضیات رقابتی به سرعت در حال بهبود هستند، در حالی که مهارت‌هایی مانند نوشتن تنها پیشرفت‌های تدریجی دارند.

به طور خلاصه، یک شکاف تقویتی وجود دارد و این شکاف در حال تبدیل شدن به یکی از مهم‌ترین عوامل تعیین‌کننده توانایی‌ها و محدودیت‌های سیستم‌های هوش مصنوعی است.

از برخی جهات، توسعه نرم‌افزار موضوعی عالی برای یادگیری تقویتی است. حتی قبل از هوش مصنوعی، یک زیرشاخه کامل به آزمایش میزان مقاومت نرم‌افزار تحت فشار اختصاص داشت، عمدتاً به این دلیل که توسعه‌دهندگان باید قبل از استقرار کد خود از عدم خرابی آن اطمینان حاصل می‌کردند. بنابراین حتی ظریف‌ترین کدها نیز باید از آزمایش واحد، آزمایش یکپارچگی، آزمایش امنیتی و غیره عبور کنند. توسعه‌دهندگان انسانی به طور معمول از این آزمایش‌ها برای تأیید کد خود استفاده می‌کنند و، همانطور که مدیر ارشد گوگل برای ابزارهای توسعه اخیراً به من گفت، آنها به همان اندازه برای تأیید کد تولید شده توسط هوش مصنوعی مفید هستند. حتی بیشتر از آن، آنها برای یادگیری تقویتی مفید هستند، زیرا از قبل به صورت سیستماتیک و قابل تکرار در مقیاس وسیع هستند.

هیچ راه آسانی برای تأیید یک ایمیل خوش‌نوشته یا پاسخ خوب چت‌بات وجود ندارد. این مهارت‌ها ذاتاً ذهنی هستند و اندازه‌گیری آن‌ها در مقیاس بزرگ دشوارتر است. اما هر کاری به طور مرتب در دسته‌های “آسان برای آزمایش” یا “دشوار برای آزمایش” قرار نمی‌گیرد. ما یک کیت آزمایش آماده برای گزارش‌های مالی فصلی یا علم اکچوئری نداریم، اما یک استارت‌آپ حسابداری با سرمایه خوب احتمالاً می‌تواند یکی را از ابتدا بسازد. البته برخی از کیت‌های آزمایشی بهتر از بقیه کار می‌کنند و برخی از شرکت‌ها در نحوه برخورد با این مشکل باهوش‌تر خواهند بود. اما قابلیت آزمایش فرآیند زیربنایی، عامل تعیین‌کننده در این خواهد بود که آیا فرآیند زیربنایی می‌تواند به یک محصول کاربردی تبدیل شود یا فقط یک نسخه نمایشی هیجان‌انگیز.

برخی از فرآیندها قابل آزمایش‌تر از آن چیزی هستند که فکر می‌کنید. اگر هفته گذشته از من می‌پرسیدید، ویدیوی تولید شده توسط هوش مصنوعی را در دسته “دشوار برای آزمایش” قرار می‌دادم، اما پیشرفت‌های چشمگیر مدل جدید Sora 2 شرکت OpenAI نشان می‌دهد که ممکن است به آن سختی که به نظر می‌رسد نباشد. در Sora 2، اشیاء دیگر به طور ناگهانی ظاهر و ناپدید نمی‌شوند. چهره‌ها شکل خود را حفظ می‌کنند و شبیه یک فرد خاص به نظر می‌رسند نه فقط مجموعه‌ای از ویژگی‌ها. فیلم‌های Sora 2 قوانین فیزیک را به روش‌های آشکار و ظریف رعایت می‌کنند. من گمان می‌کنم که اگر پشت پرده را نگاه کنید، یک سیستم یادگیری تقویتی قوی برای هر یک از این ویژگی‌ها پیدا خواهید کرد. در کنار هم، آنها تفاوت بین واقع‌گرایی عکس و یک توهم سرگرم‌کننده را ایجاد می‌کنند.

برای روشن شدن موضوع، این یک قانون سخت و سریع در مورد هوش مصنوعی نیست. این نتیجه نقش محوری است که یادگیری تقویتی در توسعه هوش مصنوعی ایفا می‌کند، که می‌تواند به راحتی با توسعه مدل‌ها تغییر کند. اما تا زمانی که RL ابزار اصلی برای عرضه محصولات هوش مصنوعی به بازار باشد، شکاف تقویتی بزرگتر خواهد شد و پیامدهای جدی برای استارت‌آپ‌ها و اقتصاد به طور کلی خواهد داشت. اگر یک فرآیند در سمت راست شکاف تقویتی قرار گیرد، استارت‌آپ‌ها احتمالاً در خودکارسازی آن موفق خواهند شد و هر کسی که اکنون این کار را انجام می‌دهد ممکن است در نهایت به دنبال یک شغل جدید باشد. برای مثال، این سوال که کدام خدمات مراقبت‌های بهداشتی قابلیت آموزش RL را دارند، پیامدهای عظیمی برای شکل اقتصاد در 20 سال آینده دارد. و اگر شگفتی‌هایی مانند Sora 2 نشانه‌ای باشند، ممکن است مجبور نباشیم مدت زیادی منتظر پاسخ بمانیم.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *