ابزارهای کدنویسی مبتنی بر هوش مصنوعی به سرعت در حال پیشرفت هستند. اگر در زمینه کدنویسی فعالیت نمیکنید، ممکن است متوجه این تغییرات گسترده نشوید، اما GPT-5 و Gemini 2.5 امکانات جدیدی را برای خودکارسازی ترفندهای توسعهدهندگان فراهم کردهاند و هفته گذشته Sonnet 2.4 بار دیگر این کار را تکرار کرد.
در همین حال، پیشرفت در سایر مهارتها کندتر است. اگر از هوش مصنوعی برای نوشتن ایمیل استفاده میکنید، احتمالاً همان ارزشی را دریافت میکنید که یک سال پیش دریافت میکردید. حتی زمانی که مدل پیشرفتهتر میشود، محصول همیشه از آن بهرهمند نمیشود، بهویژه زمانی که محصول یک چتبات است که دهها کار مختلف را همزمان انجام میدهد. هوش مصنوعی همچنان در حال پیشرفت است، اما این پیشرفت به اندازه گذشته یکنواخت نیست.
تفاوت در پیشرفت سادهتر از آن چیزی است که به نظر میرسد. برنامههای کدنویسی از میلیاردها آزمایش قابل اندازهگیری آسان بهره میبرند که میتوانند آنها را برای تولید کد کاربردی آموزش دهند. این یادگیری تقویتی (RL) است که احتمالاً بزرگترین عامل پیشرفت هوش مصنوعی در شش ماه گذشته بوده و به طور مداوم پیچیدهتر میشود. شما میتوانید یادگیری تقویتی را با ارزیابهای انسانی انجام دهید، اما اگر یک معیار واضح قبولی-ردی وجود داشته باشد، بهترین عملکرد را دارد، بنابراین میتوانید آن را میلیاردها بار بدون نیاز به توقف برای ورودی انسانی تکرار کنید.
از آنجایی که صنعت به طور فزایندهای به یادگیری تقویتی برای بهبود محصولات متکی است، ما شاهد تفاوت واقعی بین قابلیتهایی هستیم که میتوانند به طور خودکار ارزیابی شوند و آنهایی که نمیتوانند. مهارتهای سازگار با RL مانند رفع اشکال و ریاضیات رقابتی به سرعت در حال بهبود هستند، در حالی که مهارتهایی مانند نوشتن تنها پیشرفتهای تدریجی دارند.
به طور خلاصه، یک شکاف تقویتی وجود دارد و این شکاف در حال تبدیل شدن به یکی از مهمترین عوامل تعیینکننده تواناییها و محدودیتهای سیستمهای هوش مصنوعی است.
از برخی جهات، توسعه نرمافزار موضوعی عالی برای یادگیری تقویتی است. حتی قبل از هوش مصنوعی، یک زیرشاخه کامل به آزمایش میزان مقاومت نرمافزار تحت فشار اختصاص داشت، عمدتاً به این دلیل که توسعهدهندگان باید قبل از استقرار کد خود از عدم خرابی آن اطمینان حاصل میکردند. بنابراین حتی ظریفترین کدها نیز باید از آزمایش واحد، آزمایش یکپارچگی، آزمایش امنیتی و غیره عبور کنند. توسعهدهندگان انسانی به طور معمول از این آزمایشها برای تأیید کد خود استفاده میکنند و، همانطور که مدیر ارشد گوگل برای ابزارهای توسعه اخیراً به من گفت، آنها به همان اندازه برای تأیید کد تولید شده توسط هوش مصنوعی مفید هستند. حتی بیشتر از آن، آنها برای یادگیری تقویتی مفید هستند، زیرا از قبل به صورت سیستماتیک و قابل تکرار در مقیاس وسیع هستند.
هیچ راه آسانی برای تأیید یک ایمیل خوشنوشته یا پاسخ خوب چتبات وجود ندارد. این مهارتها ذاتاً ذهنی هستند و اندازهگیری آنها در مقیاس بزرگ دشوارتر است. اما هر کاری به طور مرتب در دستههای “آسان برای آزمایش” یا “دشوار برای آزمایش” قرار نمیگیرد. ما یک کیت آزمایش آماده برای گزارشهای مالی فصلی یا علم اکچوئری نداریم، اما یک استارتآپ حسابداری با سرمایه خوب احتمالاً میتواند یکی را از ابتدا بسازد. البته برخی از کیتهای آزمایشی بهتر از بقیه کار میکنند و برخی از شرکتها در نحوه برخورد با این مشکل باهوشتر خواهند بود. اما قابلیت آزمایش فرآیند زیربنایی، عامل تعیینکننده در این خواهد بود که آیا فرآیند زیربنایی میتواند به یک محصول کاربردی تبدیل شود یا فقط یک نسخه نمایشی هیجانانگیز.
برخی از فرآیندها قابل آزمایشتر از آن چیزی هستند که فکر میکنید. اگر هفته گذشته از من میپرسیدید، ویدیوی تولید شده توسط هوش مصنوعی را در دسته “دشوار برای آزمایش” قرار میدادم، اما پیشرفتهای چشمگیر مدل جدید Sora 2 شرکت OpenAI نشان میدهد که ممکن است به آن سختی که به نظر میرسد نباشد. در Sora 2، اشیاء دیگر به طور ناگهانی ظاهر و ناپدید نمیشوند. چهرهها شکل خود را حفظ میکنند و شبیه یک فرد خاص به نظر میرسند نه فقط مجموعهای از ویژگیها. فیلمهای Sora 2 قوانین فیزیک را به روشهای آشکار و ظریف رعایت میکنند. من گمان میکنم که اگر پشت پرده را نگاه کنید، یک سیستم یادگیری تقویتی قوی برای هر یک از این ویژگیها پیدا خواهید کرد. در کنار هم، آنها تفاوت بین واقعگرایی عکس و یک توهم سرگرمکننده را ایجاد میکنند.
برای روشن شدن موضوع، این یک قانون سخت و سریع در مورد هوش مصنوعی نیست. این نتیجه نقش محوری است که یادگیری تقویتی در توسعه هوش مصنوعی ایفا میکند، که میتواند به راحتی با توسعه مدلها تغییر کند. اما تا زمانی که RL ابزار اصلی برای عرضه محصولات هوش مصنوعی به بازار باشد، شکاف تقویتی بزرگتر خواهد شد و پیامدهای جدی برای استارتآپها و اقتصاد به طور کلی خواهد داشت. اگر یک فرآیند در سمت راست شکاف تقویتی قرار گیرد، استارتآپها احتمالاً در خودکارسازی آن موفق خواهند شد و هر کسی که اکنون این کار را انجام میدهد ممکن است در نهایت به دنبال یک شغل جدید باشد. برای مثال، این سوال که کدام خدمات مراقبتهای بهداشتی قابلیت آموزش RL را دارند، پیامدهای عظیمی برای شکل اقتصاد در 20 سال آینده دارد. و اگر شگفتیهایی مانند Sora 2 نشانهای باشند، ممکن است مجبور نباشیم مدت زیادی منتظر پاسخ بمانیم.