رونق سرمایهگذاری اوپنایآی بر صوت همزمان با رقابت سیلیکونولی علیه صفحات نمایش

OpenAI برنامه گستردهای برای هوش مصنوعی صوتی دارد و این موضوع فقط درباره بهبود صدای ChatGPT نیست. بر اساس گزارش جدیدی از خبرنگار، این شرکت طی دو ماه گذشته چندین تیم مهندسی، محصول و تحقیقاتی را برای بازطراحی مدلهای صوتی خود متحد کرده است تا برای عرضه یک دستگاه شخصی مبتنی بر صوت، که انتظار میرود حدود یک سال دیگر ارائه شود، آماده شود.
این حرکت نشاندهنده جهتی است که کل صنعت فناوری به سمت آن میرود ـ یعنی آیندهای که در آن صفحهنمایشها به پسزمینه کماهمیت تبدیل میشوند و صوت نقش اصلی را بر عهده میگیرد. اسپیکرهای هوشمند، دستیارهای صوتی را به بخش ثابت بیش از یکسوم خانههای آمریکا تبدیل کردهاند. Meta بهتازگی قابلیت جدیدی برای عینکهای هوشمند Ray-Ban راهاندازی کرده که با استفاده از آرایشی متشکل از پنج میکروفون، به شما کمک میکند مکالمات را در فضاهای شلوغ بهتر بشنوید ـ در اصل صورت شما را به ابزاری برای شنیدن جهتدار تبدیل میکند. در همین حال، گوگل از خرداد ۱۴۰۳ شروع به آزمایش «نمای کلی صوتی» کرده است که نتایج جستجو را به خلاصههای محاورهای تبدیل میکند. تسلا نیز با ادغام Grok و مدلهای زبانی بزرگ دیگر در خودروهای خود، دستیارهای صوتی گفتگو محور طراحی میکند که میتوانند از مسیریابی تا کنترل آبوهوا را از طریق مکالمه طبیعی مدیریت کنند.
بهجز غولهای فناوری، استارتاپها نیز با همین رویکرد در مسیر پیشرفت حرکت میکنند؛ هر چند میزان موفقیت آنها متفاوت بوده است. سازندگان Humane AI Pin صدها میلیون دلار هزینه کردند اما ابزار پوشیدنی بدون صفحهنمایش آنها به تجربهای عبرتآموز بدل شد. گردنبند Friend AI که زندگی شما را ضبط میکند و همراهی فراهم میآورد، نگرانیهای مربوط به حریم خصوصی و اضطراب وجودی را در کنار هم ایجاد کرده است. اکنون دستکم دو شرکت، از جمله Sandbar و یکی به رهبری اریک میجیکوفسکی، بنیانگذار Pebble، در حال ساخت حلقههای هوش مصنوعی هستند که انتظار میرود در سال ۱۴۰۵ معرفی شوند و به کاربران امکان گفتوگو با «دست» خود را بدهند.
شکل ظاهری این دستگاهها ممکن است متفاوت باشد، ولی ایده پشت همه آنها یکسان است: «صوت» رابط کاربری آینده خواهد بود. هر فضا ـ خانه، خودرو، حتی چهره شما ـ به یک رابط کاربری جدید تبدیل خواهد شد.
مدل جدید صوتی OpenAI که برای اوایل سال ۱۴۰۵ برنامهریزی شده، قرار است طبیعیتر صحبت کند، وقفههای گفتوگو را مانند یک شریک مکالمه واقعی مدیریت نماید و حتی هنگامی که شما حرف میزنید، بتواند حرف بزند؛ قابلیتی که مدلهای فعلی فاقد آن هستند. گفته میشود این شرکت به خانوادهای از دستگاهها فکر میکند که احتمالاً شامل عینک یا اسپیکرهای هوشمند بدون صفحه باشد و بیشتر شبیه به یک همدم عمل کنند تا ابزار.
به گفته خبرنگار، جونی آیو، مدیر سابق طراحی اپل که در پی خرید ۶.۵ میلیارد دلاری شرکت io توسط OpenAI در اردیبهشت ۱۴۰۳ به تلاشهای سختافزاری OpenAI پیوست، اولویت خود را کاهش اعتیاد به دستگاهها قرار داده و طراحی مبتنی بر صوت را فرصتی میداند برای «اصلاح اشتباهات» محصولات مصرفی گذشته.



