رونق سرمایه‌گذاری اوپن‌ای‌آی بر صوت همزمان با رقابت سیلیکون‌ولی علیه صفحات نمایش

0 1 2 دقیقه مطالعه

OpenAI برنامه گسترده‌ای برای هوش مصنوعی صوتی دارد و این موضوع فقط درباره بهبود صدای ChatGPT نیست. بر اساس گزارش جدیدی از خبرنگار، این شرکت طی دو ماه گذشته چندین تیم مهندسی، محصول و تحقیقاتی را برای بازطراحی مدل‌های صوتی خود متحد کرده است تا برای عرضه یک دستگاه شخصی مبتنی بر صوت، که انتظار می‌رود حدود یک سال دیگر ارائه شود، آماده شود.

این حرکت نشان‌دهنده جهتی است که کل صنعت فناوری به سمت آن می‌رود ـ یعنی آینده‌ای که در آن صفحه‌نمایش‌ها به پس‌زمینه کم‌اهمیت تبدیل می‌شوند و صوت نقش اصلی را بر عهده می‌گیرد. اسپیکرهای هوشمند، دستیارهای صوتی را به بخش ثابت بیش از یک‌سوم خانه‌های آمریکا تبدیل کرده‌اند. Meta به‌تازگی قابلیت جدیدی برای عینک‌های هوشمند Ray-Ban راه‌اندازی کرده که با استفاده از آرایشی متشکل از پنج میکروفون، به شما کمک می‌کند مکالمات را در فضاهای شلوغ بهتر بشنوید ـ در اصل صورت شما را به ابزاری برای شنیدن جهت‌دار تبدیل می‌کند. در همین حال، گوگل از خرداد ۱۴۰۳ شروع به آزمایش «نمای کلی صوتی» کرده است که نتایج جستجو را به خلاصه‌های محاوره‌ای تبدیل می‌کند. تسلا نیز با ادغام Grok و مدل‌های زبانی بزرگ دیگر در خودروهای خود، دستیارهای صوتی گفتگو محور طراحی می‌کند که می‌توانند از مسیریابی تا کنترل آب‌وهوا را از طریق مکالمه طبیعی مدیریت کنند.

به‌جز غول‌های فناوری، استارتاپ‌ها نیز با همین رویکرد در مسیر پیشرفت حرکت می‌کنند؛ هر چند میزان موفقیت آن‌ها متفاوت بوده است. سازندگان Humane AI Pin صدها میلیون دلار هزینه کردند اما ابزار پوشیدنی بدون صفحه‌نمایش آن‌ها به تجربه‌ای عبرت‌آموز بدل شد. گردنبند Friend AI که زندگی شما را ضبط می‌کند و همراهی فراهم می‌آورد، نگرانی‌های مربوط به حریم خصوصی و اضطراب وجودی را در کنار هم ایجاد کرده است. اکنون دست‌کم دو شرکت، از جمله Sandbar و یکی به رهبری اریک میجیکوفسکی، بنیان‌گذار Pebble، در حال ساخت حلقه‌های هوش مصنوعی هستند که انتظار می‌رود در سال ۱۴۰۵ معرفی شوند و به کاربران امکان گفت‌وگو با «دست» خود را بدهند.

شکل ظاهری این دستگاه‌ها ممکن است متفاوت باشد، ولی ایده پشت همه آن‌ها یکسان است: «صوت» رابط کاربری آینده خواهد بود. هر فضا ـ خانه، خودرو، حتی چهره شما ـ به یک رابط کاربری جدید تبدیل خواهد شد.

مدل جدید صوتی OpenAI که برای اوایل سال ۱۴۰۵ برنامه‌ریزی شده، قرار است طبیعی‌تر صحبت کند، وقفه‌های گفت‌وگو را مانند یک شریک مکالمه واقعی مدیریت نماید و حتی هنگامی که شما حرف می‌زنید، بتواند حرف بزند؛ قابلیتی که مدل‌های فعلی فاقد آن هستند. گفته می‌شود این شرکت به خانواده‌ای از دستگاه‌ها فکر می‌کند که احتمالاً شامل عینک یا اسپیکرهای هوشمند بدون صفحه باشد و بیشتر شبیه به یک همدم عمل کنند تا ابزار.

به گفته خبرنگار، جونی آیو، مدیر سابق طراحی اپل که در پی خرید ۶.۵ میلیارد دلاری شرکت io توسط OpenAI در اردیبهشت ۱۴۰۳ به تلاش‌های سخت‌افزاری OpenAI پیوست، اولویت خود را کاهش اعتیاد به دستگاه‌ها قرار داده و طراحی مبتنی بر صوت را فرصتی می‌داند برای «اصلاح اشتباهات» محصولات مصرفی گذشته.