ماتی استانیشفسکی، هم‌بنیان‌گذار و مدیرعامل شرکت هوش مصنوعی صوتی ElevenLabs، معتقد است که مدل‌های هوش مصنوعی با گذشت زمان به یک کالای اساسی تبدیل می‌شوند. این اظهار نظر برای شرکتی که امروزه بر ساخت این مدل‌ها متمرکز است، بسیار حائز اهمیت است.

بنیان‌گذار ElevenLabs در کنفرانس Disrupt سال ۱۴۰۴ که روز سه‌شنبه برگزار شد، در مورد دیدگاه‌های کوتاه‌مدت و بلندمدت خود در مورد فضای صوتی هوش مصنوعی صحبت کرد.

استانیشفسکی گفت که محققان شرکتش توانسته‌اند برخی از چالش‌های معماری مدل را حل کنند و این تمرکز در فضای صوتی برای یک یا دو سال آینده ادامه خواهد داشت.

استانیشفسکی اظهار داشت: «در بلندمدت، این موضوع به یک کالای اساسی تبدیل خواهد شد؛ طی چند سال آینده. حتی اگر تفاوت‌هایی وجود داشته باشد – که فکر می‌کنم برای برخی صداها و برخی زبان‌ها درست خواهد بود – این تفاوت‌ها به خودی خود کوچک‌تر خواهند بود.»

هنگامی که از استانیشفسکی پرسیده شد که چرا ElevenLabs بر ساخت مدل‌ها تمرکز می‌کند در حالی که معتقد است این مدل‌ها به مرور زمان به یک کالای اساسی تبدیل می‌شوند، او توضیح داد که در کوتاه‌مدت، این مدل‌ها همچنان «بزرگترین مزیت و بزرگترین تغییری هستند که امروزه می‌توانید داشته باشید.»

به عنوان مثال، اگر صداها یا تعاملات هوش مصنوعی خوب به نظر نرسند، این هنوز یک مشکلی است که باید حل شود.

استانیشفسکی گفت: «تنها راه حل این است که… خودتان مدل‌ها را بسازید و سپس، در بلندمدت، بازیکنان دیگری نیز وجود خواهند داشت که آن را حل خواهند کرد.»

او همچنین خاطرنشان کرد که کسانی که به دنبال موارد استفاده قابل اعتماد و مقیاس‌پذیر هستند، احتمالاً از مدل‌های مختلف برای موارد استفاده مختلف استفاده می‌کنند.

با این حال، استانیشفسکی گفت که در یک یا دو سال آینده، تعداد فزاینده‌ای از مدل‌ها به سمت رویکردهای چندوجهی یا ترکیبی حرکت خواهند کرد.

او با اشاره به Veo 3 گوگل به عنوان نمونه‌ای از آنچه می‌توان با ترکیب مدل‌ها به دست آورد، گفت: «بنابراین، شما به طور همزمان صدا و تصویر یا صدا و LLMها را در یک محیط مکالمه‌ای ایجاد خواهید کرد.»

این بنیان‌گذار گفت که ElevenLabs قصد دارد با شرکت‌های دیگر مشارکت کند و با فناوری‌های متن‌باز کار کند تا ببیند آیا این شرکت می‌تواند تخصص صوتی خود را با برخی از تخصص‌های سایر مدل‌ها ترکیب کند یا خیر.

او گفت: هدف ElevenLabs تمرکز بر ساخت مدل و کاربردهایی است تا ارزش بلندمدت ایجاد کند.

او افزود: «همان‌طور که نرم‌افزار و سخت‌افزار برای اپل جادو بود، ما فکر می‌کنیم محصول و هوش مصنوعی برای نسل بهترین موارد استفاده، جادو خواهد بود.»

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *