ماتی استانیشفسکی، همبنیانگذار و مدیرعامل شرکت هوش مصنوعی صوتی ElevenLabs، معتقد است که مدلهای هوش مصنوعی با گذشت زمان به یک کالای اساسی تبدیل میشوند. این اظهار نظر برای شرکتی که امروزه بر ساخت این مدلها متمرکز است، بسیار حائز اهمیت است.
بنیانگذار ElevenLabs در کنفرانس Disrupt سال ۱۴۰۴ که روز سهشنبه برگزار شد، در مورد دیدگاههای کوتاهمدت و بلندمدت خود در مورد فضای صوتی هوش مصنوعی صحبت کرد.
استانیشفسکی گفت که محققان شرکتش توانستهاند برخی از چالشهای معماری مدل را حل کنند و این تمرکز در فضای صوتی برای یک یا دو سال آینده ادامه خواهد داشت.
استانیشفسکی اظهار داشت: «در بلندمدت، این موضوع به یک کالای اساسی تبدیل خواهد شد؛ طی چند سال آینده. حتی اگر تفاوتهایی وجود داشته باشد – که فکر میکنم برای برخی صداها و برخی زبانها درست خواهد بود – این تفاوتها به خودی خود کوچکتر خواهند بود.»
هنگامی که از استانیشفسکی پرسیده شد که چرا ElevenLabs بر ساخت مدلها تمرکز میکند در حالی که معتقد است این مدلها به مرور زمان به یک کالای اساسی تبدیل میشوند، او توضیح داد که در کوتاهمدت، این مدلها همچنان «بزرگترین مزیت و بزرگترین تغییری هستند که امروزه میتوانید داشته باشید.»
به عنوان مثال، اگر صداها یا تعاملات هوش مصنوعی خوب به نظر نرسند، این هنوز یک مشکلی است که باید حل شود.
استانیشفسکی گفت: «تنها راه حل این است که… خودتان مدلها را بسازید و سپس، در بلندمدت، بازیکنان دیگری نیز وجود خواهند داشت که آن را حل خواهند کرد.»
او همچنین خاطرنشان کرد که کسانی که به دنبال موارد استفاده قابل اعتماد و مقیاسپذیر هستند، احتمالاً از مدلهای مختلف برای موارد استفاده مختلف استفاده میکنند.
با این حال، استانیشفسکی گفت که در یک یا دو سال آینده، تعداد فزایندهای از مدلها به سمت رویکردهای چندوجهی یا ترکیبی حرکت خواهند کرد.
او با اشاره به Veo 3 گوگل به عنوان نمونهای از آنچه میتوان با ترکیب مدلها به دست آورد، گفت: «بنابراین، شما به طور همزمان صدا و تصویر یا صدا و LLMها را در یک محیط مکالمهای ایجاد خواهید کرد.»
این بنیانگذار گفت که ElevenLabs قصد دارد با شرکتهای دیگر مشارکت کند و با فناوریهای متنباز کار کند تا ببیند آیا این شرکت میتواند تخصص صوتی خود را با برخی از تخصصهای سایر مدلها ترکیب کند یا خیر.
او گفت: هدف ElevenLabs تمرکز بر ساخت مدل و کاربردهایی است تا ارزش بلندمدت ایجاد کند.
او افزود: «همانطور که نرمافزار و سختافزار برای اپل جادو بود، ما فکر میکنیم محصول و هوش مصنوعی برای نسل بهترین موارد استفاده، جادو خواهد بود.»








