Speechify عمدتاً ابزاری بوده است که به شما کمک می‌کند تا به مقالات، فایل‌های PDF و اسناد گوش دهید. این شرکت اکنون در حال افزودن ویژگی‌های تشخیص صدا به افزونه Chrome خود است، از جمله تایپ صوتی و یک دستیار صوتی که به سؤالات شما پاسخ می‌دهد.

در 12 ماه گذشته، به لطف بهبود کلی کیفیت در مدل‌های تشخیص گفتار، شاهد گسترش ابزارهای تشخیص صدا بوده‌ایم. Speechify نیز با راه‌اندازی ابزار دیکته خود با پشتیبانی از زبان انگلیسی، به این جریان پیوسته است. درست مانند سایر ابزارهای دیکته، تایپ صوتی Speechify خطاها را تصحیح می‌کند و کلمات پُرکننده را حذف می‌کند.

در آزمایش کوتاهی که کمی بیشتر از یک روز به طول انجامید، احساس کردم که Speechify هنوز جای زیادی برای بهبود دارد. به عنوان مثال، این ابزارها به خوبی با Gmail و Google Docs کار می‌کنند، اما در سایت‌هایی مانند WordPress، در فعال کردن دیکته صوتی و عملکرد خوب آن با مشکل مواجه شده‌ام. این شرکت اعلام کرده است که به تدریج در حال بهینه‌سازی برای سایت‌های محبوب است.

Image Credits: Speechify

از نظر دقت، نرخ خطای کلمات بالاتر از برخی ابزارهای دیگر مانند Wispr Flow، Willow و Monologue بود. Speechify اشاره کرد که مدل آن با استفاده بیشتر، سریع‌تر یاد می‌گیرد و نرخ خطا به تدریج کاهش می‌یابد.

این استارتاپ همچنین در حال راه‌اندازی یک دستیار صوتی مکالمه‌ای است که در نوار کناری مرورگر شما قرار دارد. می‌توانید سؤالاتی در مورد وب‌سایت از آن بپرسید، مانند «سه ایده کلیدی چیست؟» یا «این را به زبان ساده‌تر توضیح دهید.»

در حالی که ChatGPT و Gemini حالت‌های مکالمه‌ای دارند، استدلال Speechify این است که این ویژگی‌ها در برنامه‌های آن‌ها به عنوان یک ایده ثانویه در نظر گرفته می‌شوند، و ابزار خود این استارتاپ صدا را در مرکز توجه قرار داده است.

روهان پاولووری، مدیر ارشد کسب‌وکار این شرکت، در ایمیلی به خبرنگار گفت: «ما معتقدیم که چت همیشه تجربه کاربری پیش‌فرض در ChatGPT و Gemini خواهد بود وقتی برنامه‌ها را باز می‌کنید. این همان چیزی است که کاربرانشان انتظار دارند. صدا همیشه ثانویه خواهد بود – و در بسیاری از موارد، یک ایده ثانویه برای ChatGPT و Gemini. ما از چندین سال ساخت Speechify می‌دانیم که بخش بزرگی از بازار وجود دارد، که شامل کاربران ما می‌شود، که می‌خواهند صدا به عنوان تنظیمات اصلی و پیش‌فرض هر بار که برنامه‌ای را باز می‌کنند و با هوش مصنوعی صحبت می‌کنند، باشد.»

Techcrunch event

Join the Disrupt 2026 Waitlist

Add yourself to the Disrupt 2026 waitlist to be first in line when Early Bird tickets drop. Past Disrupts have brought Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil, and Vinod Khosla to the stages — part of 250+ industry leaders driving 200+ sessions built to fuel your growth and sharpen your edge. Plus, meet the hundreds of startups innovating across every sector.

Join the Disrupt 2026 Waitlist

Add yourself to the Disrupt 2026 waitlist to be first in line when Early Bird tickets drop. Past Disrupts have brought Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil, and Vinod Khosla to the stages — part of 250+ industry leaders driving 200+ sessions built to fuel your growth and sharpen your edge. Plus, meet the hundreds of startups innovating across every sector.

San Francisco
|
October 13-15, 2026
WAITLIST NOW

یکی از موانع قابل توجه در این مورد این است که دستیار Speechify در حال حاضر با مرورگرهایی که دارای دستیارهای داخلی نوار کناری مانند Atlas OpenAI، Coment Perplexity و Dia هستند، کار نمی‌کند. این استارتاپ زیاد نگران این موضوع نیست زیرا این افزونه عمدتاً برای Chrome و پایگاه کاربری گسترده آن در نظر گرفته شده است.

Speechify اعلام کرد که قصد دارد به تدریج تایپ صوتی و یک دستیار صوتی را در تمام برنامه‌های خود در سراسر دسکتاپ و موبایل قرار دهد.

این استارتاپ همچنین می‌خواهد به توسعه عواملی بپردازد که وظایف را از طرف شما انجام می‌دهند. این استارتاپ نقشه راه کامل خود را فاش نکرد، اما یک مثال ارائه داد: برقراری تماس برای شما برای تعیین وقت ملاقات یا منتظر ماندن در صف پشتیبانی مشتری یک شرکت. شرکت‌های دیگری مانند Truecaller و Cloacked نیز اهداف مشابهی را دنبال کرده‌اند.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *