هوش مصنوعی با لحن و احساس باورنکردنی متنهای فارسی را به گفتار تبدیل میکند
جدیدترین مدل هوش مصنوعی شرکت ElevenLabs متن را بهصورت تماموکمال با احساسات بیان میکند.

شرکت ElevenLabs بهصورت رسمی مدل هوش مصنوعی Eleven v3 را معرفی کرد؛ مدلی که در تبدیل متن به گفتار میتواند بهصورت اعجابانگیزی احساسات را بهطور واقعی بهکاربران منتقل کند.
مدل Eleven v3 (alpha) اکنون مانند صداپیشهی حرفهای آموزش دیده است و دیگر فقط متنها را نمیخواند؛ بلکه اجرا میکند. حالا دقیقاً احساسات نویسندهی متن یا سناریو به مخاطب منتقل میشود و فرقی نمیکند در حال ساخت پادکست باشید یا کتاب صوتی.
از قابلیتهای مدل Eleven v3 میتوان به تغییر لحن در اواسط جملهها، بازسازی بسیار حرفهای احساسات نظیر تعجب و خنده و هیجانزدگی، انتقال طبیعی احساساتی نظیر آهکشیدن و زمزمه و صحبتکردن بهجای چندین شخصیت و گوینده اشاره کرد.
مدل هوش مصنوعی تبدیل متن به گفتار Eleven v3 بیش از ۷۰ زبان را شامل میشود که خوشبختانه فارسی هم یکی از آنها است. ElevenLabs میگوید که این مدل استفادههای حرفهای همچون تولید فیلم و کتاب صوتی را هدف قرار میدهد.
این مدل میتواند بهصورت خودکار صدای چندین گوینده را مدیریت کند و برای سناریوهایی بسیار کاربردی است که چنددیالوگی هستند. گفتنی است همانطورکه در ویدئوها مشاهده میکنید، هنوز سازگاری کامل با زبان فارسی وجود ندارد و در برخی شرایط باید خودتان علائم نگارشی را اضافه کنید.
توجه کنید که هنوز با نسخهی عمومی و کامل Eleven v3 روبهرو نیستیم و نسخهی نهایی در آیندهای نزدیک منتشر میشود.