هوش مصنوعی با لحن و احساس باورنکردنی متن‌های فارسی را به گفتار تبدیل می‌کند

جدیدترین مدل هوش مصنوعی شرکت ElevenLabs متن را به‌صورت تمام‌وکمال با احساسات بیان می‌کند.

هوش مصنوعی با لحن و احساس باورنکردنی متن‌های فارسی را به گفتار تبدیل می‌کند

شرکت ElevenLabs به‌صورت رسمی مدل هوش مصنوعی Eleven v3 را معرفی کرد؛ مدلی که در تبدیل متن به گفتار می‌تواند به‌صورت اعجاب‌انگیزی احساسات را به‌طور واقعی به‌کاربران منتقل کند.

مدل Eleven v3 (alpha) اکنون مانند صداپیشه‌ی حرفه‌ای آموزش دیده است و دیگر فقط متن‌ها را نمی‌خواند؛ بلکه اجرا می‌کند. حالا دقیقاً احساسات نویسنده‌ی متن یا سناریو به مخاطب منتقل می‌شود و فرقی نمی‌کند در حال ساخت پادکست باشید یا کتاب صوتی.

از قابلیت‌های مدل Eleven v3 می‌توان به تغییر لحن در اواسط جمله‌ها، بازسازی بسیار حرفه‌ای احساسات نظیر تعجب و خنده و هیجان‌زدگی، انتقال طبیعی احساساتی نظیر آه‌کشیدن و زمزمه و صحبت‌کردن به‌جای چندین شخصیت و گوینده اشاره کرد.

مدل هوش مصنوعی تبدیل متن به گفتار Eleven v3 بیش از ۷۰ زبان را شامل می‌شود که خوشبختانه فارسی هم یکی از آن‌ها است. ElevenLabs می‌گوید که این مدل استفاده‌های حرفه‌ای همچون تولید فیلم و کتاب صوتی را هدف قرار می‌دهد.

این مدل می‌تواند به‌صورت خودکار صدای چندین گوینده را مدیریت کند و برای سناریو‌هایی بسیار کاربردی است که چنددیالوگی هستند. گفتنی است همان‌طور‌که در ویدئو‌ها مشاهده می‌کنید، هنوز سازگاری کامل با زبان فارسی وجود ندارد و در برخی شرایط باید خودتان علائم نگارشی را اضافه کنید.

توجه کنید که هنوز با نسخه‌ی عمومی و کامل Eleven v3 رو‌به‌رو نیستیم و نسخه‌ی نهایی در آینده‌ای نزدیک منتشر می‌شود.

ارسال نظر

خبر‌فوری: ۶ تن از دانشمندان هسته‌ای در حمله تروریستی رژیم صهیونیستی به شهادت رسیدند