لینک کوتاه مطلب : https://hsgar.com/?p=4145

معرفی Mimic 3 توسط Mycroft

Mimic 3 همچنین می‌تواند روی هر نصب Mycroft موجود با Raspberry Pi 4 یا بهتر با استفاده از پلاگین TTS ما استفاده شود. این می‌تواند صدای دستیار Mycroft، رایانه یا پروژه بعدی اینترنت اشیا شما باشد. در نظر گرفته شده است که در دستگاه هایی مانند Raspberry Pi 4 کاملا آفلاین اجرا شود و با سایر نرم افزارهای منبع باز مانند دستیار خانه و گره-قرمز. Mimic 3 شامل یک API وب و همچنین یک رابط خط فرمان است که به راحتی در اسکریپت ها و اتوماسیون ها استفاده می شود.

Mycroft AI دارای صداهای از پیش آموزش دیده برای Mimic 3 به 25 زبان مختلف است که بیش از 100 فرد انگلیسی زبان در دسترس هستند. اکثر صداها بر اساس مجموعه داده های در دسترس عموم از داوطلبان سراسر جهان، مانند افراد خستگی ناپذیر تورستن مولر. ما همیشه به دنبال مجموعه‌های داده از زبان‌های جدید، یا مجموعه داده‌های با کیفیت بالاتر برای یک زبان پشتیبانی‌شده در حال حاضر هستیم. تنها چیزی که لازم است یک صدا است تا برای همه تفاوت ایجاد کند!

ما همچنین تعدادی مجموعه داده جدید را در یک محیط کنترل‌شده‌تر با داده‌های متنوع آوایی ضبط کرده‌ایم که کیفیت صدا را به میزان قابل توجهی افزایش می‌دهد. صداهای ممتاز آموزش‌دیده از این مجموعه داده‌های Mycroft در Mark II، برای اعضای Mycroft و تحت قراردادهای مجوز تجاری در دسترس خواهند بود.

Mimic 3 علاوه بر کنترل‌های صوتی اولیه مانند سرعت صحبت و تغییرپذیری، از زیرمجموعه‌ای پشتیبانی می‌کند زبان نشانه گذاری سنتز گفتار (SSML)، به شما امکان می دهد اسکریپت کنید که چه کسی و چگونه صحبت می کند. با SSML، می‌توانید یک سند واحد ایجاد کنید که صداها (و حتی زبان‌ها) را تغییر می‌دهد، شامل مکث‌های زمان‌بندی شده بین جمله‌ها و تنظیم دستی صدا، سرعت و غیره می‌شود. اسناد را ببینید برای جزئیات بیشتر در مورد اینکه دقیقا چه تگ های SSML در حال حاضر پشتیبانی می شوند.

برای همه گزینه ها به مستندات ما مراجعه کنید.

لینک منبع

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.