CoquiTTS: An Open-Source Text-To-Speech Library

a deep learning toolkit for Text-to-Speech, battle-tested in research and production

CoquiTTS: An Open-Source Text-To-Speech Library
Photo by Murat Onder / Unsplash

CoquiTTS is a library for advanced Text-to-Speech generation. It's built on the latest research, was designed to achieve the best trade-off among ease-of-training, speed and quality.

It comes with pretrained models, tools for measuring dataset quality and already used in 20+ languages for products and research projects.

CoquiTTS is written with Python, and it can be a handy tool for video game developers, post-production, dubbing, and creating educational videos.

CoquiTTS developers are working now on, Coqui studio which will offer a straightforward simple user-friendly interface to clone and create text-to-speech audios in MP3 format.

Features

  • High-performance Deep Learning models for Text2Speech tasks.
  • Text2Spec models (Tacotron, Tacotron2, Glow-TTS, SpeedySpeech).
  • Speaker Encoder to compute speaker embeddings efficiently.
  • Vocoder models (MelGAN, Multiband-MelGAN, GAN-TTS, ParallelWaveGAN, WaveGrad, WaveRNN)
  • Fast and efficient model training.
  • Detailed training logs on the terminal and Tensorboard.
  • Support for Multi-speaker TTS.
  • Efficient, flexible, lightweight but feature complete Trainer API.
  • Released and ready-to-use models.
  • Tools to curate Text2Speech datasets underdataset_analysis.
  • Utilities to use and test your models.
  • Modular (but not too much) code base enabling easy implementation of new ideas.

Implemented Models

Spectrogram models

End-to-End Models

Attention Methods

  • Guided Attention: paper
  • Forward Backward Decoding: paper
  • Graves Attention: paper
  • Double Decoder Consistency: blog
  • Dynamic Convolutional Attention: paper
  • Alignment Network: paper

Speaker Encoder

Vocoders

License

The project is released under the MPL-2.0 License.

Resources

  1. Source code
  2. Website



Read more

10 فوائد للبرمجة للأطفال: لماذا نتعلم البرمجة في سن مبكرة؟

10 فوائد للبرمجة للأطفال: لماذا نتعلم البرمجة في سن مبكرة؟

البرمجة هي نشاط ممتع متعدد التخصصات يشرك العقل ويحمل الكثير من الفوائد الضخمة للأطفال. على سبيل المثال، هل تعلم أنه يدعم إبداعهم وتفكيرهم المنطقي بالإضافة إلى قدرتهم على التركيز؟ فيما يلي قائمتنا المختصرة التي تضم أهم 10 فوائد للبرمجة للأطفال، بناءً على تجربتنا التجريبية والنتائج العلمية المتاحة. في جميع أنحاء

By Hazem Abbas
أفضل ٦ لغات برمجة و إطارات عمل لتعلمها فى ٢٠٢٤ ربما لا تعرف عنها شيئاً

أفضل ٦ لغات برمجة و إطارات عمل لتعلمها فى ٢٠٢٤ ربما لا تعرف عنها شيئاً

يتسارع المطورون و الشركات بإنتاج تقنيات برمجية جديدة للمطورين كل عام, فى هذا المقال سنتعرف على أهم هذه الحلول البرمجية لبناء تطبيقات و مواقع تفاعلية بشكل سليس و سريع و عملى, طبعاً هذه التوصيات مبنية على وجهة نظر المطورين بهذا الموقع, و التى نوصى بها لعملائنا من الشركات كما نعلمها

By Hazem Abbas



Open-source Apps

9,500+

Medical Apps

500+

Lists

450+

Dev. Resources

900+