Multilingual

Published on
August 29, 2023
VALL-E X: Multilingual Text-to-Speech Synthesis and Voice Cloning
text-to-speech voice-cloning multilingual TTS-model VALL-E-X
Discover VALL-E X, an open-source implementation of Microsoft's groundbreaking zero-shot TTS model. Experience multilingual speech synthesis, voice cloning, and more with this powerful tool for content creators and AI enthusiasts.
Published on
July 6, 2023
Whisper- A General-Purpose Speech Recognition Model
speech-recognition multilingual speech-translation language-identification
Whisper is a general-purpose speech recognition model that can perform multilingual speech recognition, speech translation, and language identification. It is trained on a large dataset of diverse audio and uses a Transformer sequence-to-sequence model.