Serbian Text To Speech
Ispostavilo se da to baš i nije toliko jednostavno a besplatno sprovesti.
Prvo definiši tekst koji generišeš
Latinično, ali ponekada moraš ćirilicu da bi izgovarao na srpskom.
Poštovani komšija, vrata od garaže su otvorena. Ako znate kako, i ako imate vremena, molimo da ih zatvorite ili da obavestite komšije u vajber grupi. Hvala!
Online TTS Tools
Daleko je najbolji Alfanum TTS, pa ću probati online a zatim da uklonim “demo” koji ubacuje u tekst. A ponekada i ne ubaci!
Cloud API Services
-
Google Text-to-Speech, ima, samo napravi novi projekat i idi na https://cloud.google.com/text-to-speech/docs/reference/rest/ languageCode is “sr-RS”, voice is “sr-RS-Standard-A” Ima jedan ženski glas: https://cloud.google.com/text-to-speech/docs/voices
-
IBM Watson Text to Speech, ne mogu niti sa jednom kreditnom karticom da se registrujem, ali ionako nema nijedan jezik https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-voices
-
Microsoft Azure Text-to-Speech, ima neural languages Sophie i Nicholas podržava: https://learn.microsoft.com/en-us/azure/ai-services/speech-service/language-support?tabs=tts
-
Amazon Polly, ipak ne podržava https://docs.aws.amazon.com/polly/latest/dg/ntts-voices-main.html
Za Google, uputstvo kako: https://clincher.medium.com/how-to-use-a-google-cloud-ai-powered-text-to-speech-rest-service-b1980b2c6b7a, i uopšte nije lako.
{
"input": {
"text": "Poštovani komšija, vrata od garaže su otvorena. Ako znate kako, i ako imate vremena, molimo da ih zatvorite ili da obavestite komšije u vajber grupi. Hvala!"
},
"voice": {
"languageCode": "sr-RS",
"name": "sr-RS-Standard-A",
"ssmlGender":"FEMALE"
},
"audioConfig": {
"audioEncoding": "MP3"
}
}
Napravi fajl sa rezultatom koji si dobio i nazovi ga audio-base64.txt
The output is the audio content in the base-64 encoded format. Sada treba da decode the encoded content to an audio file. Decode the text file to an mp3: base64 audio-base64.txt --decode > audio.mp3
. Međutim, verovatno zato što je fajl kada ga napravim UTF8, proradilo je tek kada sam taj fajl uploadovao na https://www.base64decode.org/. Na kraju je rezultat baš loš, odnosno neki od ovih free online servisa nude baš taj glas.
Simple Free Web TTS
Narakeet - Easily Create Voiceovers and Narrated Videos Using Realistic Text to Speech! Serbian (Serbia) Text to Speech