Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Strony: 1

 Użytkownik
	

Witam po kilku latach nieobecności. Wczoraj kontrolnie zainstalowałem sobie Debiana Stable, ale mam jeden zasadniczy problem - bezwzględnie potrzebuję zestawu do tworzenia sobie audiobooków mp3 z ebooków, czyli odpowiednik programu Balabolka i głosu Jan [który mam legalnie kupiony]. 
Próbowałem wielu opcji: Balabolki pod Wine/Playonlinux, Festival, espeak, mbrola, RHVoice, jakieś polskie głosy pod Festival - ogólnie wszystko, co znalazłem w sieci po polsku i angielsku. Próbowałem też odpalić głos stąd:
http://www.syntezamowy.pjwstk.edu.pl/korpus.html
ale bez powodzenia - instrukcja niczego mi nie wyjaśniła.
Niestety, instalacja Balabolki i Jana pod Wine nie wyszła, a te wszystkie programiki albo nie mają potrzebnej mi funkcjonalności [jak np. Festival z Orca], albo mają tragicznych lektorów [espeak], albo w ogóle nie wiem, jak to normalnie odpalić.
Czy ktoś ma jakiś sprawdzony, funkcjonalny zestaw pod Debiana? Możliwie dobrze mówiący i możliwie prosty. Jeśli chodzi o edycję ebooków, to biorę to na siebie - mogę tworzyć gotowe pliki .txt samodzielnie. Ale koniecznie potrzebuję sprawnie działający program, który z tych .txt nagra sensownie brzmiące .mp3.
Alternatywnie, może znacie jakiś program pod Androida, który zrobi to, o czym piszę powyżej, a nie jest płatny i jest w pełni funkcjonalny? Wtedy zgrywałbym mptrójki z telefonu na kompa.
Offline



 Użytkownik
	milena_abc - trochę przy kompilacji trzeba pokombinować. Słucham tego od parunastu lat.
Teoretycznie jest możliwa instalacja Jana pod Wine, ale bardzo mocno trzeba pokombinować. Jeśli się uda - milena_abc działa również z głosami SAPI.
http://milena.polip.com/
Ostatnio edytowany przez ethanak (2023-07-10 10:54:15)
Offline



 człowiek pasjonat :D
	MMW napisał(-a):
Niestety, instalacja Balabolki i Jana pod Wine nie wyszła, a te wszystkie programiki albo nie mają potrzebnej mi funkcjonalności [jak np. Festival z Orca], albo mają tragicznych lektorów [espeak], albo w ogóle nie wiem, jak to normalnie odpalić.
Nie wiem jak ten głos ale balabolka ma wersję portable i wersję konsolową. Może spróbuj? Poza tym - dzisiejsze kompy są na tyle mocne że zawsze możesz wirtualizować windę.
Offline

 Użytkownik
	

A może coś pod Androida? Też próbowałem, ale większość programów płatna, chociaż coś mi się kołacze, że był jakiś program bezpłatny i miał dobre głosy, ale nie pamiętam nazwy. A przecież Android sam w sobie ma głos [Z Googla, z Samsunga], więc wystarczyłby tylko prosty program do zamiany tekstu na mowę/MP3 głosem systemowym. 
Wirtualizować nie chcę, bo to wymusza zajmowanie się kolejnym systemem w systemie. Gdybym musiał używać Debiana, to pewnie bym wirtualizował, ale myślałem, że skoro są polskie głosy pod mbrolę czy Festival, to uda się natywnie.
Ostatnio edytowany przez MMW (2023-07-10 14:28:02)
Offline



 Użytkownik
	
 Użytkownik
	

ReadEra od niedawna potrafi czytać syntezatorem.
Offline

 Użytkownik
	

@megabajt Dzięki, pójdę tropem Androida. Głosy w w tym ReadEra są bardzo OK. Oczywiście wersja premium płatna, ale zapoznam się z warunkami licencyjnymi i zapłacę, jeśli nie znajdę darmowego odpowiednika. W wersji bezpłatnej nie wygasza ekranu, co oczywiście jest słabe, ale wiadomo, że za darmo mało komu się chce ;)
edit: Bardzo mi pomogłeś. Wreszcie namierzyłem aplikacje, które mnie interesują. T2S kosztuje nieco ponad 20 PLN jednorazowo i ma możliwość generowania plików dźwiękowych bardzo dobrymi głosami systemowymi i Google :)
edit2 @Voice Aloud Reader też mi się podoba, chociaż to koszt ponad 50 PLN, ale większa funkcjonalność. Jeśli znasz jeszcze jakiś lepszy w relacji cena/jakość, to poproszę.
Ostatnio edytowany przez MMW (2023-07-11 09:58:24)
Offline

 Użytkownik
	

Poszukaj może w sklepie googla: ebook tts reader
Offline

 Użytkownik
	

Jest już OK, znalazłem wszystko, co potrzebne, a teraz piszę z Debiana.
Offline



 Użytkownik
	Ja tylko powiem, że przesłuchanie paru książek Balabolką zaowocowało stworzeniem Mileny... ale jak komuś wystarczy to jego sprawa.
Dzisiaj słucham sobie takim małym ustrojstwem na ESP32, mimo ograniczonych zasobów interpretacja tekstu (odmiana liczebników, skrótowców, prawidłowa wymowa dat czy godzin, wbudowane słowniki wyrażeń obcojęzycznych) to coś, czego mi brakuje w innych aplikacjach.
Offline

 Użytkownik
	

Słucham właśnie na Debianie audiobooka wygenerowanego w telefonie. Nie mam zastrzeżeń. Słychać oczywiście niedoskonałości, ale ogólnie jest to głos nie gorszy od Jana z Ivony - moim skromnym zdaniem.
Reszta softu działa bez problemów. Szczególnie cieszy bezproblemowość Veracrypt i KeePassXC. Miałem obawy, czy otworzą dyski/bazy, ale jest OK.
Offline

 Użytkownik
	

Głos google można syntezować do plików mp3 pakietem gtts-cli
Natomiast w Androidzie można łatwo "gadać" systemowymi syntezatorami po zainstalowaniu Termuxa (linuxowa nakładka) komendą 
termux-tts-speak 'tekst do mówienia'
Offline
 Użytkownik
	
Czy da się używać milena z jakimś sensownie brzmiącym głosem angielskim? Czy da się na tym uruchomić głosy MS 
SAPI5 (te co w Balabolka)?
Dodam, że z projektów offline z polskim lub angielskim mogę polecić Piper. Nie wymaga dużych zasobów typu 12GB GPU. U mnie chodzi na CPU Intel G4560 bez dodatkowej karty graficznej, chociaż całych książek jeszcze nie próbowałem konwertować. Jeśli chodzi o angielski offline, to udało mi się uruchomić (na Manjaro) MS speecht5_tts. Ale wymaga większych zasobów niż Piper. Na github i Hugging Face jest dużo projektów TTS.
Ostatnio edytowany przez gnomek (2024-01-20 17:55:13)
Offline

 Użytkownik
	

gnomek napisał(-a):
Czy da się używać milena z jakimś sensownie brzmiącym głosem angielskim? Czy da się na tym uruchomić głosy MS
SAPI5 (te co w Balabolka)?
Dodam, że z projektów offline z polskim lub angielskim mogę polecić Piper. Nie wymaga dużych zasobów typu 12GB GPU. U mnie chodzi na CPU Intel G4560 bez dodatkowej karty graficznej, chociaż całych książek jeszcze nie próbowałem konwertować. Jeśli chodzi o angielski offline, to udało mi się uruchomić (na Manjaro) MS speecht5_tts. Ale wymaga większych zasobów niż Piper. Na github i Hugging Face jest dużo projektów TTS.
Dzięki wielkie za info o tym Piperze! Świetna sprawa.
Offline
 Użytkownik
	
Polski (pl_PL/m-ailabs_low) jest też w MycroftAI/mimic3 Mimic3 jest bardzo szybki, ale wymowa niektórych polskich wyrazów pozostawia wiele do życzenia. Może znajdzie się ktoś bardziej ogarnięty, z dobrym sprzętem i dostarczy im odpowiednio wytrenowanego modelu / głosu.
Tak jak pisałem, na github jest wiele projektów TTS i bardzo szybko się to rozwija. Zobaczcie np. ten:
KoljaB/RealtimeTTS: Converts text to speech in realtime
To jest ogromny postęp w stosunku do tych mechanicznie brzmiących głosów, jakie były dostępne kilka lat temu.
Albo tu są sample angielskiego z StyleTTS 2.
Albo ten projekt:
GitHub - coqui-ai/TTS:  - a deep learning toolkit for Text-to-Speech, battle-tested in research and production
https://github.com/coqui-ai/TTS
Chociaż jego przyszłość jest już niepewna. 
Problem z niektórymi projektami jest taki, że nie obsługują ssml tags, więc nie zawsze się nadają do każdego zadania.
Fajnie byłoby, gdyby polska społeczność open source się w to włączyła i popracowała nad dostarczeniem polskich modeli głosów z poprawną polską wymową.
Offline



 Użytkownik
	Kombinuję z pożenieniem Mileny z RHVoice, ale to dopiero początki. W każdym razie brzmi całkiem nieźle.
Offline
 Użytkownik
	
Offline
Strony: 1