możesz napisać, jakiego TTS używasz? Szukam czegoś dobrego do SpeakVault, bo większość testowanych przeze mnie rozwiązań ma kiepską jakość mowy i głosów. Wiem, jak działa cały program. Nie wiem, czy jesteś na naszym serwerze, ale współpracuję z Rafkiem, więc mam dostęp do większej ilości informacji, np. dlaczego wybrano ElevenLabs, a nie inne rozwiązanie
No widzisz, tylko że w praktyce to nie jest takie proste. Lokalne TTS-y faktycznie istnieją, ale mają swoje ograniczenia – często lagi, gorszą jakość głosu, brak naturalnej intonacji. Do tego nie każdy ma sprzęt za 5 tys., żeby to uciągnąć w dobrej jakości i czasie rzeczywistym.
RVC czy Piper mogą działać, ale na słabszych PC generacja trwa wieki, a efekty nie zawsze są zadowalające. ElevenLabs czy inne chmurowe rozwiązania po prostu robią to szybciej i lepiej, więc czasem chodzi o balans między jakością, wygodą a wymaganiami sprzętowymi