AI로 어떤 목소리든 복제할 수 있는 10개의 GitHub 저장소

yena shared this post · 2h ago

Alejo

11h ago · archived 2h ago

AI로 어떤 목소리든 복제할 수 있는 10개의 GitHub 저장소

1

AI로 어떤 목소리든 복제할 수 있는 10개의 GitHub 저장소

저장해두세요. 각 저장소는 몇 초의 오디오에서 목소리를 복사해 당신이 쓰는 대로 말하게 합니다. ElevenLabs가 매달 청구하는 비용을 여기서는 무료로, 오픈 소스로 가질 수 있습니다.

2

1.
https://
github.com/RVC-Boss/GPT-S
oVITS
…

5초짜리 오디오만 주면 이미 목소리를 복제해 버려요. 1분만으로 훈련하면 실제 사람처럼 들리는 모델을 만들 수 있어요. 스페인어, 영어, 일본어, 한국어, 중국어로 작동해요. 59천 스타와 MIT 라이선스. 아주 적은 자료로 복제하는 커뮤니티의 단연 인기 프로젝트예요.

https://t.co/jcg5QxvtYU

3

2.
https://
github.com/CorentinJ/Real
-Time-Voice-Cloning
…

모든 것을 시작한 것. 5초 만에 목소리를 복사하고 실시간으로 음성을 생성합니다. 벨기에 연구원이 논문のために 만든 것으로, GitHub를 폭발시켰습니다. 59천 개의 별. AI 오디오 분야의 중간 섹터의 출발점.

https://t.co/n8MlLkBzyB

4

3.
https://
github.com/coqui-ai/TTS

6초 샘플로 목소리를 복사해서 17개 언어로 말하게 하고, 각 언어의 억양을 적용합니다. 스페인어로 클론한 목소리가 프랑스어나 일본어로 말할 수 있게 해주며, 그 언어로 따로 녹음할 필요가 없습니다. 회사가 문을 닫은 후에도 커뮤니티가 유지하고 있습니다. 개인

https://t.co/PZTZrGYbXw

5

4.
https://
github.com/myshell-ai/Ope
nVoice
…

MIT와 MyShell이 만든 즉시 클로닝. 정확한 톤을 복사하고 감정, 리듬, 멈춤을 제어합니다. V2는 기본적으로 스페인어, 프랑스어, 영어, 중국어, 일본어, 한국어를 지원합니다. MIT 라이선스, 상업적 사용 자유. 수천만 번 사용되었습니다.

https://t.co/TLOTNOqB3U

6

5.
https://
github.com/suno-ai/bark

Genera voz con emoción de verdad: risas, suspiros, tono que sube y baja. Mantiene la música y el ruido de fondo del audio que le pasas. Va fino para narración y personajes. Licencia MIT, libre para producto comercial.

https://t.co/wWbDt2aPwp

7

6.
https://
github.com/RVC-Project/Re
trieval-based-Voice-Conversion-WebUI
…

Entrena un modelo de voz decente con menos de 10 minutos de audio. Convierte tu voz en otra en tiempo real, el motor detrás de medio TikTok de covers con voz de famosos. Licencia MIT.

https://t.co/ckRVWtCMo7

8

7.
https://
github.com/fishaudio/fish
-speech
…

Modelo multilingüe de primer nivel para clonar voz y pasar texto a voz. Calidad que compite con las APIs de pago, corriendo en tu propia máquina. Más de 20 mil estrellas.

https://t.co/QgMHApftcw

9

8.
https://
github.com/resemble-ai/ch
atterbox
…

El estado del arte de 2025 en código abierto. Voz expresiva, en tiempo real y con control de emoción. La alternativa directa a ElevenLabs, montada por Resemble AI. Licencia MIT.

https://t.co/nd3g0K7AIU

10

9.
https://
github.com/SWivid/F5-TTS

짧은 클립에서 목소리를 복제하고 빠르고 유창한 오디오를 생성하세요. 수동 조정이 많이 필요 없고 자연스럽게 들리는 새로운 flow matching 아키텍처. MIT 라이선스.

https://t.co/zQgTJF9Jko

1 / 13