https://github.com/voicepaw/so-vits-svc-fork
GitHub - voicepaw/so-vits-svc-fork: so-vits-svc fork with realtime support, improved interface and more features.
so-vits-svc fork with realtime support, improved interface and more features. - voicepaw/so-vits-svc-fork
github.com
본 문서는 Windows 환경에서 so-vits-svc-fork(v4.1.59) 음성 변환 모델을 안정적으로 실행하기 위한 절차를 기술합니다. 본 프로젝트는 주로 리눅스 환경을 대상으로 개발되었지만, Windows 환경에서도 적절한 설정을 통해 동일한 성능으로 학습 및 추론이 가능합니다.
1. 사전 준비
필수 조건
- Windows 10 이상
- Anaconda 설치
- CUDA 11.8 이상 및 GPU 사용 가능 환경
- Python 3.10 권장
가상환경 생성 후, 아래 명령어를 통해 필수 패키지를 설치합니다.
conda create -n svc python=3.10 -y
conda activate svc
conda install pytorch=2.1.0 torchvision=0.16.0 torchaudio=2.1.0 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install -r requirements.txt
pip install -e .
pip install -e . 명령은 현재 디렉토리를 모듈로 인식시키기 위한 절차입니다.
2. 프로젝트 디렉토리 구성 예시
D:\Project\svc\
├── dataset_raw\
├── dataset\44k\
├── filelists\44k\
├── configs\44k\
│ └── config.json
├── logs\44k\
└── inference\
├── input\
└── output\
3. PowerShell 실행 환경 준비
Windows PowerShell에서는 리눅스와 달리 환경변수 설정 및 명령어 줄바꿈 방식이 다릅니다. 아래와 같은 형식으로 작업을 수행해주시기 바랍니다.
PYTHONPATH 설정 (모든 명령어 실행 전 반드시 수행)
$env:PYTHONPATH = "svc"
4. 주요 명령어
4.1 샘플레이트 변경 (44100Hz로 리샘플링)
python -m so_vits_svc_fork pre-resample `
-i D:\Project\svc\dataset_raw `
-o D:\Project\svc\dataset\44k `
-s 44100
4.2 config.json 자동 생성
python -m so_vits_svc_fork pre-config `
-i D:\Project\svc\dataset\44k `
-f D:\Project\svc\filelists\44k `
-c D:\Project\svc\configs\44k\config.json
config.json 생성은 필수입니다. 생성하지 않으면 이후 단계에서 F0 추출 오류가 발생합니다.
4.3 HuBERT 특성 추출 (사전 처리)
python -m so_vits_svc_fork pre-hubert `
-c D:\Project\svc\configs\44k\config.json
실행 후 data.pt 파일이 생성됩니다.
4.4 모델 학습 시작
$env:CUDA_VISIBLE_DEVICES = "0"
python -m so_vits_svc_fork train `
-c D:\Project\svc\configs\44k\config.json
CUDA_VISIBLE_DEVICES는 사용할 GPU를 지정하는 환경 변수입니다.
4.5 단일 파일 음성 변환 (Inference)
python -m so_vits_svc_fork infer `
D:\Project\svc\inference\input\sample.wav `
-o D:\Project\svc\inference\output\sample_out.wav `
-c D:\Project\svc\configs\44k\config.json `
-m D:\Project\svc\logs\44k\G_100.pth `
-s 1799FA4431 `
-fm crepe
4.6 폴더 전체 음성 변환
python -m so_vits_svc_fork infer `
D:\Project\svc\inference\input `
-o D:\Project\svc\inference\output `
-c D:\Project\svc\configs\44k\config.json `
-m D:\Project\svc\logs\44k\G_100.pth `
-s 1799FA4431 `
-fm crepe `
--recursive
--recursive 옵션은 입력 폴더 내 하위 디렉토리까지 모두 처리합니다.
1799FA4431는 화자 번호 입니다.
5. 주의사항
- PowerShell에서는 줄바꿈 시 백틱( )을 사용합니다. 백슬래시(`)가 아닌 점에 유의하십시오.
- 패키지 설치 시 pip install을 사용하는 경우 PyTorch 버전이 변경될 수 있으므로 항상 버전 호환을 확인해야 합니다.
- PYTHONPATH는 so-vits-svc-fork의 소스 루트 디렉토리를 가리켜야 합니다.
마무리
Windows 환경에서 so-vits-svc-fork를 정상적으로 실행하기 위해서는 정확한 패키지 의존성 관리와 경로 설정이 필수적입니다. 위 절차를 참고하셔서 동일한 구조로 프로젝트를 구성하신다면 문제 없이 학습과 추론을 진행하실 수 있습니다.
필요시 위 명령어들을 .ps1 스크립트로 저장하여 반복 실행을 자동화하실 수 있습니다. 추가적으로 발생하는 오류나 충돌에 대한 해결이 필요하시면, 관련 로그와 함께 문제 상황을 기록해 두시는 것이 좋습니다.
'Artificial Intelligence > so-vits-svc-fork' 카테고리의 다른 글
| [so-vits-svc-fork] Windows 환경에서의 실행 방법 및 버전 변경 대응 가이드 (v4.1.59 → v4.2.26 기준) (2) | 2025.06.02 |
|---|---|
| so-vits-svc-fork로 음성 변환 모델 학습하기 (실전 로그 정리 v4.1.59) (0) | 2025.04.07 |
| 리눅스 환경에서 so-vits-svc-fork 설치 및 실행 방법 정리 (v4.1.59 기준) (0) | 2025.04.01 |