KLM 4.1 [한국어]

#1
by SeoulStreamingStation - opened

KLM 4.1 [2024년 6월 22일]

4.1 업데이트 내용 -

  1. KLM Live의 일부 데이터를 4.1의 데이터에 포함시켰습니다. KLM 4.1은 일부 기침 소리, 웃음 소리와 같은 특수한 소음 레이어를 별도로 가지고 있습니다.
    단 이러한 소음 레이어가 일반적은 목소리가 구현되는 200hz ~ 1200hz 사이에서 직접적으로 반응하지 않도록 하였기 때문에 Okada와 같은 Voice Changer의 사용을 위해서는 별도의 기침 또는 웃음 소리의 데이터를 모델에 별도로 학습 시키는 것을 권장합니다.

  2. 여성 보컬을 전반적으로 모두 다시 작업하였습니다. 4.0의 경우 각 보컬리스트 또는 성우분에게 자유로운 곡을 선택하게 하여 다양한 곡들을 넣은 반면, 4.1의 경우 각 곡마다 [진성], [가성], [혼합] 을 병행하여 추론되는 대상이 이용하는 다양한 창법을 자연스럽게 따라갈 수 있도록 하였습니다.

  3. JPOP 에서 자주 사용되는 창법을 추가로 학습시켰습니다. JPOP 특유의 고음에서 진성과 가성을 꺾는 특유의 소리를 내는 창법을 학습 시켰습니다.

  4. 피치맵 벨런스 작업
    A2-G3, G4-C5, D5-B5 까지의 음역대에 데이터를 분리하여 데이터의 양과 다양성 볼륨 레벨을 평준화 시켰습니다.

  5. 이용자의 요청에 따른 라벨 작업. 보유하고 있던 모든 데이터셋의 라벨링을 진행하여 학습시 그라디언트가 조금 더 안정적으로 진행될 수 있도록 하였습니다.

  6. 40k Sample Rate가 지속적으로 불안정한 아웃풋을 생성한다는 것을 발견하였습니다. 이 현상을 완벽히 이해하기 전까지 40k Sample rate의 모델은 당분간 공식적으로 지원하지 않습니다.

RVC 개발자 분들에게 드리는 글 -
KLM 4.1 이후 사전학습 모델은 상업적인 이용 목적이 없는 이상, 무료로 여러분들의 소프트웨어의 사전학습 모델로 탑재하여 사용하여도 됩니다.
또한 본 모델을 여러분의 서버 또는 HF에 업로드 하여 (2차 업로드) 사용하실 수 있으며, 각 국가별 AI 커뮤니티 등에 배포하거나 공유하는 것이 허용됩니다. 단 KLM의 정식 명칭을 변경하여서는 안되며, Fine-Tune을 거친 경우 KLM-Name과 같이 반드시 KLM의 모델명이 포함되어야 합니다.

감사합니다.

SeoulStreamingStation changed discussion title from KLM 4.1 [한국어 설명] to KLM 4.1 [한국어]

Sign up or log in to comment