Spaces:

marigold334
/

Glow-HiFi-TTS

Running

App Files Files Community

marigold334 commited on Jun 15, 2023

Commit

d8c4b79

•

1 Parent(s): bb04426

Update app.py (#37)

Browse files

- Update app.py (e49dd711c6d67cb888f881bcec052706f90139bf)

Files changed (1) hide show

app.py +13 -13

app.py CHANGED Viewed

@@ -23,17 +23,17 @@ class TTS:
             last_chpt1 = './log/1038_eunsik_01/Glow_TTS_00289602.pt'
         elif model_variant == 'KSS':
             last_chpt1 = './log/KSS/Glow_TTS_00280641.pt'
-        elif model_variant == '태연':
             last_chpt1 = './log/Taeyeon/Glow_TTS_337000.pt'
         check_point = torch.load(last_chpt1, map_location = device)
-        self.flowgenerator.load_state_dict(check_point['generator' if model_variant != '태연' else 'model'])
-        self.flowgenerator.decoder.skip() if model_variant != '태연' else None
         self.flowgenerator.eval()
         if model_variant == '감기걸린 은식':
-            last_chpt2 = './log/1038_eunsik_01/HiFI_GAN_00257000.pt'
         elif model_variant == 'KSS':
             last_chpt2 = './log/KSS/HiFi_GAN_00135000.pt'
-        elif model_variant == '태연':
             last_chpt2 = './log/Taeyeon/HiFi_GAN_400000.pt'
         check_point = torch.load(last_chpt2, map_location = device)
         self.voicegenerator.load_state_dict(check_point['gen_model'])
@@ -41,7 +41,7 @@ class TTS:
         self.voicegenerator.remove_weight_norm()
     def inference(self, input_text, noise_scale = 0.667, length_scale = 1.0):
-        filters = '([.,!?])' if st.session_state != '태연' else '([,])'
         sentence = re.sub(re.compile(filters), '', input_text)
         x = text_to_sequence(sentence)
         x = torch.autograd.Variable(torch.tensor(x).unsqueeze(0)).to(device).long()
@@ -57,16 +57,16 @@ class TTS:
 def init_session_state():
     if "init_model" not in st.session_state:
         st.session_state.init_model = True
-        st.session_state.model_variant = "태연"
-        st.session_state.TTS = TTS("태연")
 def update_model():
     if st.session_state.model_variant == "KSS":
         st.session_state.TTS = TTS("KSS")
     elif st.session_state.model_variant == "감기걸린 은식":
         st.session_state.TTS = TTS("감기걸린 은식")
-    elif st.session_state.model_variant == '태연':
-        st.session_state.TTS = TTS("태연")
 def update_session_state(state_id, state_value):
     st.session_state[f"{state_id}"] = state_value
@@ -97,7 +97,7 @@ with col1:
         value = "밥은 먹고 다녀?",
     )
 with col2:
-    model_variant = st.selectbox("목소리 선택해주세요", options = ["KSS", "감기걸린 은식", "태연"], index = 1)
 button_change = st.button("Change Vocie")
 if button_change == True:
@@ -107,8 +107,8 @@ if button_change == True:
             update_model()
         st.success('Done!', icon="✅")
-noise_scale = st.slider('noise를 추가합니다.', 0., 2., value = 0.33, step = 0.01)
-length_scale = st.slider('속도를 조절합니다.', 0., 2., value = 1., step = 0.01)
 button_gen = st.button("Generate Voice")
 if button_gen == True:

             last_chpt1 = './log/1038_eunsik_01/Glow_TTS_00289602.pt'
         elif model_variant == 'KSS':
             last_chpt1 = './log/KSS/Glow_TTS_00280641.pt'
+        elif model_variant == '술취한 태연':
             last_chpt1 = './log/Taeyeon/Glow_TTS_337000.pt'
         check_point = torch.load(last_chpt1, map_location = device)
+        self.flowgenerator.load_state_dict(check_point['generator' if model_variant != '술취한 태연' else 'model'])
+        self.flowgenerator.decoder.skip() if model_variant != '술취한 태연' else None
         self.flowgenerator.eval()
         if model_variant == '감기걸린 은식':
+            last_chpt2 = './log/1038_eunsik_01/HiFI_GAN_00664000.pt'
         elif model_variant == 'KSS':
             last_chpt2 = './log/KSS/HiFi_GAN_00135000.pt'
+        elif model_variant == '술취한 태연':
             last_chpt2 = './log/Taeyeon/HiFi_GAN_400000.pt'
         check_point = torch.load(last_chpt2, map_location = device)
         self.voicegenerator.load_state_dict(check_point['gen_model'])
         self.voicegenerator.remove_weight_norm()
     def inference(self, input_text, noise_scale = 0.667, length_scale = 1.0):
+        filters = '([.,!?])' if st.session_state != '술취한 태연' else '([,])'
         sentence = re.sub(re.compile(filters), '', input_text)
         x = text_to_sequence(sentence)
         x = torch.autograd.Variable(torch.tensor(x).unsqueeze(0)).to(device).long()
 def init_session_state():
     if "init_model" not in st.session_state:
         st.session_state.init_model = True
+        st.session_state.model_variant = "술취한 태연"
+        st.session_state.TTS = TTS("술취한 태연")
 def update_model():
     if st.session_state.model_variant == "KSS":
         st.session_state.TTS = TTS("KSS")
     elif st.session_state.model_variant == "감기걸린 은식":
         st.session_state.TTS = TTS("감기걸린 은식")
+    elif st.session_state.model_variant == '술취한 태연':
+        st.session_state.TTS = TTS("술취한 태연")
 def update_session_state(state_id, state_value):
     st.session_state[f"{state_id}"] = state_value
         value = "밥은 먹고 다녀?",
     )
 with col2:
+    model_variant = st.selectbox("목소리 선택해주세요", options = ["KSS", "감기걸린 은식", "술취한 태연"], index = 1)
 button_change = st.button("Change Vocie")
 if button_change == True:
             update_model()
         st.success('Done!', icon="✅")
+noise_scale = st.slider('noise를 추가합니다.', 0., 2., value = 0.3, step = 0.1)
+length_scale = st.slider('속도를 조절합니다.', 0., 2., value = 1., step = 0.1)
 button_gen = st.button("Generate Voice")
 if button_gen == True: