summarize_youtube

Sleeping

smakamali commited on Sep 30, 2023

Commit

b313c5d

•

1 Parent(s): aa0044b

update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -18,8 +18,10 @@ def transcribe_youtube_video(url, force_transcribe=False):
     if text == '' or force_transcribe:
         from pytube import YouTube
         import torch
         save_dir="./docs/youtube/"
         yt = YouTube(str(url))
         audio = yt.streams.filter(only_audio = True).first()
         out_file = audio.download(filename="audio.mp3",output_path = save_dir)
@@ -172,9 +174,9 @@ def summarize_text(title,text):
     from langchain.document_loaders import TextLoader
     from langchain.text_splitter import TokenTextSplitter
-    with open('./transcript.txt','w') as f:
         f.write(text)
-    loader = TextLoader("./transcript.txt")
     doc = loader.load()
     text_splitter = TokenTextSplitter(chunk_size=500, chunk_overlap=0)
     docs = text_splitter.split_documents(doc)

     if text == '' or force_transcribe:
         from pytube import YouTube
         import torch
+        import os
         save_dir="./docs/youtube/"
+        os.mkdir(save_dir)
         yt = YouTube(str(url))
         audio = yt.streams.filter(only_audio = True).first()
         out_file = audio.download(filename="audio.mp3",output_path = save_dir)
     from langchain.document_loaders import TextLoader
     from langchain.text_splitter import TokenTextSplitter
+    with open('./docs/transcript.txt','w') as f:
         f.write(text)
+    loader = TextLoader("./docs/transcript.txt")
     doc = loader.load()
     text_splitter = TokenTextSplitter(chunk_size=500, chunk_overlap=0)
     docs = text_splitter.split_documents(doc)