Spaces:

flocolombari
/

COLOMBARI_VIGNES-FERRINO_DERNIAUX_NIYONKURU

Runtime error

flocolombari commited on Sep 19, 2023

Commit

d4bf58f

1 Parent(s): 1bdad60

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,13 +1,15 @@
 import gradio as gr
 from transformers import pipeline
 import cv2
 def video_to_descriptions(video):
     # Charger le modèle via pipeline
-    model = pipeline('image-to-text', model='nlpconnect/vit-gpt2-image-captioning')
     # Ouvrir la vidéo
-    cap = cv2.VideoCapture(video)
     fps = int(cap.get(cv2.CAP_PROP_FPS))
     descriptions = []
@@ -22,8 +24,10 @@ def video_to_descriptions(video):
         if frame_count % (fps // 2) == 0:
             # Convertir l'image en RGB
             frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
             # Obtenir la description de l'image
-            outputs = model(frame_rgb)
             description = outputs[0]['describe-text']
             descriptions.append(description)

 import gradio as gr
 from transformers import pipeline
 import cv2
+from PIL import Image
+import io
 def video_to_descriptions(video):
     # Charger le modèle via pipeline
+    model = pipeline('text2text-generation', model='nlpconnect/vit-gpt2-image-captioning')
     # Ouvrir la vidéo
+    cap = cv2.VideoCapture(video.name)
     fps = int(cap.get(cv2.CAP_PROP_FPS))
     descriptions = []
         if frame_count % (fps // 2) == 0:
             # Convertir l'image en RGB
             frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
+            # Convertir le tableau numpy en une image PIL
+            pil_img = Image.fromarray(frame_rgb)
             # Obtenir la description de l'image
+            outputs = model(pil_img)
             description = outputs[0]['describe-text']
             descriptions.append(description)