Spaces:

yuewu
/

tocgen

Sleeping

yue-here commited on Aug 8, 2022

Commit

e470706

1 Parent(s): 29aeaf6

add app and reqs

Files changed (2) hide show

app.py ADDED Viewed

+import gradio as gr
+from PIL import Image, ImageOps
+from transformers import VisionEncoderDecoderModel, GPT2Tokenizer, AutoFeatureExtractor
+text_processor = GPT2Tokenizer.from_pretrained("gpt2", pad_token="<|pad|>")
+# text_processor = AutoTokenizer.from_pretrained("yuewu/toc_titler")
+image_processor = AutoFeatureExtractor.from_pretrained("yuewu/toc_titler")
+model = VisionEncoderDecoderModel.from_pretrained("yuewu/toc_titler")
+def array_to_square_image(image):
+    # Numpy array to PIL image
+    image = Image.fromarray(image)
+    # Pad to square image
+    if image.size[0] != image.size[1]:
+        if image.size[0] > image.size[1]:
+            delta = image.size[0] - image.size[1]
+            padding = (0, delta//2, 0, delta//2)
+        if image.size[0] < image.size[1]:
+            delta = image.size[1] - image.size[0]
+            padding = (delta//2, 0, delta//2, 0)
+        image = ImageOps.expand(image, padding, fill=(255, 255, 255))
+    # In case size is off by 1
+    if image.size[0] != image.size[1]:
+        image.resize((image.size[0], image.size[0]))
+    return image
+def greet(image):
+    image = array_to_square_image(image)
+    pixel_values = image_processor(image, return_tensors="pt").pixel_values
+    generated_ids = model.generate(pixel_values)
+    generated_text = text_processor.batch_decode(generated_ids, skip_special_tokens=True)
+    return generated_text[0]
+demo = gr.Interface(fn=greet, inputs="image", outputs="text")
+demo.launch()

requirements.txt ADDED Viewed