Spaces:

kavg
/

TrOCR-SIN-demo

Sleeping

kavg commited on Apr 8

Commit

3d68599

•

1 Parent(s): 0ca5f4d

Update app.py

fixed image input type

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,19 +4,17 @@ import gradio as gr
 from PIL import Image
 def OCR(image):
-    # Load the image
-    img = Image.open(image)
     model = VisionEncoderDecoderModel.from_pretrained("kavg/TrOCR-SIN")
     tokenizer = AutoTokenizer.from_pretrained('NLPC-UOM/SinBERT-large')
     feature_extractor = ViTImageProcessor.from_pretrained("google/vit-base-patch16-224")
     processor = TrOCRProcessor(image_processor=feature_extractor, tokenizer=tokenizer)
-    pixel_values = processor(img, return_tensors="pt").pixel_values
     generated_ids = model.generate(pixel_values)
     generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
     return generated_text
-demo = gr.Interface(fn=OCR,  inputs=gr.Image(),outputs=gr.Textbox())
 demo.launch(debug=True)

 from PIL import Image
 def OCR(image):
     model = VisionEncoderDecoderModel.from_pretrained("kavg/TrOCR-SIN")
     tokenizer = AutoTokenizer.from_pretrained('NLPC-UOM/SinBERT-large')
     feature_extractor = ViTImageProcessor.from_pretrained("google/vit-base-patch16-224")
     processor = TrOCRProcessor(image_processor=feature_extractor, tokenizer=tokenizer)
+    pixel_values = processor(image, return_tensors="pt").pixel_values
     generated_ids = model.generate(pixel_values)
     generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
     return generated_text
+demo = gr.Interface(fn=OCR,  inputs=gr.Image(label="Select an image with Sinhala textline", type="pil"),outputs=gr.Textbox())
 demo.launch(debug=True)