pdf-a-xml / app.py
tomaseo2022's picture
Create app.py
444e1e4
raw
history blame
No virus
638 Bytes
import gradio as gr
from io import BytesIO
import PyPDF2
def pdf_to_xml(pdf_file):
pdf_reader = PyPDF2.PdfReader(pdf_file)
pdf_text = ""
for page in pdf_reader.pages:
pdf_text += page.extract_text()
# Aquí iría la lógica para convertir el texto del PDF a XML
# Por ejemplo, puedes usar una librería como lxml para construir un XML
# Por ahora, simplemente devolveré el texto del PDF
return pdf_text
iface = gr.Interface(
fn=pdf_to_xml,
inputs=gr.inputs.File(label="Selecciona un archivo PDF"),
outputs=gr.outputs.Textbox(label="Archivo XML convertido")
)
iface.launch(share=True)