Spaces:
Sleeping
Sleeping
import gradio as gr | |
from io import BytesIO | |
import PyPDF2 | |
def pdf_to_xml(pdf_file): | |
pdf_reader = PyPDF2.PdfReader(pdf_file) | |
pdf_text = "" | |
for page in pdf_reader.pages: | |
pdf_text += page.extract_text() | |
# Aquí iría la lógica para convertir el texto del PDF a XML | |
# Por ejemplo, puedes usar una librería como lxml para construir un XML | |
# Por ahora, simplemente devolveré el texto del PDF | |
return pdf_text | |
iface = gr.Interface( | |
fn=pdf_to_xml, | |
inputs=gr.inputs.File(label="Selecciona un archivo PDF"), | |
outputs=gr.outputs.Textbox(label="Archivo XML convertido") | |
) | |
iface.launch(share=True) | |