Spaces:
Sleeping
Sleeping
tomaseo2022
commited on
Commit
•
b403db6
1
Parent(s):
ecd4ea7
Update app.py
Browse files
app.py
CHANGED
@@ -14,6 +14,11 @@ def pdf_to_xml(pdf_file):
|
|
14 |
for page in pdf_document:
|
15 |
pdf_text += page.get_text()
|
16 |
|
|
|
|
|
|
|
|
|
|
|
17 |
# Aquí iría la lógica para convertir el texto del PDF a XML
|
18 |
# Por ejemplo, puedes usar una librería como lxml para construir un XML
|
19 |
|
|
|
14 |
for page in pdf_document:
|
15 |
pdf_text += page.get_text()
|
16 |
|
17 |
+
# Recortar el texto para evitar nombres de archivo muy largos
|
18 |
+
max_chars = 30 # Ajusta este valor según sea necesario
|
19 |
+
if len(pdf_text) > max_chars:
|
20 |
+
pdf_text = pdf_text[:max_chars]
|
21 |
+
|
22 |
# Aquí iría la lógica para convertir el texto del PDF a XML
|
23 |
# Por ejemplo, puedes usar una librería como lxml para construir un XML
|
24 |
|