tomaseo2022 commited on
Commit
b403db6
1 Parent(s): ecd4ea7

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +5 -0
app.py CHANGED
@@ -14,6 +14,11 @@ def pdf_to_xml(pdf_file):
14
  for page in pdf_document:
15
  pdf_text += page.get_text()
16
 
 
 
 
 
 
17
  # Aquí iría la lógica para convertir el texto del PDF a XML
18
  # Por ejemplo, puedes usar una librería como lxml para construir un XML
19
 
 
14
  for page in pdf_document:
15
  pdf_text += page.get_text()
16
 
17
+ # Recortar el texto para evitar nombres de archivo muy largos
18
+ max_chars = 30 # Ajusta este valor según sea necesario
19
+ if len(pdf_text) > max_chars:
20
+ pdf_text = pdf_text[:max_chars]
21
+
22
  # Aquí iría la lógica para convertir el texto del PDF a XML
23
  # Por ejemplo, puedes usar una librería como lxml para construir un XML
24