Mainak Manna commited on
Commit
9424e69
1 Parent(s): ef3ac5b

First version of the model

Browse files
Files changed (1) hide show
  1. README.md +69 -0
README.md ADDED
@@ -0,0 +1,69 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ ---
3
+ language: Spanish
4
+ tags:
5
+ - summarization Spanish model
6
+ datasets:
7
+ - jrc-acquis
8
+ widget:
9
+ - text: "EL CONSEJO DE LA UNIÓN EUROPEA, Visto el Tratado constitutivo de la Comunidad Europea y, en particular, su artículo 37, Vista la propuesta de la Comisión, Visto el dictamen del Parlamento Europeo [1], Considerando lo siguiente: (1) El Reglamento (CE) no 3690/93 [2] está basado en el Reglamento (CEE) no 3760/92 del Consejo, de 20 de diciembre de 1992, por el que se establece un régimen comunitario de la pesca y la acuicultura [3], que fue sustituido por el Reglamento (CE) no 2371/2002 del Consejo, de 20 de diciembre de 2002, sobre la conservación y la explotación sostenible de los recursos pesqueros en virtud de la política pesquera común [4]. Las referencias y disposiciones incluidas en el Reglamento (CE) no 3690/93 ya no son compatibles con este nuevo Reglamento, que establece nuevas normas para la gestión de la capacidad de pesca según lo expresado en las licencias de pesca. (2) El artículo 22, apartado 3, y el artículo 13, apartado 3, del Reglamento (CE) no 2371/2002 otorgan a la Comisión la potestad de establecer normas de aplicación para la gestión de las licencias de pesca y las capacidades de pesca. (3) La Comisión adoptó, el 3 de agosto de 2005, el Reglamento (CE) no 1281/2005, sobre la gestión de las licencias de pesca y la información mínima que deben contener [5], que debe aplicarse a partir de la fecha de derogación del Reglamento (CE) no 3690/93. (4) Por lo tanto, el Reglamento (CE) no 3690/93 debe derogarse. HA ADOPTADO EL PRESENTE REGLAMENTO: Artículo 1 1. Queda derogado el Reglamento (CE) no 3690/93. 2. Las referencias al Reglamento derogado se interpretarán como referencias al Reglamento (CE) no 1281/2005 y se leerán con arreglo al cuadro de correspondencias que figura en el anexo del presente Reglamento. Artículo 2 El presente Reglamento entrará en vigor a los siete días de su publicación en el Diario Oficial de la Unión Europea. El presente Reglamento será obligatorio en todos sus elementos y directamente aplicable en cada Estado miembro. Hecho en Luxemburgo, el 25 de abril de 2006. Por el Consejo El Presidente J. Pröll [1] No publicado aún en el Diario Oficial. [2] DO L 341 de 31.12.1993, p. 93. [3] DO L 389 de 31.12.1992, p. 1. Reglamento modificado en último lugar por el Reglamento (CE) no 1181/98 (DO L 164 de 9.6.1998, p. 1). [4] DO L 358 de 31.12.2002, p. 59. [5] DO L 203 de 4.8.2005, p. 3. -------------------------------------------------- ANEXO Cuadro de correspondencias Reglamento (CE) no 3690/93 | Reglamento (CE) no 1281/2005 | Artículo 1 | Artículos 1 y 3 | Artículo 2 | Artículo 5 | Artículo 3 | Artículo 4 | Artículo 4 | Artículo 5 | Artículo 5 | Artículo 6 | Artículo 6 | — | Artículo 7 | — | Artículo 8 | — | Artículo 9 | — | Artículo 10 | Artículos 8 y 9 | -------------------------------------------------- "
10
+
11
+ ---
12
+
13
+ # legal_t5_small_summ_es model
14
+
15
+ Model for Summarization of legal text written in Spanish. It was first released in
16
+ [this repository](https://github.com/agemagician/LegalTrans). This model is trained on three parallel corpus from jrc-acquis.
17
+
18
+
19
+ ## Model description
20
+
21
+ legal_t5_small_summ_es is based on the `t5-small` model and was trained on a large corpus of parallel text. This is a smaller model, which scales the baseline model of t5 down by using `dmodel = 512`, `dff = 2,048`, 8-headed attention, and only 6 layers each in the encoder and decoder. This variant has about 60 million parameters.
22
+
23
+ ## Intended uses & limitations
24
+
25
+ The model could be used for summarization of legal texts written in Spanish.
26
+
27
+ ### How to use
28
+
29
+ Here is how to use this model to summarize legal text written in Spanish in PyTorch:
30
+
31
+ ```python
32
+ from transformers import AutoTokenizer, AutoModelWithLMHead, TranslationPipeline
33
+
34
+ pipeline = TranslationPipeline(
35
+ model=AutoModelWithLMHead.from_pretrained("SEBIS/legal_t5_small_summ_es"),
36
+ tokenizer=AutoTokenizer.from_pretrained(pretrained_model_name_or_path = "SEBIS/legal_t5_small_summ_es", do_lower_case=False,
37
+ skip_special_tokens=True),
38
+ device=0
39
+ )
40
+
41
+ es_text = "EL CONSEJO DE LA UNIÓN EUROPEA, Visto el Tratado constitutivo de la Comunidad Europea y, en particular, su artículo 37, Vista la propuesta de la Comisión, Visto el dictamen del Parlamento Europeo [1], Considerando lo siguiente: (1) El Reglamento (CE) no 3690/93 [2] está basado en el Reglamento (CEE) no 3760/92 del Consejo, de 20 de diciembre de 1992, por el que se establece un régimen comunitario de la pesca y la acuicultura [3], que fue sustituido por el Reglamento (CE) no 2371/2002 del Consejo, de 20 de diciembre de 2002, sobre la conservación y la explotación sostenible de los recursos pesqueros en virtud de la política pesquera común [4]. Las referencias y disposiciones incluidas en el Reglamento (CE) no 3690/93 ya no son compatibles con este nuevo Reglamento, que establece nuevas normas para la gestión de la capacidad de pesca según lo expresado en las licencias de pesca. (2) El artículo 22, apartado 3, y el artículo 13, apartado 3, del Reglamento (CE) no 2371/2002 otorgan a la Comisión la potestad de establecer normas de aplicación para la gestión de las licencias de pesca y las capacidades de pesca. (3) La Comisión adoptó, el 3 de agosto de 2005, el Reglamento (CE) no 1281/2005, sobre la gestión de las licencias de pesca y la información mínima que deben contener [5], que debe aplicarse a partir de la fecha de derogación del Reglamento (CE) no 3690/93. (4) Por lo tanto, el Reglamento (CE) no 3690/93 debe derogarse. HA ADOPTADO EL PRESENTE REGLAMENTO: Artículo 1 1. Queda derogado el Reglamento (CE) no 3690/93. 2. Las referencias al Reglamento derogado se interpretarán como referencias al Reglamento (CE) no 1281/2005 y se leerán con arreglo al cuadro de correspondencias que figura en el anexo del presente Reglamento. Artículo 2 El presente Reglamento entrará en vigor a los siete días de su publicación en el Diario Oficial de la Unión Europea. El presente Reglamento será obligatorio en todos sus elementos y directamente aplicable en cada Estado miembro. Hecho en Luxemburgo, el 25 de abril de 2006. Por el Consejo El Presidente J. Pröll [1] No publicado aún en el Diario Oficial. [2] DO L 341 de 31.12.1993, p. 93. [3] DO L 389 de 31.12.1992, p. 1. Reglamento modificado en último lugar por el Reglamento (CE) no 1181/98 (DO L 164 de 9.6.1998, p. 1). [4] DO L 358 de 31.12.2002, p. 59. [5] DO L 203 de 4.8.2005, p. 3. -------------------------------------------------- ANEXO Cuadro de correspondencias Reglamento (CE) no 3690/93 | Reglamento (CE) no 1281/2005 | Artículo 1 | Artículos 1 y 3 | Artículo 2 | Artículo 5 | Artículo 3 | Artículo 4 | Artículo 4 | Artículo 5 | Artículo 5 | Artículo 6 | Artículo 6 | — | Artículo 7 | — | Artículo 8 | — | Artículo 9 | — | Artículo 10 | Artículos 8 y 9 | -------------------------------------------------- "
42
+
43
+ pipeline([es_text], max_length=512)
44
+ ```
45
+
46
+ ## Training data
47
+
48
+ The legal_t5_small_summ_es model was trained on [JRC-ACQUIS](https://wt-public.emm4u.eu/Acquis/index_2.2.html) dataset consisting of 23 Thousand texts.
49
+
50
+ ## Training procedure
51
+
52
+ ### Preprocessing
53
+
54
+ ### Pretraining
55
+ An unigram model with 88M parameters is trained over the complete parallel corpus to get the vocabulary (with byte pair encoding), which is used with this model.
56
+
57
+
58
+ ## Evaluation results
59
+
60
+ When the model is used for classification test dataset, achieves the following results:
61
+
62
+ Test results :
63
+
64
+ | Model | Rouge1 | Rouge2 | Rouge Lsum |
65
+ |:-----:|:-----:|:-----:|:-----:|
66
+ | legal_t5_small_cls_es | 80.23|70.16 |78.69|
67
+
68
+
69
+ ### BibTeX entry and citation info