Câu hỏi về cấu hình training

#1
by whoisltd - opened

Mình muốn hỏi về độ lớn của dataset, cấu hình gpu và thời gian training. Team có thể chia sẻ không ạ ?

BKAI-HUST Foundation Models Lab org

Chào bạn, mình xin phép trả lời câu hỏi của bạn:

Độ lớn dataset sau khi đã dịch và tiền xử lý:
MSMACRO: ~ 4GB
SQuAD v2: ~ 30 MB
Legal Text Retrieval Zalo 2021: ~ 200 MB

Cấu hình GPU: 1 card GPU A100 40GB

Thời gian training: ~ 1h / epoch

Nếu có câu hỏi gì thêm thì hãy liên lạc với team mình nhé.

phamson02 changed discussion status to closed
phamson02 changed discussion status to open

Sign up or log in to comment