Spaces:

hoduyquocbao
/

LLAMA3.2-GRop

Sleeping

App Files Files Community

hoduyquocbao commited on Sep 27

Commit

9c3f080

•

1 Parent(s): ece098b

fix error features

Browse files

Files changed (4) hide show

__pycache__/checkpoint.cpython-310.pyc +0 -0
app.py +1 -1
checkpoint.py +103 -84
requirements.txt +2 -1

__pycache__/checkpoint.cpython-310.pyc ADDED Viewed

Binary file (4.03 kB). View file

app.py CHANGED Viewed

@@ -289,7 +289,6 @@ def generate(
     # Thông báo về việc phân tích đầu vào
     yield "🔍 Đang phân tích truy vấn của bạn..."
-    continuous_training(max_epochs=3)
     # Xác định hàm nào sẽ được gọi dựa trên tin nhắn của người dùng
     function_call = process_query(message)
@@ -300,6 +299,7 @@ def generate(
     elif function_call["name"] == "summarize_query":
         yield "🛠️ Đã chọn chức năng: Tóm tắt văn bản."
     elif function_call["name"] == "sentiment_analysis":
         yield "🛠️ Đã chọn chức năng: Phân tích tâm lý."
     elif function_call["name"] in ["general_query", "hard_query"]:
         yield "🛠️ Đã chọn chức năng: Trả lời câu hỏi."

     # Thông báo về việc phân tích đầu vào
     yield "🔍 Đang phân tích truy vấn của bạn..."
     # Xác định hàm nào sẽ được gọi dựa trên tin nhắn của người dùng
     function_call = process_query(message)
     elif function_call["name"] == "summarize_query":
         yield "🛠️ Đã chọn chức năng: Tóm tắt văn bản."
     elif function_call["name"] == "sentiment_analysis":
+        continuous_training(total_steps=300, steps_per_call=50)
         yield "🛠️ Đã chọn chức năng: Phân tích tâm lý."
     elif function_call["name"] in ["general_query", "hard_query"]:
         yield "🛠️ Đã chọn chức năng: Trả lời câu hỏi."

checkpoint.py CHANGED Viewed

@@ -6,7 +6,10 @@ from transformers import (
     AutoModelForCausalLM,
     TrainingArguments,
     Trainer,
-    DataCollatorForLanguageModeling
 )
 from peft import LoraConfig, get_peft_model
 import spaces
@@ -17,16 +20,15 @@ CHECKPOINT_DIR = "./checkpoints"
 if not os.path.exists(CHECKPOINT_DIR):
     os.makedirs(CHECKPOINT_DIR)
-# Tải Dataset
 dataset = load_dataset('vntc/wiki-mini-corpus')
-# Chia Dataset thành train và validation
 split_dataset = dataset['train'].train_test_split(test_size=0.1, seed=42)
 train_dataset = split_dataset['train']
 validation_dataset = split_dataset['test']
-# Tiền Xử Lý Văn Bản
-@spaces.GPU(duration=20, queue=False)
 def preprocess_function(examples):
     passages = [passage.lower().strip() for passage in examples['passage']]
     return {'passage': passages}
@@ -34,7 +36,7 @@ def preprocess_function(examples):
 processed_train = train_dataset.map(preprocess_function, batched=True, remove_columns=['id', 'metadata'])
 processed_validation = validation_dataset.map(preprocess_function, batched=True, remove_columns=['id', 'metadata'])
-# Tokenization
 model_name = "meta-llama/Llama-3.2-3B-Instruct"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
@@ -42,7 +44,6 @@ tokenizer = AutoTokenizer.from_pretrained(model_name)
 if tokenizer.pad_token is None:
     tokenizer.pad_token = tokenizer.eos_token
-@spaces.GPU(duration=20, queue=False)
 def tokenize_function(examples):
     return tokenizer(
         examples['passage'],
@@ -54,8 +55,7 @@ def tokenize_function(examples):
 tokenized_train = processed_train.map(tokenize_function, batched=True)
 tokenized_validation = processed_validation.map(tokenize_function, batched=True)
-# Thêm trường 'labels'
-# @spaces.GPU(duration=20, queue=False)
 def add_labels(examples):
     examples['labels'] = examples['input_ids'].copy()
     return examples
@@ -63,79 +63,93 @@ def add_labels(examples):
 tokenized_train = tokenized_train.map(add_labels, batched=True)
 tokenized_validation = tokenized_validation.map(add_labels, batched=True)
-# Loại bỏ các cột không cần thiết
 tokenized_train = tokenized_train.remove_columns(['passage'])
 tokenized_validation = tokenized_validation.remove_columns(['passage'])
-# Định dạng dữ liệu cho PyTorch
 tokenized_train.set_format('torch')
 tokenized_validation.set_format('torch')
-# Tạo DatasetDict
 final_dataset = {
     'train': tokenized_train,
     'validation': tokenized_validation
 }
-# Tải và Cấu Hình Mô Hình với LoRA
-model = AutoModelForCausalLM.from_pretrained(
-    model_name,
-    device_map="auto",
-    torch_dtype=torch.float16,
-    load_in_8bit=False
-)
-lora_config = LoraConfig(
-    r=8,
-    lora_alpha=32,
-    target_modules=["q_proj", "k_proj", "v_proj", "out_proj"],
-    lora_dropout=0.1,
-    bias="none",
-)
-model = get_peft_model(model, lora_config)
-print(model)
-# Cấu Hình TrainingArguments
-training_args = TrainingArguments(
-    output_dir=CHECKPOINT_DIR,
-    per_device_train_batch_size=4,
-    per_device_eval_batch_size=4,
-    gradient_accumulation_steps=8,
-    num_train_epochs=3,
-    learning_rate=3e-4,
-    weight_decay=0.01,
-    logging_steps=50,  # Giảm số bước logging
-    evaluation_strategy="steps",  # Đánh giá sau mỗi vài bước
-    eval_steps=50,  # Đánh giá sau mỗi 100 bước
-    save_strategy="steps",  # Lưu checkpoint sau mỗi vài bước
-    save_steps=50,  # Lưu checkpoint sau mỗi 100 bước
-    save_total_limit=5,  # Giới hạn số lượng checkpoint lưu trữ
-    fp16=True,
-    report_to="none",
-    load_best_model_at_end=True,
-)
-# Data Collator
-data_collator = DataCollatorForLanguageModeling(
-    tokenizer=tokenizer,
-    mlm=False,  # Vì bạn đang thực hiện Causal LM
-    pad_to_multiple_of=8
-)
-# Tạo Trainer
-trainer = Trainer(
-    model=model,
-    args=training_args,
-    train_dataset=final_dataset['train'],
-    eval_dataset=final_dataset['validation'],
-    tokenizer=tokenizer,
-    data_collator=data_collator,
-)
 # Định Nghĩa Hàm Huấn Luyện với Decorator @spaces.GPU
-@spaces.GPU(duration=20, queue=False)
 def run_training():
     # Kiểm tra nếu có checkpoint
     checkpoints = [os.path.join(CHECKPOINT_DIR, d) for d in os.listdir(CHECKPOINT_DIR) if d.startswith('checkpoint')]
     if checkpoints:
@@ -149,26 +163,31 @@ def run_training():
     trainer.save_model(CHECKPOINT_DIR)
     return "Huấn luyện hoàn tất hoặc đã tiếp tục từ checkpoint."
-# Hàm Tự Động Hóa Việc Gọi Lặp Lại `run_training`
-@spaces.GPU(duration=20, queue=False)
-def continuous_training(max_epochs=3):
-    current_epoch = 0
-    while current_epoch < max_epochs:
         result = run_training()
         print(result)
-        # Giả định mỗi lần gọi huấn luyện tiến thêm 0.25 epoch (tùy thuộc vào tốc độ huấn luyện)
-        current_epoch += 0.25
-        print(f"Đã huấn luyện {current_epoch} / {max_epochs} epochs.")
-        # Kiểm tra nếu đã đạt số epoch mong muốn
-        if current_epoch >= max_epochs:
-            print("Đã hoàn thành quá trình huấn luyện.")
             break
         # Chờ một khoảng thời gian trước khi gọi lại (tùy thuộc vào yêu cầu của hệ thống)
-        time.sleep(1)  # Thời gian chờ có thể điều chỉnh
-# # Chạy quá trình huấn luyện liên tục
-# if __name__ == "__main__":
-#     continuous_training(max_epochs=3)

     AutoModelForCausalLM,
     TrainingArguments,
     Trainer,
+    DataCollatorForLanguageModeling,
+    TrainerCallback,
+    TrainerState,
+    TrainerControl
 )
 from peft import LoraConfig, get_peft_model
 import spaces
 if not os.path.exists(CHECKPOINT_DIR):
     os.makedirs(CHECKPOINT_DIR)
+# Tải Dataset (CPU)
 dataset = load_dataset('vntc/wiki-mini-corpus')
+# Chia Dataset thành train và validation (CPU)
 split_dataset = dataset['train'].train_test_split(test_size=0.1, seed=42)
 train_dataset = split_dataset['train']
 validation_dataset = split_dataset['test']
+# Tiền Xử Lý Văn Bản (CPU)
 def preprocess_function(examples):
     passages = [passage.lower().strip() for passage in examples['passage']]
     return {'passage': passages}
 processed_train = train_dataset.map(preprocess_function, batched=True, remove_columns=['id', 'metadata'])
 processed_validation = validation_dataset.map(preprocess_function, batched=True, remove_columns=['id', 'metadata'])
+# Tokenization (CPU)
 model_name = "meta-llama/Llama-3.2-3B-Instruct"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 if tokenizer.pad_token is None:
     tokenizer.pad_token = tokenizer.eos_token
 def tokenize_function(examples):
     return tokenizer(
         examples['passage'],
 tokenized_train = processed_train.map(tokenize_function, batched=True)
 tokenized_validation = processed_validation.map(tokenize_function, batched=True)
+# Thêm trường 'labels' (CPU)
 def add_labels(examples):
     examples['labels'] = examples['input_ids'].copy()
     return examples
 tokenized_train = tokenized_train.map(add_labels, batched=True)
 tokenized_validation = tokenized_validation.map(add_labels, batched=True)
+# Loại bỏ các cột không cần thiết (CPU)
 tokenized_train = tokenized_train.remove_columns(['passage'])
 tokenized_validation = tokenized_validation.remove_columns(['passage'])
+# Định dạng dữ liệu cho PyTorch (CPU)
 tokenized_train.set_format('torch')
 tokenized_validation.set_format('torch')
+# Tạo DatasetDict (CPU)
 final_dataset = {
     'train': tokenized_train,
     'validation': tokenized_validation
 }
+# Định Nghĩa TrainerCallback để Lưu Checkpoint Nhanh Hơn
+class SaveCheckpointCallback(TrainerCallback):
+    def on_step_end(self, args, state, control, **kwargs):
+        if state.global_step % args.save_steps == 0 and state.global_step != 0:
+            checkpoint_path = os.path.join(args.output_dir, f"checkpoint-{state.global_step}")
+            print(f"Lưu checkpoint tại: {checkpoint_path}")
+            trainer.save_model(checkpoint_path)
+        return TrainerControl.CONTINUE
 # Định Nghĩa Hàm Huấn Luyện với Decorator @spaces.GPU
+@spaces.GPU(duration=15, queue=False)
 def run_training():
+    """
+    Hàm huấn luyện mô hình sử dụng GPU với thời gian hạn chế.
+    """
+    # Tải và Cấu Hình Mô Hình với LoRA (GPU)
+    model = AutoModelForCausalLM.from_pretrained(
+        model_name,
+        device_map="auto",
+        torch_dtype=torch.float16,
+        load_in_8bit=False
+    )
+    lora_config = LoraConfig(
+        r=8,
+        lora_alpha=32,
+        target_modules=["q_proj", "k_proj", "v_proj", "out_proj"],
+        lora_dropout=0.1,
+        bias="none",
+    )
+    model = get_peft_model(model, lora_config)
+    print(model)
+    # Cấu Hình TrainingArguments (GPU)
+    training_args = TrainingArguments(
+        output_dir=CHECKPOINT_DIR,
+        per_device_train_batch_size=4,
+        per_device_eval_batch_size=4,
+        gradient_accumulation_steps=8,
+        num_train_epochs=3,
+        max_steps=50,  # Đặt max_steps tại đây
+        learning_rate=3e-4,
+        weight_decay=0.01,
+        logging_steps=10,  # Giảm số bước logging để theo dõi thường xuyên hơn
+        eval_strategy="steps",  # Đánh giá sau mỗi vài bước
+        eval_steps=50,  # Đánh giá sau mỗi 50 bước
+        save_strategy="steps",  # Lưu checkpoint sau mỗi vài bước
+        save_steps=50,  # Lưu checkpoint sau mỗi 50 bước
+        save_total_limit=5,  # Giới hạn số lượng checkpoint lưu trữ
+        fp16=True,
+        report_to="none",
+        load_best_model_at_end=True,
+    )
+    # Data Collator (GPU)
+    data_collator = DataCollatorForLanguageModeling(
+        tokenizer=tokenizer,
+        mlm=False,  # Vì bạn đang thực hiện Causal LM
+        pad_to_multiple_of=8
+    )
+    # Tạo Trainer (GPU)
+    trainer = Trainer(
+        model=model,
+        args=training_args,
+        train_dataset=final_dataset['train'],
+        eval_dataset=final_dataset['validation'],
+        tokenizer=tokenizer,
+        data_collator=data_collator,
+        callbacks=[SaveCheckpointCallback()],  # Thêm callback
+    )
     # Kiểm tra nếu có checkpoint
     checkpoints = [os.path.join(CHECKPOINT_DIR, d) for d in os.listdir(CHECKPOINT_DIR) if d.startswith('checkpoint')]
     if checkpoints:
     trainer.save_model(CHECKPOINT_DIR)
     return "Huấn luyện hoàn tất hoặc đã tiếp tục từ checkpoint."
+# Hàm Tự Động Hóa Việc Gọi Lặp Lại Hàm Huấn Luyện
+def continuous_training(total_steps=300, steps_per_call=50):
+    """
+    Hàm tự động gọi lại `run_training` để hoàn thành quá trình huấn luyện.
+    Args:
+        total_steps (int): Tổng số bước huấn luyện mong muốn.
+        steps_per_call (int): Số bước huấn luyện mỗi lần gọi hàm.
+    """
+    steps_done = 0
+    while steps_done < total_steps:
+        print(f"Bắt đầu huấn luyện cho {steps_per_call} bước.")
         result = run_training()
         print(result)
+        steps_done += steps_per_call
+        print(f"Đã huấn luyện {steps_done} / {total_steps} bước.")
+        # Kiểm tra nếu đã đạt số bước mong muốn
+        if steps_done >= total_steps:
+            print("Đã hoàn thành toàn bộ quá trình huấn luyện.")
             break
         # Chờ một khoảng thời gian trước khi gọi lại (tùy thuộc vào yêu cầu của hệ thống)
+        time.sleep(2)  # Thời gian chờ có thể điều chỉnh
+# Gọi hàm huấn luyện liên tục
+if __name__ == "__main__":
+    continuous_training(total_steps=300, steps_per_call=50)

requirements.txt CHANGED Viewed

@@ -17,4 +17,5 @@ sentencepiece
 soxr
 pydub
 opencv-python
-av

 soxr
 pydub
 opencv-python
+av
+peft