Spaces:

JMonga
/

KongoBrain

Runtime error

App Files Files Community

JMonga commited on 26 days ago

Commit

3c7cb3b

verified ·

1 Parent(s): 63b252b

Update train.py

Browse files

Files changed (1) hide show

train.py +70 -40

train.py CHANGED Viewed

@@ -1,43 +1,73 @@
-from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
-from datasets import load_dataset
-import torch
-# 📂 Charger les données d'entraînement
-dataset = load_dataset("json", data_files="training_data.jsonl", split="train")
-# 🔥 Charger le modèle GPT-2
-MODEL_NAME = "gpt2"  # Change avec ton propre modèle si besoin
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
-# 🔄 Tokenisation des données
-def tokenize_function(examples):
-    return tokenizer(examples["text"], truncation=True, padding="max_length", max_length=512)
-dataset = dataset.map(tokenize_function, batched=True)
-# 🎯 Définition des paramètres d'entraînement
-training_args = TrainingArguments(
-    output_dir="./trained_model",
-    per_device_train_batch_size=2,
-    per_device_eval_batch_size=2,
-    num_train_epochs=3,
-    save_steps=1000,
-    save_total_limit=2,
-    logging_dir="./logs",
-    push_to_hub=True,
-    hub_model_id="TON_NOM_UTILISATEUR/mon_chatbot_gpt2"
-)
-trainer = Trainer(
-    model=model,
-    args=training_args,
-    train_dataset=dataset
-)
-# 🚀 Lancer l'entraînement
-trainer.train()
-# 💾 Sauvegarder et envoyer le modèle sur Hugging Face
-trainer.push_to_hub()
-tokenizer.push_to_hub("TON_NOM_UTILISATEUR/mon_chatbot_gpt2")

+import gradio as gr
+import json
+import os
+from huggingface_hub import InferenceClient
+# Initialisation du client Hugging Face
+client = InferenceClient("HuggingFaceH4/zephyr-7b-beta")
+# Fichier de stockage des questions-réponses personnalisées
+DATA_FILE = "qna_data.json"
+CREATOR_CODE = "LnMonga2025"  # Code secret du créateur
+# Fonction pour charger les données enregistrées
+def load_json():
+    if not os.path.exists(DATA_FILE) or os.stat(DATA_FILE).st_size == 0:
+        return {}
+    try:
+        with open(DATA_FILE, "r", encoding="utf-8") as f:
+            return json.load(f)
+    except json.JSONDecodeError:
+        return {}
+# Fonction pour sauvegarder une nouvelle question-réponse
+def save_json(data):
+    with open(DATA_FILE, "w", encoding="utf-8") as f:
+        json.dump(data, f, indent=4, ensure_ascii=False)
+# Fonction principale de réponse
+def respond(message, history, system_message, max_tokens, temperature, top_p):
+    data = load_json()
+    # Vérification si l'utilisateur est le créateur en utilisant le code spécial
+    if message.startswith(f"{CREATOR_CODE}:input:"):
+        question = message.replace(f"{CREATOR_CODE}:input:", "").strip()
+        response = f"{CREATOR_CODE}:output:"
+        # Demande manuelle de réponse
+        response = input(f"Entrez la réponse pour '{question}': ").strip()
+        if response:
+            data[question] = response
+            save_json(data)
+            return f"✅ Réponse enregistrée : {response}"
+    # Vérifier si la question est déjà enregistrée
+    if message in data:
+        return data[message]
+    # Si non enregistré, utiliser GPT pour répondre normalement
+    messages = [{"role": "system", "content": system_message}] + [
+        {"role": "user", "content": q} if i % 2 == 0 else {"role": "assistant", "content": a}
+        for i, (q, a) in enumerate(history)
+    ] + [{"role": "user", "content": message}]
+    response = ""
+    for msg in client.chat_completion(messages, max_tokens=max_tokens, stream=True, temperature=temperature, top_p=top_p):
+        token = msg.choices[0].delta.content
+        response += token
+        yield response
+# Interface Gradio
+demo = gr.ChatInterface(
+    respond,
+    additional_inputs=[
+        gr.Textbox(value="You are a friendly Chatbot.", label="System message"),
+        gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
+        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
+        gr.Slider(minimum=0.1, maximum=1.0, value=0.95, step=0.05, label="Top-p (nucleus sampling)"),
+    ],
+)
+if __name__ == "__main__":
+    demo.launch()