Spaces:

Ashegh-Sad-Warrior
/

yolo_aerial_detection_persian

Running

App Files Files Community

Ashegh-Sad-Warrior commited on Oct 28, 2024

Commit

c2ce217

verified ·

1 Parent(s): 11150d6

Update app.py

Browse files

Files changed (1) hide show

app.py +146 -1

app.py CHANGED Viewed

@@ -125,7 +125,134 @@ image_interface = gr.Interface(
     outputs=[gr.Image(type="pil"), gr.Dataframe(label="تعداد اشیاء")],
     title="تشخیص اشیاء در تصاویر هوایی",
     description="یک تصویر هوایی بارگذاری کنید تا اشیاء شناسایی شده و تعداد آن‌ها را ببینید.",
-    examples=['/content/example/images/areial_car.jpg', '/content/example/images/arieal_car_1.jpg']  # مسیر نمونه‌های خود را وارد کنید
 )
 # رابط کاربری ویدئو
@@ -142,5 +269,23 @@ video_interface = gr.Interface(
 app = gr.TabbedInterface([image_interface, video_interface], ["تشخیص تصویر", "تشخیص ویدئو"])
 app.launch(debug=True, share=True)
 # * Running on local URL:  http://127.0.0.1:7860
 # * Running on public URL: https://c0bd255e573eb86c80.gradio.live

     outputs=[gr.Image(type="pil"), gr.Dataframe(label="تعداد اشیاء")],
     title="تشخیص اشیاء در تصاویر هوایی",
     description="یک تصویر هوایی بارگذاری کنید تا اشیاء شناسایی شده و تعداد آن‌ها را ببینید.",
+    examples=['# !pip install ultralytics
+# !pip install gradio
+import cv2
+from ultralytics import YOLO
+from PIL import Image, ImageDraw
+import gradio as gr
+import pandas as pd
+# بارگذاری مدل آموزش‌دیده شما
+model = YOLO('/content/yolo11n-obb.pt')
+# تعریف نام کلاس‌ها به انگلیسی و فارسی
+class_names = {
+    0: ('plane', 'هواپیما'),
+    1: ('ship', 'کشتی'),
+    2: ('storage tank', 'مخزن ذخیره'),
+    3: ('baseball diamond', 'زمین بیسبال'),
+    4: ('tennis court', 'زمین تنیس'),
+    5: ('basketball court', 'زمین بسکتبال'),
+    6: ('ground track field', 'زمین دو و میدانی'),
+    7: ('harbor', 'بندرگاه'),
+    8: ('bridge', 'پل'),
+    9: ('large vehicle', 'خودرو بزرگ'),
+    10: ('small vehicle', 'خودرو کوچک'),
+    11: ('helicopter', 'هلیکوپتر'),
+    12: ('roundabout', 'میدان'),
+    13: ('soccer ball field', 'زمین فوتبال'),
+    14: ('swimming pool', 'استخر شنا')
+}
+# تابع برای تشخیص اشیاء در تصاویر
+def detect_and_draw_image(input_image):
+    results = model(input_image)
+    # بررسی کردن اینکه آیا اشیاء شناسایی شده اند یا خیر
+    if not results or results[0].boxes is None or not results[0].boxes.boxes:
+        # اگر هیچ شیء شناسایی نشده باشد
+        df = pd.DataFrame({
+            'Label (English)': [],
+            'Label (Persian)': [],
+            'Object Count': []
+        })
+        return input_image, df
+    detections = results[0].boxes.boxes  # دسترسی به نتایج در YOLOv8
+    draw = ImageDraw.Draw(input_image)
+    counts = {}
+    for detection in detections:
+        xmin, ymin, xmax, ymax, conf, class_id = detection.cpu().numpy()
+        label_en, label_fa = class_names.get(int(class_id), ('unknown', 'ناشناخته'))
+        counts[label_en] = counts.get(label_en, 0) + 1
+        draw.rectangle([(xmin, ymin), (xmax, ymax)], outline="red", width=2)
+        draw.text((xmin, ymin), f"{label_en}: {conf:.2f}", fill="white")
+    df = pd.DataFrame({
+        'Label (English)': list(counts.keys()),
+        'Label (Persian)': [class_names.get(k, ('unknown', 'ناشناخته'))[1] for k in counts.keys()],
+        'Object Count': list(counts.values())
+    })
+    return input_image, df
+# تابع برای تشخیص اشیاء در ویدئوها
+def detect_and_draw_video(video_path):
+    cap = cv2.VideoCapture(video_path)
+    frames = []
+    overall_counts = {}
+    seen_objects = []  # لیست برای دنبال کردن اشیاء شناسایی شده
+    while cap.isOpened():
+        ret, frame = cap.read()
+        if not ret:
+            break
+        frame = cv2.resize(frame, (640, 480))
+        results = model(frame)
+        detections = results[0].boxes.boxes
+        if detections is not None:
+            detections = detections.cpu().numpy()
+            for detection in detections:
+                xmin, ymin, xmax, ymax, conf, class_id = detection
+                label_en, label_fa = class_names.get(int(class_id), ('unknown', 'ناشناخته'))
+                current_object = (label_en, int(xmin), int(ymin), int(xmax), int(ymax))
+                # بررسی وجود شیء در لیست seen_objects
+                if not any(existing[0] == label_en and
+                           (existing[1] < xmax and existing[3] > xmin and
+                            existing[2] < ymax and existing[4] > ymin) for existing in seen_objects):
+                    seen_objects.append(current_object)
+                    overall_counts[label_en] = overall_counts.get(label_en, 0) + 1
+                    # رسم مستطیل و نام شیء بر روی فریم
+                    cv2.rectangle(frame, (int(xmin), int(ymin)), (int(xmax), int(ymax)), (255, 0, 0), 2)
+                    cv2.putText(frame, f"{label_en}: {conf:.2f}", (int(xmin), int(ymin) - 10),
+                                cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2)
+        frames.append(frame)
+    cap.release()
+    output_path = 'output.mp4'
+    out = cv2.VideoWriter(output_path, cv2.VideoWriter_fourcc(*'mp4v'), 20.0, (640, 480))
+    for frame in frames:
+        out.write(frame)
+    out.release()
+    # ایجاد DataFrame برای ذخیره نتایج
+    df = pd.DataFrame({
+        'Label (English)': list(overall_counts.keys()),
+        'Label (Persian)': [class_names.get(k, ('unknown', 'ناشناخته'))[1] for k in overall_counts.keys()],
+        'Object Count': list(overall_counts.values())
+    })
+    return output_path, df
+# رابط کاربری تصویر
+image_interface = gr.Interface(
+    fn=detect_and_draw_image,
+    inputs=gr.Image(type="pil", label="بارگذاری تصویر"),
+    outputs=[gr.Image(type="pil"), gr.Dataframe(label="تعداد اشیاء")],
+    title="تشخیص اشیاء در تصاویر هوایی",
+    description="یک تصویر هوایی بارگذاری کنید تا اشیاء شناسایی شده و تعداد آن‌ها را ببینید.",
+    examples=['Examples/images/areial_car.jpg', '/Examples/images/arieal_car_1.jpg','Examples/images/t.jpg']  # مسیر نمونه‌های خود را وارد کنید
 )
 # رابط کاربری ویدئو
 app = gr.TabbedInterface([image_interface, video_interface], ["تشخیص تصویر", "تشخیص ویدئو"])
 app.launch(debug=True, share=True)
+# * Running on local URL:  http://127.0.0.1:7860
+# * Running on public URL: https://c0bd255e573eb86c80.gradio.live/areial_car.jpg', '/content/example/images/arieal_car_1.jpg']  # مسیر نمونه‌های خود را وارد کنید
+)
+# رابط کاربری ویدئو
+video_interface = gr.Interface(
+    fn=detect_and_draw_video,
+    inputs=gr.Video(label="بارگذاری ویدئو"),
+    outputs=[gr.Video(label="ویدئوی پردازش شده"), gr.Dataframe(label="تعداد اشیاء")],
+    title="تشخیص اشیاء در ویدئوها",
+    description="یک ویدئو بارگذاری کنید تا اشیاء شناسایی شده و تعداد آن‌ها را ببینید.",
+    examples=['Examples/video/city.mp4', 'Examples/video/airplane.mp4']  # مسیر نمونه‌های خود را وارد کنید
+)
+# اجرای برنامه با استفاده از رابط کاربری تب‌دار
+app = gr.TabbedInterface([image_interface, video_interface], ["تشخیص تصویر", "تشخیص ویدئو"])
+app.launch(debug=True, share=True)
 # * Running on local URL:  http://127.0.0.1:7860
 # * Running on public URL: https://c0bd255e573eb86c80.gradio.live