Spaces:

rafaldembski
/

ScamDetector

Sleeping

App Files Files Community

rafaldembski commited on Sep 30, 2024

Commit

7360f5c

verified ·

1 Parent(s): 82d13f9

Update pages/Statistics.py

Browse files

Files changed (1) hide show

pages/Statistics.py +86 -39

pages/Statistics.py CHANGED Viewed

@@ -4,16 +4,15 @@ import streamlit as st
 import pandas as pd
 import plotly.express as px
 import plotly.graph_objects as go
 import re
 from datetime import datetime
-from utils.functions import (
-    get_stats,
-    get_history,
-    get_phone_info
-)
-import pycountry
 # Definiowanie tłumaczeń dla zakładki "Statystyki"
 page_translations = {
@@ -27,12 +26,11 @@ page_translations = {
         'fraud_percentage': "Procent oszustw",
         'history_title': "Historia analizowanych wiadomości",
         'frauds_over_time': "Liczba wykrytych oszustw w czasie",
-        'risk_distribution': "Rozkład ocen ryzyka oszustwa",
-        'fraud_country_distribution': "Rozkład oszustw według krajów",
-        'fraud_trend_title': "Trendy oszustw w czasie",
         'risk_distribution_title': "Rozkład ocen ryzyka oszustwa",
         'fraud_country_distribution_title': "Rozkład oszustw według krajów",
-        'heatmap_title': "Mapa ciepła oszustw w czasie",
         'fraud_vs_nonfraud': "Procentowy podział: Oszustwa vs Bezpieczne",
         'no_data': "Brak dostępnych danych do wyświetlenia.",
         'download_button': "📥 Pobierz dane jako CSV"
@@ -47,12 +45,11 @@ page_translations = {
         'fraud_percentage': "Betrugsprozentsatz",
         'history_title': "Analyseverlauf der Nachrichten",
         'frauds_over_time': "Anzahl der erkannten Betrügereien im Laufe der Zeit",
-        'risk_distribution': "Verteilung der Betrugsrisikobewertungen",
-        'fraud_country_distribution': "Betrug nach Ländern",
-        'fraud_trend_title': "Betrugstrends im Laufe der Zeit",
         'risk_distribution_title': "Verteilung der Betrugsrisikobewertungen",
         'fraud_country_distribution_title': "Betrug nach Ländern",
-        'heatmap_title': "Heatmap der Betrügereien im Laufe der Zeit",
         'fraud_vs_nonfraud': "Prozentanteil: Betrug vs Sichere Nachrichten",
         'no_data': "Keine Daten zur Anzeige verfügbar.",
         'download_button': "📥 Daten als CSV herunterladen"
@@ -67,28 +64,66 @@ page_translations = {
         'fraud_percentage': "Fraud Percentage",
         'history_title': "History of Analyzed Messages",
         'frauds_over_time': "Number of Detected Frauds Over Time",
-        'risk_distribution': "Distribution of Fraud Risk Scores",
-        'fraud_country_distribution': "Fraud Distribution by Countries",
-        'fraud_trend_title': "Fraud Trends Over Time",
         'risk_distribution_title': "Distribution of Fraud Risk Scores",
         'fraud_country_distribution_title': "Fraud Distribution by Countries",
-        'heatmap_title': "Fraud Heatmap Over Time",
         'fraud_vs_nonfraud': "Fraud vs Safe Messages Percentage",
         'no_data': "No data available to display.",
         'download_button': "📥 Download data as CSV"
     }
 }
 def main(language):
     translations = page_translations[language]
-    # Pobieranie danych z bazy danych
-    stats = get_stats()
-    history = get_history()
     # Kluczowe metryki
-    total_analyses = stats["total_analyses"]
-    total_frauds_detected = stats["total_frauds_detected"]
     # Wyświetlenie metryk
     st.title(translations['header'])
@@ -107,11 +142,15 @@ def main(language):
     col3.metric(label=translations['fraud_percentage'], value=f"{fraud_percentage:.2f}%")
     # Wizualizacja procentowego podziału oszustw
-    fraud_data = [total_frauds_detected, total_analyses - total_frauds_detected]
-    fraud_labels = ['Fraud', 'Non-Fraud']
-    fig_fraud_pie = go.Figure(data=[go.Pie(labels=fraud_labels, values=fraud_data, hole=.3, marker_colors=['#FF6347', '#4682B4'])])
-    fig_fraud_pie.update_layout(title_text=translations['fraud_vs_nonfraud'])
-    st.plotly_chart(fig_fraud_pie, use_container_width=True)
     # Wyświetlenie historii analiz w tabeli
     if history:
@@ -130,8 +169,6 @@ def main(language):
         # Dodanie kolumny 'date' dla wizualizacji
         df_history['date'] = df_history['timestamp'].dt.date
-        # Usunięcie sekcji wyszukiwania i filtrowania po dacie
         # Wyświetlenie tabeli historii
         st.dataframe(df_history[['timestamp', 'phone_number', 'risk_assessment']], height=300)
@@ -148,8 +185,8 @@ def main(language):
         # Trend oszustw w czasie
         st.markdown(f"### {translations['fraud_trend_title']}")
         fraud_over_time = df_history.groupby(df_history['timestamp'].dt.date)['phone_number'].count().reset_index()
-        fraud_over_time.rename(columns={'phone_number': 'frauds_detected'}, inplace=True)
-        fig_trend = px.line(fraud_over_time, x='timestamp', y='frauds_detected', title=translations['frauds_over_time'])
         st.plotly_chart(fig_trend, use_container_width=True)
         # Rozkład ocen ryzyka
@@ -161,16 +198,23 @@ def main(language):
         df_history['risk_score'] = df_history['risk_assessment'].apply(extract_risk_score)
         risk_distribution = df_history['risk_score'].value_counts().sort_index().reset_index()
         risk_distribution.columns = ['risk_score', 'count']
-        fig_risk = px.bar(risk_distribution, x='risk_score', y='count', title=translations['risk_distribution'], labels={'risk_score': 'Risk Score', 'count': 'Number of Messages'}, color='risk_score', color_continuous_scale=px.colors.sequential.RdBu)
         st.plotly_chart(fig_risk, use_container_width=True)
         # Rozkład oszustw według krajów
         st.markdown(f"### {translations['fraud_country_distribution_title']}")
-        def add_country_info(row):
-            country, _ = get_phone_info(row['phone_number'])
-            return country
-        df_history['country'] = df_history.apply(add_country_info, axis=1)
         fraud_countries = df_history['country'].value_counts().reset_index()
         fraud_countries.columns = ['country', 'counts']
@@ -197,3 +241,6 @@ def main(language):
             st.plotly_chart(fig_map, use_container_width=True)
         else:
             st.info(translations['no_data'])

 import pandas as pd
 import plotly.express as px
 import plotly.graph_objects as go
+import json
+import os
 import re
 from datetime import datetime
+# Definiowanie ścieżek do plików JSON
+FAKE_NUMBERS_FILE = 'data/fake_numbers.json'
+HISTORY_FILE = 'data/history.json'
+STATS_FILE = 'data/stats.json'
 # Definiowanie tłumaczeń dla zakładki "Statystyki"
 page_translations = {
         'fraud_percentage': "Procent oszustw",
         'history_title': "Historia analizowanych wiadomości",
         'frauds_over_time': "Liczba wykrytych oszustw w czasie",
         'risk_distribution_title': "Rozkład ocen ryzyka oszustwa",
         'fraud_country_distribution_title': "Rozkład oszustw według krajów",
+        'fraud_trend_title': "Trendy oszustw w czasie",
+        'risk_distribution': "Rozkład ocen ryzyka oszustwa",
+        'fraud_country_distribution': "Rozkład oszustw według krajów",
         'fraud_vs_nonfraud': "Procentowy podział: Oszustwa vs Bezpieczne",
         'no_data': "Brak dostępnych danych do wyświetlenia.",
         'download_button': "📥 Pobierz dane jako CSV"
         'fraud_percentage': "Betrugsprozentsatz",
         'history_title': "Analyseverlauf der Nachrichten",
         'frauds_over_time': "Anzahl der erkannten Betrügereien im Laufe der Zeit",
         'risk_distribution_title': "Verteilung der Betrugsrisikobewertungen",
         'fraud_country_distribution_title': "Betrug nach Ländern",
+        'fraud_trend_title': "Betrugstrends im Laufe der Zeit",
+        'risk_distribution': "Verteilung der Betrugsrisikobewertungen",
+        'fraud_country_distribution': "Betrug nach Ländern",
         'fraud_vs_nonfraud': "Prozentanteil: Betrug vs Sichere Nachrichten",
         'no_data': "Keine Daten zur Anzeige verfügbar.",
         'download_button': "📥 Daten als CSV herunterladen"
         'fraud_percentage': "Fraud Percentage",
         'history_title': "History of Analyzed Messages",
         'frauds_over_time': "Number of Detected Frauds Over Time",
         'risk_distribution_title': "Distribution of Fraud Risk Scores",
         'fraud_country_distribution_title': "Fraud Distribution by Countries",
+        'fraud_trend_title': "Fraud Trends Over Time",
+        'risk_distribution': "Distribution of Fraud Risk Scores",
+        'fraud_country_distribution': "Fraud Distribution by Countries",
         'fraud_vs_nonfraud': "Fraud vs Safe Messages Percentage",
         'no_data': "No data available to display.",
         'download_button': "📥 Download data as CSV"
     }
 }
+def load_json(file_path):
+    """Funkcja do ładowania danych z pliku JSON."""
+    if not os.path.exists(file_path):
+        return []
+    with open(file_path, 'r', encoding='utf-8') as file:
+        try:
+            data = json.load(file)
+            return data
+        except json.JSONDecodeError:
+            st.error(f"Nie można załadować danych z {file_path}. Plik jest uszkodzony.")
+            return []
+def save_json(file_path, data):
+    """Funkcja do zapisywania danych do pliku JSON."""
+    with open(file_path, 'w', encoding='utf-8') as file:
+        json.dump(data, file, ensure_ascii=False, indent=4)
+def get_stats_from_json():
+    """Funkcja do pobierania statystyk z pliku stats.json."""
+    if not os.path.exists(STATS_FILE):
+        # Inicjalizacja statystyk, jeśli plik nie istnieje
+        stats = {
+            "total_analyses": 0,
+            "total_frauds_detected": 0
+        }
+        save_json(STATS_FILE, stats)
+    else:
+        with open(STATS_FILE, 'r', encoding='utf-8') as file:
+            stats = json.load(file)
+    return stats
+def get_history_from_json():
+    """Funkcja do pobierania historii analiz z pliku history.json."""
+    return load_json(HISTORY_FILE)
+def get_fake_numbers_from_json():
+    """Funkcja do pobierania fałszywych numerów z pliku fake_numbers.json."""
+    return load_json(FAKE_NUMBERS_FILE)
 def main(language):
     translations = page_translations[language]
+    # Pobieranie danych z plików JSON
+    stats = get_stats_from_json()
+    history = get_history_from_json()
     # Kluczowe metryki
+    total_analyses = stats.get("total_analyses", 0)
+    total_frauds_detected = stats.get("total_frauds_detected", 0)
     # Wyświetlenie metryk
     st.title(translations['header'])
     col3.metric(label=translations['fraud_percentage'], value=f"{fraud_percentage:.2f}%")
     # Wizualizacja procentowego podziału oszustw
+    if total_analyses > 0:
+        fraud_data = [total_frauds_detected, total_analyses - total_frauds_detected]
+        fraud_labels = ['Fraud', 'Non-Fraud']
+        fig_fraud_pie = go.Figure(data=[go.Pie(labels=fraud_labels, values=fraud_data, hole=.3,
+                                               marker_colors=['#FF6347', '#4682B4'])])
+        fig_fraud_pie.update_layout(title_text=translations['fraud_vs_nonfraud'])
+        st.plotly_chart(fig_fraud_pie, use_container_width=True)
+    else:
+        st.info(translations['no_data'])
     # Wyświetlenie historii analiz w tabeli
     if history:
         # Dodanie kolumny 'date' dla wizualizacji
         df_history['date'] = df_history['timestamp'].dt.date
         # Wyświetlenie tabeli historii
         st.dataframe(df_history[['timestamp', 'phone_number', 'risk_assessment']], height=300)
         # Trend oszustw w czasie
         st.markdown(f"### {translations['fraud_trend_title']}")
         fraud_over_time = df_history.groupby(df_history['timestamp'].dt.date)['phone_number'].count().reset_index()
+        fraud_over_time.rename(columns={'timestamp': 'date', 'phone_number': 'frauds_detected'}, inplace=True)
+        fig_trend = px.line(fraud_over_time, x='date', y='frauds_detected', title=translations['frauds_over_time'])
         st.plotly_chart(fig_trend, use_container_width=True)
         # Rozkład ocen ryzyka
         df_history['risk_score'] = df_history['risk_assessment'].apply(extract_risk_score)
         risk_distribution = df_history['risk_score'].value_counts().sort_index().reset_index()
         risk_distribution.columns = ['risk_score', 'count']
+        fig_risk = px.bar(risk_distribution, x='risk_score', y='count', title=translations['risk_distribution'],
+                          labels={'risk_score': 'Risk Score', 'count': 'Number of Messages'},
+                          color='risk_score', color_continuous_scale=px.colors.sequential.RdBu)
         st.plotly_chart(fig_risk, use_container_width=True)
         # Rozkład oszustw według krajów
         st.markdown(f"### {translations['fraud_country_distribution_title']}")
+        def get_phone_info(phone_number):
+            """Zwraca informacje o kraju na podstawie numeru telefonu."""
+            if phone_number.startswith('+48'):
+                return 'Poland', None
+            elif phone_number.startswith('+49'):
+                return 'Germany', None
+            else:
+                return 'Unknown', None
+        df_history['country'] = df_history['phone_number'].apply(lambda x: get_phone_info(x)[0])
         fraud_countries = df_history['country'].value_counts().reset_index()
         fraud_countries.columns = ['country', 'counts']
             st.plotly_chart(fig_map, use_container_width=True)
         else:
             st.info(translations['no_data'])
+    else:
+        st.info(translations['no_data'])