2- Creazione di una baseline con EnergyLab

Esistono due modi per creare le baseline con EnergyLab:

  1. La baseline automatica
  2. La baseline personalizzata.

1. Creare una baseline automatica

È il modo più rapido ed efficace per modellare una situazione di riferimento, basata su dati di consumo e parametri influenti.
Richiede semplicemente :

  • La scelta di un periodo di riferimento,
  • La variabile target,
  • I potenziali parametri influenti.
  • La frequenza del modello (oraria, giornaliera, ecc.).

Nell'area Sorgenti dati, cliccare su “Aggiungi” e poi su “Modello semplificato”.
Il video sottostante illustra le varie fasi:

È quindi possibile trovare la baseline automatica in Sorgenti dati e utilizzarla in un widget come qualsiasi altra serie.
Esempio con il modello creato nel video precedente:

Capture d’écran 2024-05-21 à 17.04.17


2. Creazione di una baseline personalizzata

La baseline personalizzata è il modo più preciso e adattabile per definire e modellare una situazione di riferimento. Permette di esplorare i dati per definire al meglio il periodo di riferimento e i fattori che lo influenzano.

Creare un modello

Accedere all'area di lavoro di EnergyLab e fare clic su "Crea un modello + ” nella parte superiore dello schermo:

 Capture d’écran 2024-09-11 à 14.20.58
Dare un nome al flusso di lavoro, compilare le informazioni richieste e fare clic su Applica:

  • Titolo (deve essere unico).
  • Progetto da collegare (fare clic su “+” per aggiungere progetti)
  • Tag (fare clic su “+” per aggiungere tag)
  • Tipo di modello : per il momento è disponibile solo il tipo “Vuoto”.

EL-model

Si noti che è possibile creare tutti i modello che si desidera, ma è possibile distribuirne solo 100 sulla piattaforma. Se avete bisogno di distribuire più modello, contattate il vostro tecnico operativo METRON.

La creazione del modello prevede 5 fasi:

  • A) Acquisizione dati
  • B) Crea Funzioni
  • C) Pulizia dei dati
  • D) Modellazione
  • E) Sviluppo

In ognuna delle 5 fasi è possibile visualizzare i dati utilizzati.

image-png-Jul-24-2024-03-12-41-6399-PM

A) Recupero dei dati

In questa fase si recuperano i dati rilevanti per l'analisi dalle Sorgenti dati della piattaforma METRON.


Istruzioni:

  • Selezionare la data e l'ora di inizio e fine dei dati che si desidera recuperare.
  • Selezionare la frequenza di raccolta dei punti (detta anche granularità).
  • Selezionare le diverse serie da cui si desidera estrarre i dati.
  • Per ogni variabile: selezionare l'aggregazione e l'interpolazione.
EL6

 

A seconda del numero di variabili, della granularità e dell'intervallo di tempo che si desidera estrarre, questa operazione può richiedere del tempo.

B) Pulizia dei dati

In questo blocco è possibile ripulire i dati eliminando gli outlier (cioè i punti che rappresentano misurazioni errate o eventi isolati come manutenzione o incidenti).
A tal fine, è possibile creare regole per implementare vincoli fisici (ad esempio, energia >0). È anche possibile selezionare graficamente da una nuvola di punti quelli che si desidera mantenere o rimuovere.

Istruzioni:
Scegliere un metodo di pulizia dei dati:

EL7

  • Con regole :
    • Selezionare una variabile, un operatore e un secondo operando (valore o variabile).
  • Da una nuvola di punti: Utilizzare la selezione grafica:
    • Selezionare le diverse variabili per gli assi X/Y.
    • Se necessario, aggiungere altre variabili per colore, forma e dimensione.
    • Selezionare i punti che si desidera mantenere o eliminare utilizzando lo strumento di selezione.
    • Per selezionare più aree del grafico, tenere premuto il tasto MAIUSC e fare clic sulle diverse aree che si desidera mantenere o eliminare.
    • È possibile scegliere se mantenere o eliminare i punti selezionati nell'angolo in basso a destra.
EL8
  • Pulizia automatica:
    • Lasciate che il nostro algoritmo pulisca i dati per voi.

Si noti che i punti eliminati in questo blocco saranno cancellati solo nell'area EnergyLab, ma i dati saranno ancora visibili nell'area di visualizzazione dei dati. Questa fase serve a costruire il modello, in modo che apprenda solo la situazione di riferimento definita.

C) Costruzione dei dati

In questo blocco è possibile arricchire il set di dati selezionato nella prima fase, combinando le variabili esistenti per crearne di nuove.

Istruzioni:

A sinistra, è possibile importare e denominare le variabili che si desidera utilizzare nel calcolo.
A destra, è possibile assegnare un nome al risultato di ciascun calcolo.
Utilizzare il pannello dei calcoli per definire la formula della nuova variabile (vedere sotto), compresi:

  • Gli operatori aritmetici +, -, *, /, ** (potenza), % (modulo), // (divisione per piani).
  • Gli operatori di confronto <, >, <=, >=,!=, ==.
  • Gli operatori booleani | (o), & (e) e ~ (non).
  • Funzioni matematiche sin, cos, exp, log, expm1 (exp meno uno), log1p (log(1+x)), sqrt, sinh, cosh, tanh, arcsin, arccos, arctan, arccosh, arcsinh, arctanh, abs e arctan2

Esempio: se si vuole creare l'esponenziale dell'energia + il log della produzione, si usa “exp(energia) + log(produzione)”.
Un booleano per un consumo superiore a 10 e una produzione inferiore a 2000 sarebbe “consumo > 10 e produzione < 2000”.

EL9

Per garantire la correttezza dei calcoli, prestate molta attenzione alle unità di misura delle variabili!

D) Modellazione

In questo blocco è possibile selezionare il modello o i modelli che si desidera addestrare.

Istruzioni :

  • Scelta del modello (o dei modelli): è possibile scegliere 1, 2 o tutti e 3 i modelli per confrontarli e definire quale sarà il più adatto, e visualizzare in anteprima i risultati.
    • Regressione lineare: questo modello è selezionato per impostazione predefinita.
    • Foresta casuale: per modellare fenomeni non lineari.
    • kNN: per il confronto diretto con punti simili.
  • Selezionare la variabile target da prevedere:
    • Ad esempio, il consumo di elettricità di un uso significativo dell'energia.
  • Selezionare le variabili caratteristiche che si desidera utilizzare per la previsione.
    • Es: i fattori di influenza identificati per questo uso significativo dell'energia.
  • Selezionare il metodo per separare i dati di addestramento da quelli di test:
    • Rapporto: il primo X% dei dati sarà utilizzato per l'addestramento, il resto per il test.
    • Data/ora: i dati precedenti alla data/ora saranno utilizzati per l'addestramento e quelli successivi per il test.
    • Es: si potrebbe usare il 2023 come periodo di addestramento e il 2024 per i test.
  • Avviate il calcolo dei modelli e potrete poi confrontare le loro prestazioni.

Per saperne di più, leggete l'articolo Interpretare i risultati di un modello (in arrivo).

E) Sviluppo

In questo blocco, si salverà il modello e lo si pubblicherà sulla piattaforma. Lo si può trovare in Sorgenti di dati. Una volta pubblicato il modello, le previsioni saranno calcolate in tempo reale finché i dati di input saranno disponibili.

Istruzioni:

  • Scegliere un modello tra quelli addestrati nel blocco precedente.
  • Inserire un nome per il modello.
  • Selezionare una data a partire dalla quale calcolare lo storico.

Nota: la distribuzione include le previsioni su tutti i dati, compresi gli outlier che sono stati filtrati durante l'addestramento.