Esistono due modi per creare le baseline con EnergyLab:
- La baseline automatica
- La baseline personalizzata.
1. Creare una baseline automatica
È il modo più rapido ed efficace per modellare una situazione di riferimento, basata su dati di consumo e parametri influenti.
Richiede semplicemente :
- La scelta di un periodo di riferimento,
- La variabile target,
- I potenziali parametri influenti.
- La frequenza del modello (oraria, giornaliera, ecc.).
Nell'area Sorgenti dati, cliccare su “Aggiungi” e poi su “Modello semplificato”.
Il video sottostante illustra le varie fasi:
È quindi possibile trovare la baseline automatica in Sorgenti dati e utilizzarla in un widget come qualsiasi altra serie.
Esempio con il modello creato nel video precedente:
2. Creazione di una baseline personalizzata
La baseline personalizzata è il modo più preciso e adattabile per definire e modellare una situazione di riferimento. Permette di esplorare i dati per definire al meglio il periodo di riferimento e i fattori che lo influenzano.
Creare un modello
Accedere all'area di lavoro di EnergyLab e fare clic su "Crea un modello + ” nella parte superiore dello schermo:
Dare un nome al flusso di lavoro, compilare le informazioni richieste e fare clic su Applica:
- Titolo (deve essere unico).
- Progetto da collegare (fare clic su “+” per aggiungere progetti)
- Tag (fare clic su “+” per aggiungere tag)
- Tipo di modello : per il momento è disponibile solo il tipo “Vuoto”.
Si noti che è possibile creare tutti i modello che si desidera, ma è possibile distribuirne solo 100 sulla piattaforma. Se avete bisogno di distribuire più modello, contattate il vostro tecnico operativo METRON.
La creazione del modello prevede 5 fasi:
- A) Acquisizione dati
- B) Crea Funzioni
- C) Pulizia dei dati
- D) Modellazione
- E) Sviluppo
In ognuna delle 5 fasi è possibile visualizzare i dati utilizzati.
A) Recupero dei dati
In questa fase si recuperano i dati rilevanti per l'analisi dalle Sorgenti dati della piattaforma METRON.
Istruzioni:
- Selezionare la data e l'ora di inizio e fine dei dati che si desidera recuperare.
- Selezionare la frequenza di raccolta dei punti (detta anche granularità).
- Selezionare le diverse serie da cui si desidera estrarre i dati.
- Per ogni variabile: selezionare l'aggregazione e l'interpolazione.

A seconda del numero di variabili, della granularità e dell'intervallo di tempo che si desidera estrarre, questa operazione può richiedere del tempo.
B) Pulizia dei dati
In questo blocco è possibile ripulire i dati eliminando gli outlier (cioè i punti che rappresentano misurazioni errate o eventi isolati come manutenzione o incidenti).
A tal fine, è possibile creare regole per implementare vincoli fisici (ad esempio, energia >0). È anche possibile selezionare graficamente da una nuvola di punti quelli che si desidera mantenere o rimuovere.
Istruzioni:
Scegliere un metodo di pulizia dei dati:
- Con regole :
- Selezionare una variabile, un operatore e un secondo operando (valore o variabile).
- Da una nuvola di punti: Utilizzare la selezione grafica:
- Selezionare le diverse variabili per gli assi X/Y.
- Se necessario, aggiungere altre variabili per colore, forma e dimensione.
- Selezionare i punti che si desidera mantenere o eliminare utilizzando lo strumento di selezione.
- Per selezionare più aree del grafico, tenere premuto il tasto MAIUSC e fare clic sulle diverse aree che si desidera mantenere o eliminare.
- È possibile scegliere se mantenere o eliminare i punti selezionati nell'angolo in basso a destra.

- Pulizia automatica:
- Lasciate che il nostro algoritmo pulisca i dati per voi.
Si noti che i punti eliminati in questo blocco saranno cancellati solo nell'area EnergyLab, ma i dati saranno ancora visibili nell'area di visualizzazione dei dati. Questa fase serve a costruire il modello, in modo che apprenda solo la situazione di riferimento definita.
C) Costruzione dei dati
In questo blocco è possibile arricchire il set di dati selezionato nella prima fase, combinando le variabili esistenti per crearne di nuove.
Istruzioni:
A sinistra, è possibile importare e denominare le variabili che si desidera utilizzare nel calcolo.
A destra, è possibile assegnare un nome al risultato di ciascun calcolo.
Utilizzare il pannello dei calcoli per definire la formula della nuova variabile (vedere sotto), compresi:
- Gli operatori aritmetici +, -, *, /, ** (potenza), % (modulo), // (divisione per piani).
- Gli operatori di confronto <, >, <=, >=,!=, ==.
- Gli operatori booleani | (o), & (e) e ~ (non).
- Funzioni matematiche sin, cos, exp, log, expm1 (exp meno uno), log1p (log(1+x)), sqrt, sinh, cosh, tanh, arcsin, arccos, arctan, arccosh, arcsinh, arctanh, abs e arctan2
Esempio: se si vuole creare l'esponenziale dell'energia + il log della produzione, si usa “exp(energia) + log(produzione)”.
Un booleano per un consumo superiore a 10 e una produzione inferiore a 2000 sarebbe “consumo > 10 e produzione < 2000”.
Per garantire la correttezza dei calcoli, prestate molta attenzione alle unità di misura delle variabili!
D) Modellazione
In questo blocco è possibile selezionare il modello o i modelli che si desidera addestrare.
Istruzioni :
- Scelta del modello (o dei modelli): è possibile scegliere 1, 2 o tutti e 3 i modelli per confrontarli e definire quale sarà il più adatto, e visualizzare in anteprima i risultati.
- Regressione lineare: questo modello è selezionato per impostazione predefinita.
- Foresta casuale: per modellare fenomeni non lineari.
- kNN: per il confronto diretto con punti simili.
- Selezionare la variabile target da prevedere:
- Ad esempio, il consumo di elettricità di un uso significativo dell'energia.
- Selezionare le variabili caratteristiche che si desidera utilizzare per la previsione.
- Es: i fattori di influenza identificati per questo uso significativo dell'energia.
- Selezionare il metodo per separare i dati di addestramento da quelli di test:
- Rapporto: il primo X% dei dati sarà utilizzato per l'addestramento, il resto per il test.
- Data/ora: i dati precedenti alla data/ora saranno utilizzati per l'addestramento e quelli successivi per il test.
- Es: si potrebbe usare il 2023 come periodo di addestramento e il 2024 per i test.
- Avviate il calcolo dei modelli e potrete poi confrontare le loro prestazioni.
Per saperne di più, leggete l'articolo Interpretare i risultati di un modello (in arrivo).
E) Sviluppo
In questo blocco, si salverà il modello e lo si pubblicherà sulla piattaforma. Lo si può trovare in Sorgenti di dati. Una volta pubblicato il modello, le previsioni saranno calcolate in tempo reale finché i dati di input saranno disponibili.
Istruzioni:
- Scegliere un modello tra quelli addestrati nel blocco precedente.
- Inserire un nome per il modello.
- Selezionare una data a partire dalla quale calcolare lo storico.
Nota: la distribuzione include le previsioni su tutti i dati, compresi gli outlier che sono stati filtrati durante l'addestramento.