Nella Data Science, la regressione è una tecnica di modellazione statistica e di machine learning utilizzata per stimare e prevedere una variabile continua (variabile dipendente) basandosi sulla sua relazione con una o più altre variabili (variabili indipendenti).
In parole semplici, cerca di trovare una "linea" (o una curva, o un iperpiano in più dimensioni) che meglio si adatta ai dati, consentendo di fare previsioni su nuovi dati sconosciuti. Ad esempio, si può usare la regressione per prevedere il prezzo di una casa basandosi su dimensioni, numero di stanze e posizione, o per stimare le vendite future di un prodotto in base alla spesa pubblicitaria.