Continuiamo in questo articolo lo studio sulle proprietà della libreria pandas (articoli precedenti : 1, 2, 3, 4) . Può capitare in un qualsiasi dataset, di avere degli elementi mancanti che possono danneggiare le nostre analisi, in questo articolo vedremo come agire per limitare questo odioso problema. Iniziamo come al solito con il codice e importiamo le necessarie librerie :

costruiamo quindi un dataframe con alcuni elementi mancanti :

notiamo come nella colonna centrale mancano ben 3 valori; come possiamo ovviare a questo problema?

La prima scelta che possiamo compiere, è quella di cancellare le righe a cui mancano dei valori :

o possiamo cancellare le colonne con valori mancanti :

altra cosa che possiamo fare è riempire i buchi con un valore che scegliamo noi :

o magari con una media :

infine ultima cosa su cui possiamo agire è quella di riempire i valori di una specifica colonna :

Per oggi è tutto, continueremo nel prossimo articolo con lo studio di pandas.

Un saluto

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

You may also like