Kódím.cz
5

Agregace a řazení

Agregace nám umožní sloučit více řádků do jednoho a z jedné obrovské tabulky vytvořit srozumitelný a jasný výstup.

4
Vítězové

Pokračuj v práci se souborem votes.csv z předchozího cvičení. Ve volbách ve Spojených státech je důležité pořadí kandidáta/kandidátky v každém ze států, protože tento vítěz(ka) získá hlasy tzv. volitelů pro daný stát.

Pořadí na základě číselného sloupce je možné vypočítat pomocí metody rank(). Metoda rank() má parametr ascending, který určuje, jestli pořadí 1 dostane nejnižší nebo nejvyšší číslo. Pokud napíšeme rank(ascending=False), získá pořadí 1 nejvyšší hodnota ze sloupce, pořadí 2 druhá nejvyšší atd.

My ale chceme pořadí určit pro každý stát a rok samostatně, aby číslo 1 měl(a) vždy vítěz(ka) v daném státu a daném roce. Pokud bychom chtěli určit pořadí pro každý stát a rok samostatně, je možné využít metodu rank() v kombinaci s metodou groupby(). Jako "sloupec_poradi" zadáme sloupec, ze kterého chceme pořadí spočítat. Níže vidíš příklad, jak metodu použít.

data["jmeno_noveho_sloupce"] = data.groupby(["sloupec_1", "sloupec_2"])["sloupec_poradi"].rank()

Následně vytvoř tabulku, která bude obsahovat vítěznou stranu v jednotlivých státech ve volbách v roce 2020.

Řešení