Stáhni si data z tabulky branded_food.csv, která obsahuje data o konkrétních potravinách od výrobců. Tabulku načti do pandas tabulky branded_food.
Pro tabulku branded_food splň následující úkoly.
- Zobraz si prvních několik řádků tabulky a podívej se na to, jaké jsou v ní sloupce a jaké jsou v nich hodnoty.
- Ve sloupci
brand_ownerjsou názvy výrobců potravin. Zjisti tři výrobce s největším počtem potravin v tabulce. - Ve sloupci
branded_food_categoryjsou kategorie potravin. Zjisti pět kategorií s největších počtem potravin v tabulce.
Nápověda: Na body 2 a 3 využij metodu, kterou jsme si již ukazovali v předchozí lekci. Její název se skládá ze dvou slov - anglického výrazu pro hodnotu a pro počet.
V tabulce je sloupec fdc_id, pomocí kterého ji můžeš propojit s tabulkou food_merged. Protože názvy jsou v obou tabulkách stejné, takže by bylo možné použít parametr on. Vyzkoušej si ale místo toho parametry left_on a right_on, kterým dáš stejnou hodnotu, tj. název sloupce fdc_id. Výsledek ulož do tabulky food_merged_brands.
Pro tabulku food_merged_brands splň následující úkoly.
- U výsledné tabulky
food_merged_brandszkontroluj počet řádků a srovnej ho s původní tabulkoufood_merged. Ubyly nějaké řádky? A čím to je? - Nyní proveď operaci
mergeznovu, ale s parametremhownastaveným na hodnotuleft. Zkontroluj počet řádků a porovnej ho s počtem řádků tabulkyfood_merged_brands. Proč se počet liší?