Výběr sloupců
V některých případech nás jako první při práci s daty napadne nějak si data zjednodušit. Například budeme chtít v DataFrame vybrat pouze některé sloupce, a to co nás nezajímá, můžeme zahodit.
K tomu použijeme výběr sloupců pomocí hranatých závorek. Zápis připomíná práci se seznamy - hranatou závorku napíšeme přímo za název proměnné, kde máme uložený DataFrame
, a do ní vepíšeme název sloupce, který nás zajímá.
food['description']
fdc_id
2644829 lentils, dry
2347263 heavy cream
2261954 Flour, potato
321470 Salt, Iodized
322951 Hot dogs beef
...
2260615 Yogurt, whole milk, plain
2646468 chicken, breast, boneless, skinless
2647032 pork, loin, boneless
2349564 Oats, whole grain, rolled, old fashioned
328565 Cheese, cheddar, mild, block/chunk, store bran...
Name: description, Length: 100, dtype: object
Zde je důležité říct, že pokud vybíráme pouze jeden sloupec, vrátí se nám takzvaná série (Series
), což je jiný datový typ než tabulka (DataFrame
). Sérii si představme jako jednorozměrnou strukturu. Nelze do ní například přidávat další sloupce.
Pro výběr více sloupců musíme do indexace DataFrame vložit seznam s názvy sloupců.
food[['description', 'publication_date']]
description publication_date
fdc_id
2644829 lentils, dry 2023-10-19
2347263 heavy cream 2022-10-28
2261954 Flour, potato 2022-04-28
321470 Salt, Iodized 2019-04-01
322951 Hot dogs beef 2019-04-01
... ... ...
2260615 Yogurt, whole milk, plain 2022-04-28
2646468 chicken, breast, boneless, skinless 2023-10-19
2647032 pork, loin, boneless 2023-10-19
2349564 Oats, whole grain, rolled, old fashioned 2022-10-28
328565 Cheese, cheddar, mild, block/chunk, store bran... 2019-04-01
[100 rows x 2 columns]
Tady se nám již vrátil datový typ DataFrame. Tohoto triku můžeme využít, když chceme získat pouze jeden sloupec, ale chceme ho získat jako DataFrame.
food[['description']]
description
fdc_id
2644829 lentils, dry
2347263 heavy cream
2261954 Flour, potato
321470 Salt, Iodized
322951 Hot dogs beef
... ...
2260615 Yogurt, whole milk, plain
2646468 chicken, breast, boneless, skinless
2647032 pork, loin, boneless
2349564 Oats, whole grain, rolled, old fashioned
328565 Cheese, cheddar, mild, block/chunk, store bran...
[100 rows x 1 columns]