V některých případech může Python posloužit při načtení větších souborů, např. se souborem o uživatelských registracích user_registration.json, který je ke stažení zde. Efektivnější je využití Python skriptu jako zdroje a načtení souboru pomocí funkce read_json() modulu pandas.
Sloupec date_time převeď na typ Date/Time. Dále vytvoř kopii tohoto sloupce pomocí volby Duplicate column, kterou získáš po kliknutí pravým tlačítkem na název sloupce. Nový sloupec vhodně přejmenuj a převeď na typ Date.
- Vytvoř čárový graf, který zobrazuje vývoj počtu registrací v čase. Protože jde o krátkou časovou řadu, namísto hierarchie použij přímo sloupec
date_time(viz obrázek níže). - Vytvoř graf kumulativního počtu uživatelů.
- Vývojář aplikace tě informoval, že kvůli bugu se některé e-maily v registraci objevují opakovaně. Podívej se, zda při transformaci dat existuje nějaká možnost, jak tyto duplicity odstranit.
- Pomocí vhodné vizualizace prezentuj, který marketingový kanál přinesl nejvíce uživatelů.
Na svůj report přidej nástroj Slicer. Nejedná se o klasickou vizualizaci, ale filtr, který umožňuje uživateli vybrat, která data jsou v reportu zobrazena. Nastav Slicer tak, aby si uživatel s jeho pomocí mohl zobrazit data pouze pro vybranou věkovou skupinu. Vyzkoušej si různá nastavení filtru např. tak, aby uživatel nemusel používat klávesu Ctrl při výběru většího množství možností.