Stáhni si dataset nba_logreg.csv, který obsahuje informace o začínajících hráčích americké basketbalové ligy NBA. Jako vstupní proměnnou pro předpověď použij sloupec TARGET_5Yrs, který o daném hráči říká, zda byl aktivní v lize i po pěti letech.
- Načti si data do proměnných
Xay - Rozděl data na trénovací a testovací (velikost testovacích dat nastav na 30% a nezapomeň nastavit proměnnou
random_state, aby tvoje výsledky byly reprodukovatelné) - Pokud použijeme stejný algoritmus jako v prvním úkolu, tj.
KNeighborsClassifier. - Vytvoř si matici záměn a na základě poskytnutých čísel zkus vypočítat metriky Precision a Recall. Následně si výsledky svého výpočtu ověř s využitím funkcí modulu
scikit-learn. - Uvažuj, že jsi v roli pracovníka agentury, která pomáhá nadějným začínajícím hráčům. Pro tebe jako pro pracovníka agentury je velmi důležité nepropásnout nějaký nový talent. Pokud nabídneš spolupráci někomu, kdo pak neuspěje, tolik to nevadí. Zkus najít hodnotu parametru
n_neighbors, která maximalizuje ideání metriku pro pracovníka agentury. K nalezení optimální metriky použij graf.
Pokud by tě zajímal význam jednotlivých sloupců, pak je níže:
- GP (Games Played): odehrané hry,
- MIN (MinutesPlayed): odehrané minuty,
- PTS (PointsPerGame): body za hru,
- FGM (FieldGoalsMade): úspšné střelecké pokusy z pole,
- FGA (FieldGoalsAttempts): střelba z pole,
- FG% (FieldGoalsPercent): úspěšnost střelby z pole,
- 3P Made (3PointsMade): úspšné střelecké pokusy z tříbodového území,
- 3PA (3PointsAttempts): střelba z tříbodového území,
- 3G% (3PointPercent): úspěšnost střelby z tříbodového území,
- FTM (FreeGoalsMade): vhozené pokutové koše,
- FTA (FreeGoalsAttempts): trestné hody,
- FG% (FreeGoalsPercent): úspěšnost trestných hodů,
- OREB (OffensiveRebounds): útočné doskoky,
- DREB (DefensiveRebounds): obranné doskoky,
- REB (Rebounds): odrazy,
- AST (Assists): asistence,
- STL (Steals): zisky míče,
- TOV (Turnovers): ztráta.
Zdroje překladů: Anglicko-český basketballový slovník