Leider kann man mit den RKI Daten nicht direkt in ein Regressionsmodell gehen, weil an vielen Tagen mehr als ein Fall in derselben Kategorie auftritt
rki %>% select(date,AnzahlFall,Altersgruppe,Geschlecht) %>% group_by(AnzahlFall) %>% count()
Das Expandieren des Datensatzes ist allerdings nicht ganz trivial. Hier mein dplyr Versuch, der zuerst den Datensatz nach Häufigkeitsgruppen zerlegt, wieder zusammenfügt und zuletzt den Zähler zurücksetzt.
rki %>% bind_rows(tmp %>% group_by(AnzahlFall) %>% filter(last(AnzahlFall) >1) %>% slice( rep(1:n(), last(AnzahlFall)-1 ) ) ) %>% mutate (AnzahlFall = case_when (AnzahlFall>1 ~ 1, TRUE ~ as.numeric(AnzahlFall) ) )
Ich vermisse die R User Group München….