RKI Daten sind tages- und nicht fallbasiert

Leider kann man mit den RKI Daten nicht direkt in ein Regressionsmodell gehen, weil an vielen Tagen mehr als ein Fall in derselben Kategorie auftritt

rki %>%
select(date,AnzahlFall,Altersgruppe,Geschlecht) %>%
group_by(AnzahlFall) %>%
count()

Das Expandieren des Datensatzes ist allerdings nicht ganz trivial. Hier mein dplyr Versuch, der zuerst den Datensatz nach Häufigkeitsgruppen zerlegt, wieder zusammenfügt und zuletzt den Zähler zurücksetzt.

rki %>%
  bind_rows(tmp %>%
    group_by(AnzahlFall) %>%
    filter(last(AnzahlFall) >1) %>%
    slice( rep(1:n(), last(AnzahlFall)-1 ) )
  )  %>%
  mutate (AnzahlFall = case_when (AnzahlFall>1 ~ 1, TRUE ~ as.numeric(AnzahlFall) ) )

Ich vermisse die R User Group München….