From 708d13b0f7745b2f9094dd6a85da967b4fb0f28d Mon Sep 17 00:00:00 2001 From: Christof Kaufmann <christof.kaufmann@hs-bochum.de> Date: Mon, 28 Apr 2025 00:27:45 +0000 Subject: [PATCH] Notebooks from applied-cs/data-science@37de694d --- .../solutions/02-old-faithful-sol.ipynb | 12 +++++++----- 1 file changed, 7 insertions(+), 5 deletions(-) diff --git a/04-pandas-und-seaborn/solutions/02-old-faithful-sol.ipynb b/04-pandas-und-seaborn/solutions/02-old-faithful-sol.ipynb index 777fc4c..a77f5bc 100644 --- a/04-pandas-und-seaborn/solutions/02-old-faithful-sol.ipynb +++ b/04-pandas-und-seaborn/solutions/02-old-faithful-sol.ipynb @@ -651,10 +651,12 @@ "aber die Information, dass `waiting` die Wartezeit vor einer Eruption\n", "ist. Da es sich aber um eine kontinuierliche Messung handelt, können wir\n", "das leicht durch Verschiebung der Spalte um eine Zeile nach oben lösen.\n", - "Um Alignment zu vermeiden, verwenden wir `to_numpy`. Die letzte Zeile\n", - "verwerfen wir, weil wir dort keine Wartezeit nach der Eruption kennen." + "Um Alignment zu vermeiden, verwenden wir `to_numpy`. Alternativ hätte\n", + "man auch einfach `df3['waiting'] = df3['waiting'].shift(-1)` verwenden\n", + "können. Die letzte Zeile verwerfen wir, weil wir dort keine Wartezeit\n", + "nach der Eruption kennen." ], - "id": "0083-915c7798bfb8a99d08209a0de5c08722c3d20ce1d02f31d9ae9367d7e8a" + "id": "0083-8ce26d6d32b588e1fe10fa6e5f04b19b66593db1d9a5e85a9c740dfd5e0" }, { "cell_type": "code", @@ -700,10 +702,10 @@ "source": [ "df4 = pd.read_csv('old-faithful-2018.csv')[['duration', 'waiting']]\n", "df4.columns = ['eruption_duration', 'waiting_time']\n", - "df4 = df4[df4['eruption_duration'] < 10] # filter eruption_duration with less than 10 sec\n", + "df4 = df4[df4['eruption_duration'] > 10] # only keep eruption_durations with more than 10 sec\n", "df4 /= 60" ], - "id": "0088-7f366659d82dd25a0c2da7bd49082739b67fb68d317f79c3a87b3df4179" + "id": "0088-f0aecc148065884c85ec80c15954b4e581dde2d58e693acfec3e89411db" }, { "cell_type": "markdown", -- GitLab