From 47164f81d457182dd0e9a93dc19d7ed6fe27c344 Mon Sep 17 00:00:00 2001 From: PlexSheep Date: Thu, 16 Jan 2025 14:21:40 +0100 Subject: [PATCH] 01: get analytic values first --- tasks/01-melbourne.py | 13 ++++++++++--- 1 file changed, 10 insertions(+), 3 deletions(-) diff --git a/tasks/01-melbourne.py b/tasks/01-melbourne.py index 4e21d37..40c4e51 100644 --- a/tasks/01-melbourne.py +++ b/tasks/01-melbourne.py @@ -21,13 +21,20 @@ import seaborn as sns # %% Data data = pd.read_csv("../data/melb_data.csv").dropna() # Ein Outlier, blöder Arsch +# TODO: remove outlier from actual data, not just diagram ax = sns.scatterplot(x=data['BuildingArea'], y=data['Price']) ax.set(xlim=(0, 1000)) # %% linear regression -X = data['BuildingArea'] -Y = data['Price'] +X = [] +Y = [] +for _, row in data.iterrows(): + X.append([1]+ [row['BuildingArea']]) + Y.append(row['Price']) +X = np.array(X) +Y = np.array(Y) # aber das ist noch nicht die fertige eingabe, da fehlt die konstante 1! # und mit Y ist auch irgendwas :( -# w_ana = np.linalg.solve(X.T @ X , X.T @ Y) +w_ana = np.linalg.solve(X.T @ X , X.T @ Y) +w_ana