01: get analytic values first
This commit is contained in:
parent
f2700f523e
commit
47164f81d4
|
@ -21,13 +21,20 @@ import seaborn as sns
|
||||||
# %% Data
|
# %% Data
|
||||||
data = pd.read_csv("../data/melb_data.csv").dropna()
|
data = pd.read_csv("../data/melb_data.csv").dropna()
|
||||||
# Ein Outlier, blöder Arsch
|
# Ein Outlier, blöder Arsch
|
||||||
|
# TODO: remove outlier from actual data, not just diagram
|
||||||
ax = sns.scatterplot(x=data['BuildingArea'], y=data['Price'])
|
ax = sns.scatterplot(x=data['BuildingArea'], y=data['Price'])
|
||||||
ax.set(xlim=(0, 1000))
|
ax.set(xlim=(0, 1000))
|
||||||
|
|
||||||
|
|
||||||
# %% linear regression
|
# %% linear regression
|
||||||
X = data['BuildingArea']
|
X = []
|
||||||
Y = data['Price']
|
Y = []
|
||||||
|
for _, row in data.iterrows():
|
||||||
|
X.append([1]+ [row['BuildingArea']])
|
||||||
|
Y.append(row['Price'])
|
||||||
|
X = np.array(X)
|
||||||
|
Y = np.array(Y)
|
||||||
# aber das ist noch nicht die fertige eingabe, da fehlt die konstante 1!
|
# aber das ist noch nicht die fertige eingabe, da fehlt die konstante 1!
|
||||||
# und mit Y ist auch irgendwas :(
|
# und mit Y ist auch irgendwas :(
|
||||||
# w_ana = np.linalg.solve(X.T @ X , X.T @ Y)
|
w_ana = np.linalg.solve(X.T @ X , X.T @ Y)
|
||||||
|
w_ana
|
||||||
|
|
Loading…
Reference in New Issue