Machine Learning (2) - Linear Regression Multiple Variables 多个参数

import pandas as pd
from sklearn import linear_model
df = pd.read_csv('/Users/rachel/Downloads/py-master/ML/2_linear_reg_multivariate/Exercise/hiring.csv')
df

Machine Learning (2) - Linear Regression Multiple Variables 多个参数

运用 Pandas 整理数据

// 把长长的列名改成简单的, 方便后面使用
df.rename(columns={'test_score(out of 10)':'test', 'interview_score(out of 10)':'interview', 'salary($)':'salary'}, inplace=True)

// 取 test 列的平均值
test = df.test.median()

// 把表格中的 NaN 补全
df.fillna({
    'experience': 'zero',
    'test' : test
}, inplace=True)

// 把 experience 列的字符转成数字
from word2number import w2n
df.experience = df.experience.apply(w2n.word_to_num)

上面有用到 word2number 包需要安装一下, 在终端执行命令:

pip3 install word2number

最后整理完的数据如下:

Machine Learning (2) - Linear Regression Multiple Variables 多个参数

现在就可以创建数据模型并进行预测啦:


reg = linear_model.LinearRegression()

reg.fit(df[['experience', 'test', 'interview']], df.salary)

reg.predict([[2, 9, 6]])
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!