線性迴歸模型的 MXNet 與 TensorFlow 實現

線性迴歸 TensorFlow 迴歸模型 · 發表 2018-12-02 21:42:00

摘要：本文主要探索如何使用深度學習框架 MXNet 或 TensorFlow 實現線性迴歸模型？並且以 Kaggle 上資料集 USA_Housing 做線性迴歸任務來預測房價。迴歸任務，scikit-learn 亦可以實現，具體操作可以檢視線性迴歸模型的原理與 scikit-le...

本文主要探索如何使用深度學習框架 MXNet 或 TensorFlow 實現 線性迴歸 模型？並且以 Kaggle 上資料集 ofollow,noindex" target="_blank">USA_Housing 做線性迴歸任務來預測房價。

迴歸任務，scikit-learn 亦可以實現，具體操作可以檢視線性迴歸模型的原理與 scikit-learn 實現。

載入資料

import pandas as pd
import numpy as np

name = '../dataset/USA_Housing.csv'
dataset = pd.read_csv(name)

train = dataset.iloc[:3000,:]
test = dataset.iloc[3000:,:]

print(train.shape)
print(test.shape)

(3000, 7)
(2000, 7)

檢視有無缺失值：

print(np.unique(train.isnull().any()))
print(np.unique(test.isnull().any()))

[False]
[False]

dataset.columns# 檢視所有特徵名稱

Index(['Avg. Area Income', 'Avg. Area House Age', 'Avg. Area Number of Rooms',
'Avg. Area Number of Bedrooms', 'Area Population', 'Price', 'Address'],
dtype='object')

我們不考慮 'Address' 特徵。通過特徵 'Avg. Area Income', 'Avg. Area House Age', 'Avg. Area Number of Rooms', 'Avg. Area Number of Bedrooms', 'Area Population' 來預測 'Price' 。

features_column = [
name for name in dataset.columns if name not in ['Price', 'Address']
]
label_column = ['Price']

x_train = train[features_column]
y_train = train[label_column]
x_test = test[features_column]
y_test = test[label_column]

為了更好的理解線性迴歸的原理，我們先動手自己實現：

資料標準化

線性迴歸模型就是單層神經網路，在神經網路的訓練中，需要將資料進行標準化處理，使得資料的尺度統一。

from sklearn.preprocessing import scale

標準化處理：

x_train_s = scale(x_train)
x_test_s = scale(x_test)

為了更紅的管理資料集我們先定義一個針對資料集處理的統一 API： Loader 。為了和不同的深度學習框架進行接洽， Loader 被限制為輸出 Numpy 陣列。

class Loader(dict):
"""
方法
========
L 為該類的例項
len(L)::返回樣本數目
iter(L)::即為資料迭代器

Return
========
可迭代物件（numpy 物件）
"""

def __init__(self, batch_size, X, Y=None, shuffle=True, name=None):
'''
X, Y 均為類 numpy, 可以是 HDF5
'''
if name is not None:
self.name = name
self.X = np.asanyarray(X[:])
if Y is None:
# print('不存在標籤！')
self.Y = None
else:
self.Y = np.asanyarray(Y[:])
self.batch_size = batch_size
self.shuffle = shuffle
self.nrows = self.X.shape[0]

def __iter__(self):
idx = np.arange(self.nrows)

if self.shuffle:
np.random.shuffle(idx)

for k in range(0, self.nrows, self.batch_size):
K = idx[k:min(k + self.batch_size, self.nrows)]
if self.Y is None:
yield np.take(self.X, K, 0)
else:
yield np.take(self.X, K, 0), np.take(self.Y, K, 0)

def __len__(self):
return self.nrows

由於預測的值很大，為了加快訓練速度，我們將其轉換為：

batch_size = 64
trainset = Loader(batch_size, x_train_s, y_train)

MXNet 訓練

from mxnet import nd, autograd
from mxnet.gluon import nn

def linreg(X, w, b):
'''
線性迴歸模型
'''
return nd.dot(X, w) + b


def squared_loss(y_hat, y):
'''
l_2 損失
'''
return (y_hat - y.reshape(y_hat.shape)) ** 2 / 2


def sgd(params, lr, batch_size):
for param in params:
param[:] -= lr * param.grad / batch_size

%%time
n_features = x_train.shape[1]

# 引數初始化
w = nd.random_normal(shape=(n_features, 1))
b = nd.zeros([1])
params = [w, b]

for param in params:
param.attach_grad()

# 超引數設定
lr = .45
epochs = 10
net = linreg
loss = squared_loss
test_l = []
for epoch in range(epochs):
train_l = 0
for x, y in trainset:
x = nd.array(x, dtype=np.float32)
y = nd.array(y, dtype=np.float32)
with autograd.record():
out = net(x, w, b)
L = loss(out, y)
L.backward()
sgd([w, b], lr, batch_size)
train_l += L.sum().asscalar()
test_l.append(loss(net(nd.array(x_test_s), w, b),
nd.array(y_test)).mean().asscalar())
print(f'Epoch {epoch}, train loss {train_l/len(trainset)}')

Epoch 0, train loss 31618141962.24
Epoch 1, train loss 5227899371.52
Epoch 2, train loss 5213236106.581333
Epoch 3, train loss 5218263345.834666
Epoch 4, train loss 5239229207.893333
Epoch 5, train loss 5258389263.701333
Epoch 6, train loss 5229723735.381333
Epoch 7, train loss 5193707612.842667
Epoch 8, train loss 5248076775.424
Epoch 9, train loss 5249794779.818666
Wall time: 617 ms

%matplotlib inline
from matplotlib import pyplot as plt

plt.plot(test_l)
plt.show()

from sklearn.metrics import r2_score
out = net(nd.array(x_test_s), w, b).asnumpy()

r2_score(y_test, out)

0.9160266711438344

TensorFlow 訓練

import tensorflow as tf

def linreg(X, w, b):
'''
線性迴歸模型
'''
return tf.matmul(X, w) + b

%%time
n_features = x_train.shape[1]
lr = .45

# 引數初始化
w = tf.Variable(tf.random_normal(shape=(n_features, 1)))
b = tf.Variable(tf.zeros([1]))

x = tf.placeholder(tf.float32, [None, n_features])
y = tf.placeholder(tf.float32, [None, 1])

loss = (y - linreg(x, w, b))**2 / 2
train_op = tf.train.GradientDescentOptimizer(lr).minimize(loss)
test_out = linreg(tf.constant(x_test_s, tf.float32), w, b)
init = tf.global_variables_initializer()

epochs = 10
with tf.Session() as sess:
for epoch in range(epochs):
train_l = 0
for data, labels in trainset:
data = data.astype(np.float32)
labels = labels.astype(np.float32)
sess.run(init)
train_, _ = sess.run(
[loss, train_op], feed_dict={
x: data,
y: labels
})
train_l += train_.sum()
print(f'Epoch {epoch}, train loss {train_l/ len(trainset)}')
out = sess.run(test_out)

Epoch 0, train loss 825207346429.952
Epoch 1, train loss 825207220600.832
Epoch 2, train loss 825207307283.1146
Epoch 3, train loss 825207276524.8854
Epoch 4, train loss 825207298894.5067
Epoch 5, train loss 825207349226.1547
Epoch 6, train loss 825207335245.1414
Epoch 7, train loss 825207173065.3867
Epoch 8, train loss 825207325458.432
Epoch 9, train loss 825207249960.96
Wall time: 4.17 s

TensorFlow 與 MXNet 相比，慢了許多。

r2_score(y_test, out)

-9834.739544115224

線性迴歸模型的 MXNet 與 TensorFlow 實現

載入資料

資料標準化

MXNet 訓練

TensorFlow 訓練

您可能也會喜歡…