tf 学习-Convolutional Neural Networks-卷积网络模型

娃哈哈店长的个人博客 / 0 / 0 / 创建于 5年前 / 更新于 5年前

卷积神经网络(Convolutional Neural Networks)

卷积操作、池化操作
深度可分离卷积
数据增强
迁移学习

大致结构：

卷积神经网络
- (convolution+subsampling)n + fully connected layers,FCm
- classification
全卷积神经网络
- (convolution+subsampling)n + pixelwise classificationK
- Object segment

卷积操作：
解决神经网络参数过多的问题，比如：图片大小为10001000，下一层神经元为10^6，全链接参数为(10^310^3)*10^6=10^12，参数过多比较容易过拟合，需要更多训练数据

卷积的特点：

局部连接
比如图片大小为10001000，下一层神经元为10^6，局部连接范围为1010，全连接参数为(1010)10^6=10^8
参数共享
比如图片大小为10001000，下一层神经元为10^6，局部连接范围为1010，全连接参数为10*10=100，ps这里运用了参数共享是指在局部内的像素数据分布相同，在图像中，其实很多局部的图像都是一样的，所以进行参数共享可以有效的优化数据，可能没有上面个提到的优化成100这么恐怖

卷积–每个位置进行计算

输入的图像：

[
    [1,2,3,4,5],
    [6,7,8,9,10],
    [11,12,13,14,15],
    [16,17,18,19,20],
    [21,22,23,24,25],
]

卷积核：

[
    [1,0,1],
    [0,1,0],
    [1,0,1],
]

输出size=输入size-卷积核size+1
输出size=5-(3-1)

池化操作–最大值池化

输入的图像：

[
    [1,2,3,4,5],
    [6,7,8,9,10],
    [11,12,13,14,15],
    [16,17,18,19,20],
    [21,22,23,24,25],
]

max-pool 操作
stride = 2 步长
kernel_size = 2*2 
[
    [x,x],
    [x,x],
]

输出：

[
    [7,9],每个点都是kernel到达地方的矩阵的最大值
    [17,19],
]

还一种平均值池化：
avg-pool 操作

[
    [4,6],
    [14,16],
]

特点：

尝试用不重叠，不补零
没有用于求导的参数
池化层参数为不长和池化核大小
用于减少图像尺寸，从而减少计算量
一定程度以动鲁棒
损失空间位置


import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
import sklearn
import pandas as pd
import tensorflow as tf

from tensorflow import keras
import os, sys, time 


print(sys.version_info)
for module in tf, mpl, np, pd, sklearn, tf, keras:
    print(module.__name__, module.__version__)

sys.version_info(major=3, minor=6, micro=7, releaselevel='final', serial=0)
tensorflow 2.1.0
matplotlib 3.2.0
numpy 1.18.1
pandas 1.0.1
sklearn 0.22.2.post1
tensorflow 2.1.0
tensorflow_core.keras 2.2.4-tf

fashion_mnist = keras.datasets.fashion_mnist
(x_train_all, y_train_all), (x_test, y_test) = fashion_mnist.load_data()
# fashion_mnist 训练集共有60000，将前5000作为验证集，后55000作为训练集
x_valid, x_train = x_train_all[:5000], x_train_all[5000:]
y_valid, y_train = y_train_all[:5000], y_train_all[5000:]

print("x_valid.shape, y_valid.shape:",x_valid.shape, y_valid.shape)
print("x_train.shape, y_train.shape",x_train.shape, y_train.shape)
print("x_test.shape, y_test.shape",x_test.shape, y_test.shape)

x_valid.shape, y_valid.shape: (5000, 28, 28) (5000,)
x_train.shape, y_train.shape (55000, 28, 28) (55000,)
x_test.shape, y_test.shape (10000, 28, 28) (10000,)

# 数据集样本展示
def show_single_img(img_arr):
    plt.imshow(img_arr, cmap="binary")
    plt.show()
show_single_img(x_train[0])

svg

'''
对数据进行归一化处理
定义：把数据经过处理后使之限定在一定的范围内。比如通常限制在区间[0, 1]或者[-1, 1]
Z-score归一化
'''
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train.astype(np.float32).reshape(-1, 1)).reshape(-1, 28, 28)
x_valid_scaled = scaler.fit_transform(x_valid.astype(np.float32).reshape(-1, 1)).reshape(-1, 28, 28)
x_test_scaled = scaler.fit_transform(x_test.astype(np.float32).reshape(-1, 1)).reshape(-1, 28, 28)
# 我们np里的数据是int类型，所以我们需要x_train.astype(np.float32)将数据转化成float32
# fit_transform 不仅有数据转化为归一化的功能，还有fit（将数据存储下来）的功能.
# Z_score = lambda d:scaler.fit_transform(d.astype(np.float32).reshape(-1,1)).reshape(-1,28,28)
# x_train_scaled = Z_score(x_train)
# x_valid_scaled = Z_score(x_valid)
# x_test_scaled = Z_score(x_test)

model = keras.models.Sequential()
# padding='same' 要不要给输入加上padding
model.add(keras.layers.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu', input_shape=(28,28,1)))
model.add(keras.layers.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu'))
# pool_size=2 源数据的长宽都会变成原来的1/2，导致数据量变为原来的1/4
model.add(keras.layers.MaxPool2D(pool_size=2))

# 所以在这一层需要讲filter变成两倍，防止损失数据
model.add(keras.layers.Conv2D(filters=64, kernel_size=3, padding='same', activation='relu'))
model.add(keras.layers.Conv2D(filters=64, kernel_size=3, padding='same', activation='relu'))
model.add(keras.layers.MaxPool2D(pool_size=2))

# 以下同理
model.add(keras.layers.Conv2D(filters=128, kernel_size=3, padding='same', activation='relu'))
model.add(keras.layers.Conv2D(filters=128, kernel_size=3, padding='same', activation='relu'))
model.add(keras.layers.MaxPool2D(pool_size=2))

# 链接全连接层
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(128, activation='relu'))
# 输出层
model.add(keras.layers.Dense(10, activation='softmax'))

model.compile(loss='sparse_categorical_crossentropy', optimizer='sgd', metrics=['accuracy'])
model.summary()

Model: "sequential_2"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_12 (Conv2D)           (None, 28, 28, 32)        320       
_________________________________________________________________
conv2d_13 (Conv2D)           (None, 28, 28, 32)        9248      
_________________________________________________________________
max_pooling2d_6 (MaxPooling2 (None, 14, 14, 32)        0         
_________________________________________________________________
conv2d_14 (Conv2D)           (None, 14, 14, 64)        18496     
_________________________________________________________________
conv2d_15 (Conv2D)           (None, 14, 14, 64)        36928     
_________________________________________________________________
max_pooling2d_7 (MaxPooling2 (None, 7, 7, 64)          0         
_________________________________________________________________
conv2d_16 (Conv2D)           (None, 7, 7, 128)         73856     
_________________________________________________________________
conv2d_17 (Conv2D)           (None, 7, 7, 128)         147584    
_________________________________________________________________
max_pooling2d_8 (MaxPooling2 (None, 3, 3, 128)         0         
_________________________________________________________________
flatten_2 (Flatten)          (None, 1152)              0         
_________________________________________________________________
dense_4 (Dense)              (None, 128)               147584    
_________________________________________________________________
dense_5 (Dense)              (None, 10)                1290      
=================================================================
Total params: 435,306
Trainable params: 435,306
Non-trainable params: 0
_________________________________________________________________

x_train_scaled.shape[0]

logdir = os.path.join('callbacks')

if not os.path.exists(logdir):
    os.mkdir(logdir)
output_model_file = os.path.join(logdir,
                                 "fashion_mnist_model.h5")
callbacks = [
    keras.callbacks.TensorBoard(log_dir=logdir),
    keras.callbacks.ModelCheckpoint(output_model_file, save_best_only=True),
    keras.callbacks.EarlyStopping(patience=5, min_delta=1e-3),
]


from keras.utils import np_utils
# 将数据集标准化

x_train_scaled = x_train_scaled.reshape(x_train_scaled.shape[0],28,28,1)
x_valid_scaled = x_valid_scaled.reshape(x_valid_scaled.shape[0],28,28,1)
x_test_scaled = x_valid_scaled.reshape(x_valid_scaled.shape[0],28,28,1)

history = model.fit(x_train_scaled, y_train, epochs=10, validation_data=(x_valid_scaled, y_valid), callbacks=callbacks)

Train on 55000 samples, validate on 5000 samples
Epoch 1/10
55000/55000 [==============================] - 18s 328us/sample - loss: 0.7787 - accuracy: 0.7169 - val_loss: 0.4885 - val_accuracy: 0.8066
Epoch 2/10
55000/55000 [==============================] - 18s 319us/sample - loss: 0.4043 - accuracy: 0.8523 - val_loss: 0.3749 - val_accuracy: 0.8602
Epoch 3/10
55000/55000 [==============================] - 18s 332us/sample - loss: 0.3448 - accuracy: 0.8734 - val_loss: 0.3193 - val_accuracy: 0.8824
Epoch 4/10
55000/55000 [==============================] - 17s 316us/sample - loss: 0.3132 - accuracy: 0.8852 - val_loss: 0.2963 - val_accuracy: 0.8930
Epoch 5/10
55000/55000 [==============================] - 18s 327us/sample - loss: 0.2896 - accuracy: 0.8937 - val_loss: 0.2838 - val_accuracy: 0.8946
Epoch 6/10
55000/55000 [==============================] - 17s 312us/sample - loss: 0.2696 - accuracy: 0.9009 - val_loss: 0.2773 - val_accuracy: 0.8980
Epoch 7/10
55000/55000 [==============================] - 19s 341us/sample - loss: 0.2531 - accuracy: 0.9071 - val_loss: 0.2667 - val_accuracy: 0.9010
Epoch 8/10
55000/55000 [==============================] - 18s 336us/sample - loss: 0.2382 - accuracy: 0.9116 - val_loss: 0.2551 - val_accuracy: 0.9042
Epoch 9/10
55000/55000 [==============================] - 18s 325us/sample - loss: 0.2246 - accuracy: 0.9163 - val_loss: 0.2659 - val_accuracy: 0.9040
Epoch 10/10
55000/55000 [==============================] - 19s 342us/sample - loss: 0.2115 - accuracy: 0.9218 - val_loss: 0.2479 - val_accuracy: 0.9118

x_train_scaled

array([[[[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        ...,

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]]],


       [[[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        ...,

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]]],


       [[[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        ...,

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]]],


       ...,


       [[[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        ...,

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]]],


       [[[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        ...,

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]]],


       [[[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        ...,

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]],

        [[-0.8105136],
         [-0.8105136],
         [-0.8105136],
         ...,
         [-0.8105136],
         [-0.8105136],
         [-0.8105136]]]], dtype=float32)

def plot_learning_curves(history):
    pd.DataFrame(history.history).plot(figsize=(8, 5))
    plt.grid(True)
    plt.gca().set_ylim(0, 1)
    plt.show()

plot_learning_curves(history)

tf 学习-Convolutional Neural Networks-卷积网络模型

print(y_test.shape)
model.evaluate(x_test_scaled, y_test[:5000])

(10000,)
5000/5000 [==============================] - 1s 136us/sample - loss: 9.9771 - accuracy: 0.1032





[9.977148281860352, 0.1032]

本作品采用《CC 协议》，转载必须注明作者和本文链接

文章！！首发于我的博客Stray_Camel(＾Ｕ＾)ノ~ＹＯ。

娃哈哈店长

见习助教 494 声望

当学习养成习惯，我的博客https://boywithacoin.cn/

0 人点赞

tf 学习-Convolutional Neural Networks-卷积网络模型

卷积神经网络(Convolutional Neural Networks)

大致结构：

卷积–每个位置进行计算

池化操作–最大值池化

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

tf 学习-Convolutional Neural Networks-卷积网络模型

卷积神经网络(Convolutional Neural Networks)

大致结构：

卷积–每个位置进行计算

池化操作–最大值池化

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录