思路:通过构建一个三层的CNN网络,实现数字识别。(图像处理问题)
#导入各种用到的模块组件 from __future__ import absolute_import from __future__ import print_function from keras.preprocessing.image import ImageDataGenerator from keras.models import Sequential from keras.layers.core import Dense,Dropout,Activation,Flatten from keras.layers.advanced_activations import PReLU from keras.layers.convolutional import Convolution2D,MaxPooling2D from keras.optimizers import SGD,Adadelta,Adagrad from keras.utils import np_utils,generic_utils from six.moves import range def load_data(): for i in range(10): return i #加载数据 data,label=load_data() print(data.shape[0],'samples') #label为0~9共10个类别,keras要求格式为binary class metrices,转化下 #直接带哦用kereas提供的这个函数 label=np_utils.to_categorical(label,10) ############ #开始建立CNN模型 #生成一个model model=Sequential() #第一个卷积层,4个卷积核,每个卷积核大小为5*5.1表示输入的图片的通道,灰度图为1通道 #border_mode可以是valid或者full #激活函数用tanh #还可以在model.add(Activation('tanh'))后加上dropout的技巧: #model.add(Dropout(0.5)) model.add(Convolution2D(4,1,5,5,border_mode='valid')) model.add(Activation('tanh')) #第二个卷积层,8个卷积核,每个卷积核大小3*3.4表示输入的特征图个数,等于上一层的卷积核个数 #激活函数用tanh #采用maxpooling,poolsize为(2,2),池化常用的方法有:最大值、平均值 model.add(Convolution2D(8,4,3,3,border_mode='valid')) model.add(Activation('tanh')) model.add(MaxPooling2D(pool_size=(2,2))) #第三个卷积层,16个卷积核,每个卷积核大小为3*3 #激活函数用tanh #采用maxpooling,poolsize为(2,2 model.add(Convolution2D(16,8,3,3,boder_mode='valid')) model.add(Activation('tanh')) model.add(MaxPooling2D(pool_size=(2,2))) #全连接层,先将前一层输出的二维特征图flatten为一维的 #Dense为隐藏层。16是上一层输出的特征图个数。4是根据每个卷积层计算出来的 #(28-5+1)=24 ,(24-3+1)/2=11,(11-3+1)/2=4 #全连接有128个神经元节点,初始化方式为normal model.add(Flatten()) model.add(Dense(16*4*4,128,init='normal')) model.add(Activation('tanh')) #softmax分类器,输出是10类别 model.add(Dense(128,10,init='normal')) model.add(Activation('softmax')) #-------开始训练模型--------------- #使用SGD+momentum #model.compile里的参数就是损失函数(目标函数) sgd=SGD(l2=0.0,lr=0.05,decay=1e-6,momentum=0.9,nesterov=True) model.compile(loss='categorical_crossentropy',optimizer=sgd,class_mode='categorical') #调用fit方法,就是一个训练过程。训练的epoch数设为10,batch_size=100 #数据经过随机打乱shuffle=True。verbose=1,训练过程中输出的信息,0,1,2三种方式都可以,无关紧要 #show_accuracy=True,训练时每一个epoch都输出accuracy #validation_split=0.2,将20%的数据作为验证集 model.fit(data,label,batch_size=100,nb_epoch=10,shuffle=True,verbose=1,validation_split=0.2) #fit方法在达到设定的nb_epoch时结束,并且自动地保存了效果最好的model,之后你可以调用model.evaluate()方法对测试数据进行测试, #还有model.predict_classes,model.predict_proba等方法,具体请看文档