keras笔记

xiaoxiao2022-07-02 262

1）embedding层

embedding(vocab_size,64,input_length=maxword) 是将用整数索引表示的单词所构成的句子，映射成使用向量表示的单词构成句子。他的输入是 batch_size 个句子，每个句子是maxword大小，即(batch,maxword),经过此层后，变为(batch,maxword,64) 当训练结束后，每个单词都会学到自己的词向量。自己理解：当embedding层后加一个conv1d时。64相当于channel。 NOTE：

embedding层可以用来自己训练词向量，设置trainable=True。也可以使用训练好的词向量，设置trainable=False.并传入词向量矩阵。具体代码： embedding_layer = Embedding(input_dim=vocb_size, output_dim=EMBEDDING_DIM, weights=[embedding_matrix], input_length=MAX_SEQUENCE_LENGTH, trainable=False)

此时embedding层参数为：input_dim=vocb_size,意思是构建的词典的大小，所有单词的个数。即embedding_matrix的行数。output_dim为构建好的词向量矩阵的嵌入维度。即embedding_matrix的列数。weights即为构建好的词向量。input_length为输入的每句话的单词个数(之前已经进行过padding操作)。 embedding层的输入为(batch,maxword) 输出为(batch,maxword,embedding_dim)。即将单词的整数索引用训练好的词向量来替代。

2）LSTM

lstm需要注意的就是两种参数设置。一个是return_sequences,一个是return_state。 return_sequences是用来控制输出hidden_state的。 return_sequences=True即输出所有的hidden_state。 return_sequences=False即输出最后一个时间步的hidden_state。 return_state 是用来控制最后时间步state的，包括hidden_state和cell_state。（1）h = LSTM(x) return_sequences和return_state默认是false。此时只返回一个hidden state值. （2）sequence,state_h,state_c = LSTM(1,return_sequence=False,return_state=True) 此时sequence是最后一个时间步的hidden_state. state_h为最后一个时间步的hidden_state state_c为最后一个时间步的cell_state. (3) sequence,state_h,state_c = LSTM(1,return_sequence=True,return_state=True) 此时，sequence为所有时间步的hidden_state. state_h为最后一个时间步的hidden_state state_c为最后一个时间步的cell_state.

3) 卷积层维度

Conv2D(filters = 64, kernel_size = 5,padding=‘same’,input_shape=(128,128,3)) 在这里当Con2D作为第一层时，需要指定输入的维度，(128,128,3)指的是128*128像素的图片，它有3个通道。在nunpy中构建 shape为 128 * 128 * 3的array时，不太好理解，因为我之前写过的一般都是 3 *128 * 128的图片，可以很直观的理解每个通道都在不同的维度。例如 3个通道，就代表有3个二维矩阵但在keras中，默认参数就是这样规定的，可以通过data_format=‘channels_first’来设置将输入的第一个维度认为是channel。使用Con2D时，输入一张图片，输入的维度是（宽，高，通道）使用Con1D时，输入的是一个句子，输入的维度是(单词个数，词向量维度)，本例中是(400,64)，一句话有400个单词，每个单词使用64维来表示。这里的64就相当于channel。

NOTE:

1.

data_format: A string, one of “channels_last” or"channels_first".“channels_last”(batch, height, width, channels)“channels_first”(batch, channels, height, width).keras 中,Conv2D有的输入数据有两种格式。一个是通道在前，一个是通道在后。不需指定batch,但要指定hight,width,channels.

2. padding

这里的padding并不是cnn教程里的四周填补 padding =‘same’ n_output = n_input/s 向上取整 padding = ‘valid’ n_output = (n_input-f+1) /s 向上取整

最新回复(0)