caffe的一些注意方法

@[caffe | 深度学习]

基本项目

MNIST手写字符识别

采用LeNet5结构

主要配置方法如下：

生成MNIST数据对应的lmdb文件夹两个，在examples\mnist\train_lmdb,examples\mnist\test_lmdb，其中，lmdb与leveldb数据：提高磁盘IO利用率
修改lenet_solver.prototxt,运行方式改为CPU
修改lenet_train_test.prototxt路径

开始训练

Build\x64\Release\caffe.exe train --solver=examples/mnist/lenet_solver.prototxt

生成均值文件

Build\x64\Release\compute_image_mean.exe examples\mnist\mnist_train_lmdb mean.binaryproto --backend=lmdb

在lenet_train_test.prototxt中，transform_param前，添加 mean_file:"mean.binaryproto"(共2处)
建立标签文件synset_words.txt

自己手写训练，24*24

Build\x64\Release\classification.exe examples\mnist\lenet.prototxt examples\mnist\lenet_iter_10000.caffemodel mean.binaryproto examples\mnist\synset_words.txt examples\mnist\0.bmp

数据结构

Blob：

连续的N(一般为4)维数组，Blob 是caffe中实际处理和传递数据的数据封装包，并且在CPU和GPU之间有数据同步能力，

blob.hpp文件位于../libcaffe/include.hpp下

lmdb与leveldb数据：

提高磁盘IO利用率

Layers：

Layer是caffe模型的【本质内容】和【执行计算】的基本单元。
Layer可以进行很多运算，如:convolve(卷积)、pool(池化)、inner product(内积)、sigmod等非线性运算，元素级别的数据变换，normalize(归一化)、load data(数据加载)、softmax和loss
一个Layer通过底部bottom(底部)连接层接收数据，通过top(顶部)连接层输出数据
每一个Layer层都定义了3中重要的运算:
- setup(初始化设置):在模型初始化时，重置Layers及其相互之间的连接
- forward(前向传播):从bottom层中接收数据，进行计算后，将输出送入到top层中
- backforward(反向传播):给定相对于top层输出的梯度，计算其相对于输入的梯度，并传递到bottom层。一个有参数的layer需要计算相对各个参数的梯度值，并存储在内部。
需要特别指出的，Forward和Backward函数分别有CPU和GPU两种实现方式。如果没有GPU版本，那么layer将转向作为备用选型的CPU方式。尽管这样会增加额外的数据传递成本(输入数据由GPU上复制到CPU，之后输出数据从CPU又复制回到GPU)，但是对于做一些快速实验，这样的操作还是很方便的。
总的来说，layer承担了网络的【两个核心操作】:
- forward pass(前向传播):接收输入，并计算输出。
- backward pass(反向传播):接收关于输出的梯度，计算相对于参数和输入的梯度并反向传播给在它前面的层。由此组成每个layer的前向和反向通道
由于caffe网络的组合性和其代码的模块化，自定义layer是很容易的。只要定义好layer的:
- setup
- forward
- backward 就可以将layer纳入到网络。

关于参数命名的一些事项

name:				#表示该层的名称，可以随意命名
type:				#层类型，主要有：Convolution, Data, pooling
bottom/top:			#输入/输出
data/label: 		#data层中，双输出
inclulde：			#指定属训练阶段or测试阶段
Transformations:	#数据的预处理，scale为0.00390625，即是1/255, 即将输入数据由0-255归一化到0-1之间


## Layer的设置方法

```python
name:				#表示该层的名称，可以随意命名
type:				#层类型，主要有：Convolution, Data, pooling
bottom/top:			#输入/输出
data/label: 		#data层中，双输出
inclulde：			#指定属训练阶段or测试阶段
Transformations:	#数据的预处理，scale为0.00390625，即是1/255, 即将输入数据由0-255归一化到0-1之间

输入数据层

数据来源	type	必选项
数据库（lmdb，leveldb等）	"Data"	batch_size, source
内存	"MemoryData"	batch_size, channels, width,height
HDF5	"HDF5Data"	batch_size
图片	"ImageData"	batch_size, source
Windows	"WindowData"	batch_size, source

其中

batch_size每次处理的数据个数

source，包含数据的路径

backend， leveldb/lmdb两种常见

layer {
  name: "cifar"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    scale: 0.00390625 #1/256
    mean_file: "examples/cifar10/mean.binaryproto"
  }
  data_param {
    source: "examples/cifar10/cifar10_train_lmdb"
     # 用一个配置文件来进行均值操作
    mirror: 1  # 1表示开启镜像，0表示关闭，也可用ture和false来表示
    # 剪裁一个 227*227的图块，在训练阶段随机剪裁，在测试阶段从中间裁剪
    crop_size: 227
    batch_size: 100
    backend: LMDB
  }
}

视觉层

param
- lr_mult 学习速率
- decay_mult 权值衰减，避免overfiting
convolution_param
- num_output
- kernel_size
- pad
- stride
- bias_filter偏执项初始化
  - typeweight常见的有constant，xavier,gaussian，bias常见constant
- weight_filter权值初始化
  - std
lrn_param
- local_size
- alpha
- beta
- norm_region
inner_production_param
- ``

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

caffe的一些注意方法.md

caffe的一些注意方法.md

caffe的一些注意方法

基本项目

MNIST手写字符识别

数据结构

Blob：

lmdb与leveldb数据：

Layers：

关于参数命名的一些事项

输入数据层

视觉层

卷积层

pool层

Files

caffe的一些注意方法.md

Latest commit

History

caffe的一些注意方法.md

File metadata and controls

caffe的一些注意方法

基本项目

MNIST手写字符识别

数据结构

Blob：

lmdb与leveldb数据：

Layers：

关于参数命名的一些事项

输入数据层

视觉层

卷积层

pool层