English | 简体中文
本例程用于说明如何使用sophon-stream快速构建拌线检测算法结果推送http请求应用;
- 检测模型使用yolox;
- 跟踪模型使用bytetrack;
- 支持BM1684X(x86 PCIe、SoC),BM1684(x86 PCIe、SoC、arm PCIe),BM1688(SoC)
- 支持多路视频流
- 支持多线程
在scripts
目录下提供了相关模型和数据的下载脚本download.sh。
脚本执行完毕后,会在当前目录下生成data
目录,其中包含models
和videos
两个子目录。
# 安装unzip,若已安装请跳过,非ubuntu系统视情况使用yum或其他方式安装
sudo apt install unzip
chmod -R +x scripts/
./scripts/download.sh
下载的模型包括:
./models/
├── BM1684
│ ├── yolox_bytetrack_s_fp32_1b.bmodel # 用于BM1684的FP32 BModel,batch_size=1
│ ├── yolox_bytetrack_s_fp32_4b.bmodel # 用于BM1684的FP32 BModel,batch_size=4
│ ├── yolox_bytetrack_s_int8_1b.bmodel # 用于BM1684的INT8 BModel,batch_size=1
│ ├── yolox_bytetrack_s_int8_4b.bmodel # 用于BM1684的INT8 BModel,batch_size=4
│ ├── yolox_s_fp32_1b.bmodel # 用于BM1684的FP32 BModel,batch_size=1
│ ├── yolox_s_fp32_4b.bmodel # 用于BM1684的FP32 BModel,batch_size=4
│ ├── yolox_s_int8_1b.bmodel # 用于BM1684的INT8 BModel,batch_size=1
│ └── yolox_s_int8_4b.bmodel # 用于BM1684的INT8 BModel,batch_size=4
├── BM1684X
│ ├── yolox_bytetrack_s_fp32_4b.bmodel # 用于BM1684X的FP32 BModel,batch_size=4
│ ├── yolox_bytetrack_s_fp32_1b.bmodel # 用于BM1684X的FP32 BModel,batch_size=1
│ ├── yolox_bytetrack_s_int8_1b.bmodel # 用于BM1684X的INT8 BModel,batch_size=1
│ ├── yolox_bytetrack_s_int8_4b.bmodel # 用于BM1684X的INT8 BModel,batch_size=4
│ ├── yolox_s_fp32_1b.bmodel # 用于BM1684X的FP32 BModel,batch_size=1
│ ├── yolox_s_fp32_4b.bmodel # 用于BM1684X的FP32 BModel,batch_size=4
│ ├── yolox_s_int8_1b.bmodel # 用于BM1684X的INT8 BModel,batch_size=1
│ └── yolox_s_int8_4b.bmodel # 用于BM1684X的INT8 BModel,batch_size=4
└── BM1688
├── yolox_bytetrack_s_fp32_1b.bmodel # 用于BM1688的bytetrack的FP32 BModel,batch_size=1
├── yolox_bytetrack_s_int8_1b.bmodel # 用于BM1688的bytetrack的INT8 BModel,batch_size=1
├── yolox_s_int8_1b.bmodel # 用于BM1688的INT8 BModel,batch_size=1
└── yolox_s_int8_4b.bmodel # 用于BM1688的INT8 BModel,batch_size=4
模型说明:
1.yolox_bytetrack_s
系列模型移植于bytetrack官方,插件配置mean=[0,0,0]
,std=[255,255,255]
,支持person类别的检测任务。
2.yolox_s
系列模型移植于yolox官方,插件配置mean=[0,0,0]
,std=[1,1,1]
,支持COCO数据集的80分类检测任务。
下载的数据包括:
./data/test.mp4 # 测试视频
如果您在x86/arm平台安装了PCIe加速卡(如SC系列加速卡),可以直接使用它作为开发环境和运行环境。您需要安装libsophon、sophon-opencv和sophon-ffmpeg,具体步骤可参考x86-pcie平台的开发和运行环境搭建或arm-pcie平台的开发和运行环境搭建。
如果您使用SoC平台(如SE、SM系列边缘设备),刷机后在/opt/sophon/
下已经预装了相应的libsophon、sophon-opencv和sophon-ffmpeg运行库包,可直接使用它作为运行环境。通常还需要一台x86主机作为开发环境,用于交叉编译C++程序。
程序运行前需要编译可执行文件。
可以直接在PCIe平台上编译程序,具体请参考sophon-stream编译
通常在x86主机上交叉编译程序,您需要在x86主机上使用SOPHON SDK搭建交叉编译环境,将程序所依赖的头文件和库文件打包至sophon_sdk_soc目录中,具体请参考sophon-stream编译。本例程主要依赖libsophon、sophon-opencv和sophon-ffmpeg运行库包。
配置文件位于 ./config
其中,tripwire.json是例程的整体配置文件,管理输入码流等信息。在一张图上可以支持多路数据的输入,channels中包含每一路码流url等信息。
{
"channels": [
{
"channel_id": 0,
"url": "../data/test.mp4",
"source_type": "VIDEO",
"loop_num": 2100000,
"fps": 25,
"sample_interval": 5
}
],
"engine_config_path": "../tripwire/config/engine_group.json",
"http_report": {
"ip": "0.0.0.0",
"port": 10001,
"path": "/flask_test/"
}
}
engine.json 包含对graph的配置信息,这部分配置确定之后基本不会发生更改。
需要注意,部署环境下的NPU等设备内存大小会显著影响例程运行的路数。如果默认的输入路数运行中出现了申请内存失败等错误,可以考虑把输入路数减少,即删去channels
里的部分元素,再进行测试。
这里摘取配置文件的一部分作为示例:在该文件内,需要初始化每个element的信息和element之间的连接方式。element_id是唯一的,起到标识身份的作用。element_config指向该element的详细配置文件地址,port_id是该element的输入输出端口编号,多输入或多输出的情况下,输入/输出编号也不可以重复。is_src标志当前端口是否是整张图的输入端口,is_sink标识当前端口是否是整张图的输出端口。 connection是所有element之间的连接方式,通过element_id和port_id确定。
[
{
"graph_id": 0,
"device_id": 0,
"graph_name": "yolox_osd_encode",
"elements": [
{
"element_id": 5000,
"element_config": "../yolox_bytetrack_osd_encode/config/decode.json",
"ports": {
"input": [
{
"port_id": 0,
"is_sink": false,
"is_src": true
}
]
}
},
{
"element_id": 5001,
"element_config": "../yolox_bytetrack_osd_encode/config/yolox_group.json",
"inner_elements_id": [
10001,
10002,
10003
]
},
{
"element_id": 5004,
"element_config": "../yolox_bytetrack_osd_encode/config/bytetrack.json"
},
{
"element_id": 5005,
"element_config": "../yolox_bytetrack_osd_encode/config/filter.json"
},
{
"element_id": 5006,
"element_config": "../yolox_bytetrack_osd_encode/config/http_push.json",
"ports": {
"output": [
{
"port_id": 0,
"is_sink": true,
"is_src": false
}
]
}
}
],
"connections": [
{
"src_element_id": 5000,
"src_port": 0,
"dst_element_id": 5001,
"dst_port": 0
},
{
"src_element_id": 5001,
"src_port": 0,
"dst_element_id": 5004,
"dst_port": 0
},
{
"src_element_id": 5004,
"src_port": 0,
"dst_element_id": 5005,
"dst_port": 0
},
{
"src_element_id": 5005,
"src_port": 0,
"dst_element_id": 5006,
"dst_port": 0
}
]
}
]
filter.json等配置文件是对具体某个element的配置细节,设置了模型参数、动态库路径、阈值等信息。该配置文件不需要指定id
字段和device_id
字段,例程会将engine.json
中指定的element_id
和device_id
传入。
其中,thread_number是element内部的工作线程数量,一个线程会对应一个数据队列,多路输入情况下,需要合理设置数据队列数目,来保证线程工作压力均匀且合理。
具体请参考filter.json
{
"configure": {
"rules": [
{
"channel_id": 0,
"filters": [
{
"alert_first_frames": 0,
"alert_frame_skip_nums": 10000,
"areas": [
[
{
"left": 1000,
"top": 0
},
{
"left": 1000,
"top": 1080
}
]
],
"classes": [
0
],
"times": [
{
"time_start": "00 00 00",
"time_end": "23 59 59"
}
],
"type": 1
}
]
}
]
},
"shared_object": "../../build/lib/libfilter.so",
"name": "filter",
"side": "sophgo",
"thread_number": 2
}
对于PCIe平台,可以直接在PCIe平台上运行测试;对于SoC平台,需将交叉编译生成的动态链接库、可执行文件、所需的模型和测试数据拷贝到SoC平台中测试。
SoC平台上,动态库、可执行文件、配置文件、模型、视频数据的目录结构关系应与原始sophon-stream仓库中的关系保持一致。
测试的参数及运行方式是一致的,下面主要以PCIe模式进行介绍。
运行可执行文件,注意要更改filter里面画出的线。
./main --demo_config_path=../tripwire/config/tripwire_demo.json
运行结果如下
total time cost 74520023 us.
frame count is 3077 | fps is 41.2909 fps.
由于涉及到筛选,本例程暂不提供性能测试结果,如需各模型推理性能,请到对应模型例程查看。
1.克隆 https://github.com/sophgo/application-web
2.根据application-web/README.md将application-web部署
3.参考web_server搭建应用层程序
cd ../../tools/web-server
bash start_server.sh
5.通过application-web下发任务,启动任务