AI计算机视觉中的目标分类

新闻分类

联系我们

地址：北京市海淀区北四环西路9号 ,主营：人脸识别,活体检测,身份证识别,银行卡识别,名片识别,车牌识别，OCR识别等及智能识别技术。
电话：13146317170 廖经理
传真：
邮箱：398017534@qq.com

AI计算机视觉中的目标分类

一、经典任务

计算机视觉领域中和目标有关的经典任务有三种：分类、检测和分割。其中分类是为了告诉你「是什么」，后面两个任务的目标是为了告诉你「在哪里」，而分割任务将在像素级别上回答这个问题。

二、几种专业名词的含义

目标检测，搜索系统感兴趣的目标区域；

目标跟踪，捕获感兴趣区域的运动轨迹；

目标分类，將被跟踪目标分为人，汽车或其他移动物体；

目标行为识别，对跟踪目标进行行为识别。

立体视觉匹配，是一种从平面图像中恢复深度信息的技术。

光流，是指图像灰度模式的表面运动，是三维运动场在二维图像平面上的投影。

场景流，是空间中场景运动形成的三维运动场。两者在视频跟踪与监控，自主机器人导航，三维视频压缩与显示等领域有着广泛的应用。

三、KITTI数据集（非常重要）

对于KITTI数据集，该数据集用于评测立体图像(stereo)，光流(optical flow)，视觉测距(visual odometry)，3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。

四、几种深度学习算法含义

FCNN：全卷积网络：并行，迭代

CNN：FCNN基础上加入空间结构参数共享

RNN：FCNN基础上加入时间结构参数共享

上一条：快速实现人脸识别中的人脸检测下一条：人脸识别之人脸检测