联系我们
- 地 址:北京市海淀区北四环西路9号 ,主 营:人脸识别,活体检测,身份证识别,银行卡识别,名片识别,车牌识别,OCR识别等及智能识别技术。
- 电 话:13146317170 廖经理
- 传 真:
- 邮 箱:398017534@qq.com
AI计算机视觉中的目标分类
AI计算机视觉中的目标分类
AI计算机视觉中的目标分类
一、经典任务
计算机视觉领域中和目标有关的经典任务有三种:分类、检测和分割。其中分类是为了告诉你「是什么」,后面两个任务的目标是为了告诉你「在哪里」,而分割任务将在像素级别上回答这个问题。
二、几种专业名词的含义
目标检测,搜索系统感兴趣的目标区域;
目标跟踪,捕获感兴趣区域的运动轨迹;
目标分类,將被跟踪目标分为人,汽车或其他移动物体;
目标行为识别,对跟踪目标进行行为识别。
立体视觉匹配,是一种从平面图像中恢复深度信息的技术。
光流,是指图像灰度模式的表面运动,是三维运动场在二维图像平面上的投影。
场景流,是空间中场景运动形成的三维运动场。两者在视频跟踪与监控,自主机器人导航,三维视频压缩与显示等领域有着广泛的应用。
三、KITTI数据集(非常重要)
对于KITTI数据集,该数据集用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。
四、几种深度学习算法含义
FCNN:全卷积网络:并行,迭代
CNN:FCNN基础上加入空间结构参数共享
RNN:FCNN基础上加入时间结构参数共享
上一条:快速实现人脸识别中的人脸检测
下一条:人脸识别之人脸检测