2021年2月24日 机器视觉与计算机视觉技术

图像分类和目标检测技术有什么区别?

图像分类和目标检测技术是计算机视觉领域的重要研究方法。这些技术帮助机器理解和识别实时对象和环境,帮助数字图像作为输入。多年来,计算机视觉技术已经被应用于多个领域,包括医疗保健、制造业、零售业等等。

由于像图像分类和目标检测这样的方法都是围绕着数字图像中的目标识别而展开的,所以常常会留下混淆:这两种技术到底是什么,这两种技术又是如何区别的?

在本文中,我们将了解这两种技术是什么,并讨论使它们不同的各种场景。

图像分类

简单地说,图像分类是一种用于对图像中特定对象的类别进行分类或预测的技术,该技术的主要目的是准确识别图像中的特征。

图像分类的工作原理

一般来说,图像分类技术可以分为参数和非参数、有监督和无监督以及硬分类器和软分类器。对于有监督分类,该技术基于所建立的决策边界来传递结果,决策边界主要依赖于训练模型时所提供的输入和输出。但是,在无监督分类的情况下,该技术根据对输入数据集本身的分析提供结果;特征不会直接输入到模型中。

图像分类技术涉及的主要步骤是确定合适的分类系统、特征提取、选择好的训练样本、图像预处理和选择合适的分类方法、分类后处理,最后对总体精度进行评估。在这种技术中,输入通常是特定对象(如上图中的兔子)的图像,输出是定义和匹配输入对象的预测类。卷积神经网络(CNNs)是目前最常用的用于图像分类的神经网络模型。

图像分类技术的类型

有监督图像分类技术包括并行六面体技术、最小距离分类器、最大似然分类器等。在一篇研究论文中,研究人员提到了以下几种类型的图像分类技术

●基于不同传感器信息的图像分类

●基于训练样本性质的图像分类

●基于数据所用各种参数的图像分类

●基于数据像素信息性质的图像分类

●基于每个空间数据元素生成的输出数量的图像分类

●基于空间信息性质的图像分类。

缺点

●在有监督和无监督的图像分类技术中,缺点是训练阶段需要大量的时间,不适合处理大数据。

目标检测

目标检测的问题定义是确定目标在给定图像中的位置,如目标定位,以及每个目标属于哪个类别,即目标分类。简单地说,目标检测是一种图像分类技术,除了分类之外,该技术还可以从自然图像中的大量预定义类别中识别出目标实例的位置。

这种技术能够搜索特定种类的物体,如汽车、人、动物、鸟类等,并已成功地应用于下一代图像和视频处理系统中。只有随着深度学习方法的出现,这项技术的最新进展才成为可能。

目标检测技术可以应用于现实工程中,如人脸检测、行人检测、车辆检测、交通标志检测、视频监控等。

目标检测的工作原理

传统的目标检测模型主要分为信息区域选择、特征提取和分类三个阶段。有几种流行的基于深度学习的目标检测模型,已被组织和学术界用于实现从图像中检测目标的效率和准确结果。受欢迎的机型包括MobileNet、You Only Live One(YOLO)、Mark RCNN、RetinaNet等。

缺点

近几年来,在受控环境下的目标检测问题取得了很大的成功。然而,这个问题在不受控制的地方仍然没有得到解决,特别是当对象被放置在杂乱和闭塞的环境中的任意姿势时。

Banner
Related Posts

基于田间高光谱图像和机器学习估计芒果成熟度的光谱滤波器设计

2019年8月15日

2019年8月15日

本文旨在通过模拟几个具有不同真实光学滤波器的成像设备,开发一种新型滤波器选择方法,并利用高成本成像高光谱设备为特定应用设计一种成本较低的多光谱解决方案。

计算机视觉和图像处理之间有什么区别?

2018年8月9日

2018年8月9日

图像处理是计算机视觉的一个子集。计算机视觉系统利用图像处理算法对人体视觉进行仿真。例如,如果目标是增强图像以便以后使用,那么这可以称为图像处理。如果目标是识别物体、汽车自动驾驶,那么它可以被称为计算机视觉。

计算机视觉的最佳图像注释平台

2019年5月10日

2019年5月10日

我们一直在寻找最佳的图像注释平台,该平台提供多种功能、项目管理工具和注释过程的优化(当您需要注释50k图像时,每个图像减少1秒钟!)。

研究人员发现用于3D视觉的神经元

2019年7月5日

2019年7月5日

英国纽卡斯尔大学的科学家在昆虫大脑中发现了计算3D距离和方向的神经元。了解这些可能有助于提高和发展机器人视觉应用。

为什么数据科学在高级图像识别中很重要?

2020年1月17日

2020年1月17日

由于视觉和语音是两个至关重要的人类交互元素,数据科学能够利用计算机视觉和语音识别技术来模拟这些人类任务。即使它已经开始模仿和杠杆在不同的领域,特别是在电子商务部门。机器学习的进步和高带宽数据服务的使用增强了图像识别的应用。

富士通发布了新的AI计算机视觉软件以简化行为识别培训

2019年12月5日

2019年12月5日

富士通开发了一种基于人工智能的新方法,可以对视频片段进行行为分析,据该公司公告称,它可以识别出一系列细微而复杂的人类活动,而无需大量的培训数据。

计算机视觉以及它在商业中是如何应用的?

2019年9月17日

2019年9月17日

事实证明,大多数人认为理所当然的东西,即能够看到、处理并对视觉输入采取行动的能力,在机器中是非常难以复制的。这正是计算机视觉(cv)的目标。虽然计算机视觉可能不如人类视觉先进,但它今天已经发展到在商业中非常重要的地步。

计算机视觉软件市场的最新趋势

2018年8月9日

2018年8月9日

计算机视觉软件正在改变各个行业,不仅使消费者的生活更容易,而且让人产生兴趣。作为一个领域,计算机视觉已经获得了大量的宣传和投资。北美计算机视觉软件市场总投资额为1.2亿美元,而中国市场则飙升至39亿美元。

计算机视觉技术的七个典型应用

2019年4月8日

2019年4月8日

计算机视觉在现实世界中已经有了大量的应用,而且这项技术还很年轻。随着人类和机器继续合作,人类的劳动力将被解放出来,专注于更高价值的任务,机器的自动处理依赖于图像识别的过程。

深度学习“瓶颈”已至,计算机视觉如何突破困局?

2018年8月9日

2018年8月9日

从人工智能的发展过程看,深度学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。Alan Yuille认为,现在做AI不提神经网络,成果都很难发表了,这不是一个好势头。

CMU的研究人员设计出利用计算机视觉来观察周围角落的新技术

2019年6月20日

2019年6月20日

未来的自动驾驶汽车和其他机器智能系统可能不需要视线来收集极其详细的图像数据:卡内基梅隆大学(Carnegie Mellon University)、多伦多大学(University of Toronto)和伦敦大学学院(University College London)的一项新研究设计出了一种“观察周围角落”的技术。

增强的机器人“视觉”能够与人类进行更自然的互动

2019年5月9日

2019年5月9日

在伦斯勒理工学院(Rensselaer Polytechnic Institute)的智能系统实验室里,一个名叫Pepper motors的机器人睁大了眼睛,说话轻声细语。其中一名研究人员对“小辣椒”进行了测试,当“小辣椒”准确描述自己在做什么的时候,它会做出各种各样的手势。当他交叉双臂时,机器人从他的肢体语言中识别出有什么不对劲。

英特尔深度学习工具包OpenVINO

2019年3月5日

2019年3月5日

OpenVINO包括英特尔的深度学习部署工具包,其中包括一个模型优化器,可以从许多框架(Caffe,Tensoflow,MxNet,ONNX,Kaiai)导入和训练模型。

用3D绘制世界地图使我们能够用增强现实描绘街道

2019年4月19日

2019年4月19日

如果我们要获得真实的,针对特定地点的AR或精确的机器人交付服务,那计算机需要获得精确的导航地图。

计算机视觉究竟是个怎样的行业?

2019年6月20日

2019年6月20日

5月1日外媒消息,微软刚刚发布了 Windows Vision Skills 的预览版本,是一个 NuGet 包集合。

Comments
发表评论

电子邮件地址不会被公开。 必填项已用*标注