2020年7月3日 机器视觉与计算机视觉技术

掌握计算机视觉开发技能的8个步骤

如果您最近在社交媒体上关注FaceApp炒作和狂热,并尝试使用此AI应用程序来查看您在成熟的年龄中的样子,那么您肯定会发现计算机视觉技术背后的所有力量。虽然他们还处于初期阶段,我们尚未在各个领域和垂直行业看到更具吸引力和发人深思的计算机视觉用例,但您有机会获得并掌握您的AI技能并通过成为计算机愿景来满足未来的需求大师。在与几位致力于人工智能和计算机视觉项目的开发人员交谈之后,我提出了八个步骤,成为一名出色的计算机视觉开发人员。但是,在深入研究每个步骤之前,让我们看一下计算机视觉技术最适合的案例:

  • 图像分割
  • 物体检测
  • 图像分类
  • 随时间跟踪移动物体
  • 人脸检测和识别
  • 光学字符识别
  • 图像生成

今天计算机视觉专家所需的基本技能:

  • Python语法
  • 数学分析
  • 线性代数
  • OpenCV库
  • TensorFlow深度学习框架

现在让我们回顾一下掌握计算机视觉技能的8个步骤。

Step1:基本成像技术

你可以先看看约瑟夫·雷蒙(Joseph Redmon)所说的“计算机视觉的古老秘密”这个优秀的Youtube系列。然后请务必阅读Richard Szeliski撰写的“计算机视觉:算法和应用”。该书涉及计算机视觉方法,如图像形成和处理,特征检测和匹配,分割,基于特征的对齐,计算摄影,3D重建和渲染。总而言之,它应该成为您的手册和计算机视觉开发世界的重要指南。要从上述书中练习和练习您的知识,请尝试使用此OpenCV工具。该网站还包含许多教程,可帮助您练习GUI功能,图像处理,视频分析,摄像机校准以及解决不同的计算机视觉挑战。

Step2:运动跟踪和光流分析

光流是通过相对于场景移动观察者或对象而获得的一系列对象的图像。参加关于Udacity的计算机视觉课程,特别注意有关渐变渐变的第6课。本课程的重点是在讲座中发展方法的直觉和数学,然后了解问题集中理论与实践的区别。随着课程,再次观看“计算机视觉的古代秘密” 第8集,并阅读Szeliski的书10.5和8.4节。

Step3:基本细分

在计算机视觉中,分割是将数字图像分成若干段(超像素)的过程。分割的目的是简化和/或改变图像的表示,以使分析更容易和更容易。例如,霍夫变换通过投票程序帮助找到特定类形状内的对象的不完美实例。观看这些视频以增强知识:另外,看看这个自动驾驶汽车的车道寻找项目

Step4:拟合

不同的数据需要特定的拟合方法和特定的算法。这段视频会有所帮助!此外,阅读“计算机视觉:算法和应用”的4.3.2和5.1.1节。对于家庭作业,分析检测和跟踪地平线上的消失点。这将有力地提升您的计算机视觉技能。

Step5:匹配来自不同视点的图像

Sean Mullery的这个Youtube播放列表将派上用场。对于家庭作业,您可以使用自己的数据,如从不同角度拍摄的家具图片,并从平面图像相册在OpenCV中制作3D对象。

Step6:3D场景

如果您知道如何从平面图像创建3D对象,则可以尝试创建3D现实。考虑在Coursera上免费提供Stereo Vision,Dense Motion和Tracking课程。要修复新知识,请观看以下视频:对于家庭作业,尝试使用3D场景重建并构建实时应用程序来估计相机姿势,以便在给定2D图像及其3D纹理模型的情况下跟踪具有六个自由度的纹理对象。

Step7:对象识别和图像分类

作为深度学习的框架,TensorFlow使用起来非常方便。它是最流行的框架之一,所以你会发现很多例子。要开始使用TensorFlow中的图像,请阅读本教程。接下来,使用以下链接,考虑探索以下主题:

  • 语义分割:对象,场景,活动的分类
  • 物体检测(非最大抑制,滑动窗口,锚箱)
  • 使用YOLO和Darknet进行实时对象检测,区域提议网络(RPN)
  • 监督图像分类
  • 视觉属性
  • 光学字符和文本识别
  • 人脸检测

对于家庭作业,创建一个TensorFlow神经网络,可以通过图像定义狗的品种。

Step8:深度学习

强烈建议您观看斯坦福大学工程学院的所有16个讲座,这些讲座涉及一系列人工智能和计算机视觉主题,从卷积神经网络到CNN架构,再到检测和分割,再到深层强化学习。

Banner
Related Posts

计算机视觉技术的七个典型应用

2019年4月8日

2019年4月8日

计算机视觉在现实世界中已经有了大量的应用,而且这项技术还很年轻。随着人类和机器继续合作,人类的劳动力将被解放出来,专注于更高价值的任务,机器的自动处理依赖于图像识别的过程。

最全分类!计算机视觉的图像标注类型及应用

2019年10月9日

2019年10月9日

计算机视觉的图像标注种类繁多,应用也不尽相同。想知道各种标注技术的效果吗?一起来看看它们在计算机视觉方面的应用和独特的案例吧!

利用计算机视觉和机器学习技术实现莴苣种植的精准化作业

2019年6月11日

2019年6月11日

Earlham Institute的研究人员开发了一个机器学习平台,使用计算机视觉和航拍图像对莴苣作物进行分类。

CV不只是安防,一文读懂计算机视觉产业链全局

2019年10月31日

2019年10月31日

作为计算机科学的分支,如今计算机视觉(Computer Vision,简称CV)已成为人工智能重要研究领域和发展方向,逐渐形成完整的产业链。

基于田间高光谱图像和机器学习估计芒果成熟度的光谱滤波器设计

2019年8月15日

2019年8月15日

本文旨在通过模拟几个具有不同真实光学滤波器的成像设备,开发一种新型滤波器选择方法,并利用高成本成像高光谱设备为特定应用设计一种成本较低的多光谱解决方案。

CMU的研究人员设计出利用计算机视觉来观察周围角落的新技术

2019年6月20日

2019年6月20日

未来的自动驾驶汽车和其他机器智能系统可能不需要视线来收集极其详细的图像数据:卡内基梅隆大学(Carnegie Mellon University)、多伦多大学(University of Toronto)和伦敦大学学院(University College London)的一项新研究设计出了一种“观察周围角落”的技术。

英特尔深度学习工具包OpenVINO

2019年3月5日

2019年3月5日

OpenVINO包括英特尔的深度学习部署工具包,其中包括一个模型优化器,可以从许多框架(Caffe,Tensoflow,MxNet,ONNX,Kaiai)导入和训练模型。

阴影检测系统让自动驾驶汽车看到周围的角落

2019年10月30日

2019年10月30日

通过分析地面阴影的变化,无人驾驶汽车可以预测何时有车辆或行人从拐角处经过。

研究人员发现用于3D视觉的神经元

2019年7月5日

2019年7月5日

英国纽卡斯尔大学的科学家在昆虫大脑中发现了计算3D距离和方向的神经元。了解这些可能有助于提高和发展机器人视觉应用。

为什么数据科学在高级图像识别中很重要?

2020年1月17日

2020年1月17日

由于视觉和语音是两个至关重要的人类交互元素,数据科学能够利用计算机视觉和语音识别技术来模拟这些人类任务。即使它已经开始模仿和杠杆在不同的领域,特别是在电子商务部门。机器学习的进步和高带宽数据服务的使用增强了图像识别的应用。

视觉系统在零售业4.0中的作用

2020年1月6日

2020年1月6日

技术在零售购物中扮演着越来越重要的角色,这一发展被称为零售4.0。我们来看看计算机视觉是如何推动这场革命的。

机器学习和模式识别之间有什么区别?

2019年10月12日

2019年10月12日

模式识别是机器学习的工程应用。机器学习处理可以从数据中学习的系统的构建和研究,而不是仅遵循明确编程的指令,而模式识别是对数据中模式和规律性的识别。

计算机视觉在钢铁夹杂物分析中的应用研究

2019年12月5日

2019年12月5日

卡内基梅隆大学材料科学与工程学(MSE)教授布莱恩·韦伯勒(Bryan Webler)表示:“夹杂物是一些微小的颗粒始终漂浮在钢中,”。固相夹杂物会聚在一起,堵塞喷嘴和其他控制钢水流动的流量控制系统。一些夹杂物化学成分会降低钢的延展性、抗疲劳性或整体韧性。 “它们会影响钢材的最终性能,这就是我们如此关心它们的原因。”

英伟达Jetson Nano定位于大众市场机器学习

2019年3月20日

2019年3月20日

GPU巨头英伟达(Nvidia)发布了用于大众市场产品的微型人工智能电脑Jetson Nano。

计算机视觉和图像处理之间有什么区别?

2018年8月9日

2018年8月9日

图像处理是计算机视觉的一个子集。计算机视觉系统利用图像处理算法对人体视觉进行仿真。例如,如果目标是增强图像以便以后使用,那么这可以称为图像处理。如果目标是识别物体、汽车自动驾驶,那么它可以被称为计算机视觉。

Comments
发表评论

电子邮件地址不会被公开。 必填项已用*标注