2020年6月30日 机器视觉与计算机视觉技术

计算机视觉究竟是个怎样的行业?

5月1日外媒消息,微软刚刚发布了 Windows Vision Skills 的预览版本,是一个 NuGet 包集合。

微软显然在试图让开发者通过一组简单的API,去解决复杂的计算机视觉问题。目前包含的一组 API,适用于实现特定类型的计算机视觉技能,例如骨骼检测器与情感识别器。

或许未来交友网站将为网上视频聊天的男女提供一项必备增值服务:可以通过对方的表情分析来判断对方的偏好和情绪,这样直男们可以在作死的边缘及时刹车,以免由于莽撞毁了自己终身幸福。

当然,微软的这个做法,是作为一个平台去给独立的开发者赋能。相比之下,中国国内的各家计算机视觉公司,则大多在各自选定的领域越扎越深。

例如,华为的AI研究中心“诺亚方舟实验室”,正在六个方向上苦苦探索:底层视觉、3D视觉、语义理解、数据生成、视觉计算、视觉与多模态的融合;旷视科技的志向是基于人脸识别来构建城市级智能物联网系统;腾讯优图目前给杨姐印象最深的应用就是帮助失散儿童找到亲生父母以及远程医疗看片子——目标应该是远程医疗这个巨大的市场。

当然,还有众所周知的AI独角兽头部企业商汤科技,这家公司已在2018年融到C+轮总共超过16亿美元的融资。

商汤在中国的AI计算机视觉领域里一直是一家独特的存在,融资额最高,落地性最强,产学研的体系最成熟,无论从技术上还是市场上,都有自己的发展路径。

当然,行业里还有别的很多同样做计算机视觉的公司,这里我们不多说了。

目前中国现在的计算机视觉技术已经过了前期埋头只开发技术的阶段,而是到了第二个阶段:落地和打造平台化优势的阶段了,这里我们举个商汤科技的例子。

吹技术没有用,落地才算有价值

FaceU的变脸技术大家已经熟悉:变脸、加特效、搞美颜……据了解,亚太市场80%以上的短视频、相机、直播APP用的都是商汤的技术。不过恐怕很多人并不知道商汤科技还干了些什么。

在这里,杨姐可以提醒大家注意,未来尽量找那些使用了AI卫生管理技术的餐厅去吃饭,因为那样你吃的东西安全性会相对高一点。为什么呢,因为商汤科技搞了一套专门给餐厅用的SenseKitchen智慧餐厨卫生预警系统。

听这个名字就知道了,是一套专门针对餐厨场所合规性分析的智能视频分析产品,可及时发现餐厨违规行为和卫生问题,比如说,厨师带没带口罩,有没有穿工作服戴厨师帽,甚至餐厅里有没有老鼠这个系统都能“看出来”,并且能智能预警,提高监管效率,降低人工审查成本。

坦白地说,其实2018年市场监管总局就发布了《餐饮服务明厨亮灶工作指导意见》,但是大家用脚趾头想也知道,即便餐厅里有个大屏幕直播后厨,又有谁能一直盯着看呢,而且如果按照每门店4路视频计算,一天的存储需要消耗至少1G的资源,多数为本地离散存储,边缘端存储成本高。

据说商汤的这套预警系统已在上海、内蒙应用落地,江苏也即将上线应用,仅上海静安和杨浦区就覆盖百家餐厨,所以未来希望商汤公司也能搞个标志——“商汤舌尖保障之眼”啥的……挂餐厅门口,估计大家就会安心许多。

再举个栗子:“道路千万条,安全第一条,行车不规范,亲人两行泪”大家都是很熟悉的,但却总有人不那么自觉。

商汤想了个办法,他们搞了一套司机监控系统——SenseDrive DMS。这个系统的最大功能就是通过扫脸来判断司机是不是疲劳了,开车有没有分心,还能对司机的身份进行识别。试想一下,如果滴滴要求所有快车司机都装一套,是不是还能判断出是不是有人借别人的车接活?

目前遍布上海各区域的上百条“驿动班车”线路中,已有38条线路车辆完成了应用这套系统的智能化改造

但是,以上仍然还只是小意思,接下来姐给大家讲个斗智斗勇的故事,非常有趣。

要斗智斗勇 不要伪需求

大家都知道房地产这个行业成交金额大,但是恐怕很多人不了解,房产中介和房地产公司自己销售提成是不一样的哦!

一般来讲,房地产公司在开一个新的楼盘时会同时安排销售员和中介进行销售,楼盘销售员的销售提成较低为0.1%-0.5%,而房产中介的销售中介费就比较高,大约能到3%-4%。这里面可就有了10倍左右的空间。

假如一套房子100万,如果是房产公司的销售人员卖出去,至多赚几千,而中介就能多赚个三四万。这样的不均衡也就造成了售楼销售员与中介之间逐渐达成了“潜规则”,对销售员来说最好的选择当然是把房子交给中介卖,然后两个一起分更高的提成了。

这件事肯定很令房企不开心,地产行业里称之为“飞单”。但是不开心也没用,如何识别出这种不规范的黑行规绝对是“不可能完成的任务”。然鹅,这件事却让人工智能给轻松解决了。

商汤科技的办法是,加入基于人脸的身份验证,通过人脸识别和标签化管理来“盯”违规行为,同一个客人再次到访的客户历史明细,到访是否有销售人员陪同,初次到访是否有报备等等,如果系统显示中间异常换人……吼吼,就可以坐下来聊聊了。

听说商汤这套智慧案场解决方案系统目前已经帮助融创、世茂、奥园、万科等大佬规范了案场销售。截止目前,商汤这个“智慧案场”解决方案已经累计抓拍100多万人次,机拍次数达到4000多万。

商汤科技智慧案场解决方案Demo展区

所以,大家了解了吧,商汤科技早就不是单纯的“识脸”了,而是利用人脸识别技术为基础,让更多人工智能解决方案巧妙地解决各个行业切身痛点的公司。当然,这并不是一蹴而就的,也不是谁想做就能做的:他们还有自己“挑客户”的原则。

他们最大的拒绝理由,就来自“真假需求”这个维度。

举个栗子,空调厂商,不是董明珠阿姨那个哈,曾经跟商汤科技提出个想法,如果能通过人脸识别,给老人自动把空调设成28度,给年轻人设定为24度,温度自适应,岂不是美哉?这个需求就被商汤认为是个“假需求”——如果老人和年轻人在同一个屋子里出现呢,那到底该怎么设定?更何况,这原本是遥控器就能解决的事,真心用不着人脸识别,且不说安装系统的成本相对于带来的方便程度来说,实在太撕裂人心了。

再举个栗子,比如说一个公园曾经也提了个需求——很多人在公厕里一次拿好多手纸,能不能做个人脸识别的系统,每个人一次最多拿十张?艾玛,面对这个灵魂拷问的要求商汤感觉实在没法答应,虽然这个需求是真的,但在经济上很不划算,因为这套系统的成本要远比厕纸要贵很多倍好么——这个案例其实跟超市里也想用人脸识别来管理存包柜差不多。

燃鹅,超市却有个不同之处,就是如果安装了人脸识别反馈信息的屏幕,是可以运营这个屏幕用来卖广告的——毕竟来超市的都是有购物需求的人,如果能识别他们,并且根据过往采购需求来推送一些相关广告,肯定是大受广告主欢迎的。

这个想法不错,据说正在酝酿中——未来还真有可能落地。而在杨姐看来,这绝对是可行的,因为在无人驾驶的公交站上,已经有厂商正在计划通过人脸识别来让站台的大屏幕上进行千人千面的广告推送。

所以,商汤的未来应该是向着这种针对行业、场景的解决方案提供商发展。而关键的问题是,商汤的解决方案最大的特点在于能够让这些应用场景更加“低成本”。就如同智慧厨房那个案例,由商汤来统一解决云端存储和计算,餐厅无疑最为轻松。

商汤科技联合创始人、副总裁杨帆认为,任何一个行业或企业自己去做智能化投入成本都太高,只有很少的大公司才搞得起。那么大量的中小公司怎么办?就需要商汤这样的公司来提供平台化的能力,并且可以同时跨很多个行业,70%-80%的能力都是可以共享的,个性化的只需要做20%-30%,这样能够大大降低行业的边际成本。

商汤的方法论

商汤身上有三个标签:产学研一体化、打破行业边界和原创型公司。

相比其他行业,人工智能对于产学研的需求非常高,结合非常紧密。而商汤可以说在产学研的结合方面有自己独特的优势,高校联合、学术体系等,都成了商汤不断加强自己核心竞争力的关键入口。

比如说去年上海人工智能大会上,商汤联合麻省理工学院、清华大学、上海交通大学、南洋理工大学等全球15所高校共同发起“全球高校人工智能学术联盟”,打造世界顶尖的人工智能学术交流平台,持续推动国际学术交流与人才培养。

商汤科技还联手麻省理工成立MIT-商汤科技人工智能联盟,共同致力于全方位人工智能原创技术的研发,涉及领域包括计算机视觉、脑科学智能算法、医疗图像、机器人等。此外,商汤与香港中文大学、清华大学、北京大学、浙江大学、上海交通大学等高校也有深度合作,不仅让高校人才深度参与工业界的技术落地研究,也形成了商汤科技人才供给的保障。

这绝对是一个以“智力”“技术”为生产力的行业,而产学研所带来的人才效应的结果就是——在去年美国盐湖城举行的全球计算机视觉顶级会议 IEEE CVPR 2018 (Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议)上,大会总共录取了来自全球论文979篇,商汤科技一家就有44篇论文入选,全球范围内仅次于谷歌的45篇。

所以,制造业的核心竞争力是规模优势,但在AI这个领域,真的是产学研能力决定了未来的高度和远度。

而这个行业的另外一大特征就是“没有边界”!

人工智能是个全新的行业,各种场景和应用都需要去挖掘。美国之所以领先全球,就在于强大的技术基础和资源实力,不断进行边际的拓展和创新的尝试,而其他国家一直都是跟随者。

相比其他AI企业,商汤的业务范围可谓是最广,最关键的是这个公司还盈利。而商汤所做的事就是不断深化下沉一些相对成熟的场景,同时更多地拓展新的应用和落地,就像前面杨姐写的那些案例,已经都在各个行业开始深度扎根场景。

所以,商汤目前所做的事,更像是一家具备强大研发中心和先进制造设备的生产工厂大平台,各种满足不同行业需求、可定制化满足细分场景的人工智能应用和解决方案就像流水线一样,源源不断地被快速生产出来。

而商汤拓展业务遵循的工具链理论:70%的成熟技术和产品+30%的创新,也成为了其持续打破行业边界,快速满足客户应用需求实现应用落地的关键。所以,计算机视觉这个细分行业里,在很多方面商汤都已经走在了前端。

杨姐点评:

“原创能力”决定企业的高度

无论对于人才,还是对于技术的开发,强大的超算和深度学习平台都是必须的,人工智能算法往往就是做实验,别人需要花费几个月完成的事,有了强大的算力和定制化开发之后可能只需要几周。

行业里有很多国外巨头的开源算法可以快速、低成本转化为应用,但局限性极大,如场景受限、精度受限、无法定制化等(比如:如果对精准度的要求不高,这个技术可能很快普及,比如做到给小孩子的玩具中。但如果精准度要求很高,比如应用到银行、医疗、安防等行业场景中时,对算法的要求就会变的很高)。

相比之下,商汤选择了一条最难走的路:不惜重金和资源打造超算和原创深度学习框架,其实说穿了就是想在源头掌握核心优势,把原创能力牢牢把握在手中——这就像是会用Word和懂写Windows的分别。

所以,商业案例看多了,很多公司的计划都是基于一些美好的设想。然而中国的创业公司最怕的就是走上伪需求的错误道路,并且陷入自嗨,最终一番热闹之后,一哄而散。而当有很多公司都在标榜自己是XX人工智能公司的时候,大家也不妨从几个方面来看看,这家公司究竟是不是真的具备高度、远度和温度。

来源: 小白不菜 作者:杨阳

Banner
Related Posts

用3D绘制世界地图使我们能够用增强现实描绘街道

2019年4月19日

2019年4月19日

如果我们要获得真实的,针对特定地点的AR或精确的机器人交付服务,那计算机需要获得精确的导航地图。

图像处理中的深度学习技术

2018年8月9日

2018年8月9日

机器学习中的另一种技术是例如“超级矢量机”。与深度学习相比,必须手动定义和验证功能。在深度学习中,神经网络采用这一手动步骤:在训练过程中,独立地自动识别和提取特征。

研究人员发现用于3D视觉的神经元

2019年7月5日

2019年7月5日

英国纽卡斯尔大学的科学家在昆虫大脑中发现了计算3D距离和方向的神经元。了解这些可能有助于提高和发展机器人视觉应用。

深度学习“瓶颈”已至,计算机视觉如何突破困局?

2018年8月9日

2018年8月9日

从人工智能的发展过程看,深度学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。Alan Yuille认为,现在做AI不提神经网络,成果都很难发表了,这不是一个好势头。

计算机视觉和图像处理之间有什么区别?

2018年8月9日

2018年8月9日

图像处理是计算机视觉的一个子集。计算机视觉系统利用图像处理算法对人体视觉进行仿真。例如,如果目标是增强图像以便以后使用,那么这可以称为图像处理。如果目标是识别物体、汽车自动驾驶,那么它可以被称为计算机视觉。

从摄像机到云端:计算机视觉如何将数据转化为行动

2020年1月8日

2020年1月8日

商业上的成功通常归结为根据突然的市场变化做出快速决策。计算机视觉(一种在AI领域中崛起的快速技术),可以帮助商用机构和其他企业才做到这一点。

增强的机器人“视觉”能够与人类进行更自然的互动

2019年5月9日

2019年5月9日

在伦斯勒理工学院(Rensselaer Polytechnic Institute)的智能系统实验室里,一个名叫Pepper motors的机器人睁大了眼睛,说话轻声细语。其中一名研究人员对“小辣椒”进行了测试,当“小辣椒”准确描述自己在做什么的时候,它会做出各种各样的手势。当他交叉双臂时,机器人从他的肢体语言中识别出有什么不对劲。

计算机视觉技术的七个典型应用

2019年4月8日

2019年4月8日

计算机视觉在现实世界中已经有了大量的应用,而且这项技术还很年轻。随着人类和机器继续合作,人类的劳动力将被解放出来,专注于更高价值的任务,机器的自动处理依赖于图像识别的过程。

掌握计算机视觉开发技能的8个步骤

2019年8月5日

2019年8月5日

在与几位致力于人工智能和计算机视觉项目的开发人员交谈之后,我提出了八个步骤,成为一名出色的计算机视觉开发人员。但是,在深入研究每个步骤之前,让我们看一下计算机视觉技术最适合的案例:

利用计算机视觉和机器学习技术实现莴苣种植的精准化作业

2019年6月11日

2019年6月11日

Earlham Institute的研究人员开发了一个机器学习平台,使用计算机视觉和航拍图像对莴苣作物进行分类。

神经科学与计算机视觉合作可以更好的理解视觉信息处理

2019年5月8日

2019年5月8日

神经科学家和计算机视觉科学家表示,一个空前庞大的新数据集将帮助研究人员更好地理解大脑是如何处理图像的。

计算机视觉在钢铁夹杂物分析中的应用研究

2019年12月5日

2019年12月5日

卡内基梅隆大学材料科学与工程学(MSE)教授布莱恩·韦伯勒(Bryan Webler)表示:“夹杂物是一些微小的颗粒始终漂浮在钢中,”。固相夹杂物会聚在一起,堵塞喷嘴和其他控制钢水流动的流量控制系统。一些夹杂物化学成分会降低钢的延展性、抗疲劳性或整体韧性。 “它们会影响钢材的最终性能,这就是我们如此关心它们的原因。”

利用机器学习消灭撒哈拉以南非洲采采蝇

2018年8月9日

2018年8月9日

“我们将使用数据科学来创建一个基于机器学习的自动化系统,它可以从采采蛹中快速确定是雄性还是雌性,”Zsuzza Marka说。这一系统将成为机器人分拣机的基础,我们希望该机器最终将用于撒哈拉以南非洲地区,以减轻采采蝇的危害。”

英特尔深度学习工具包OpenVINO

2019年3月5日

2019年3月5日

OpenVINO包括英特尔的深度学习部署工具包,其中包括一个模型优化器,可以从许多框架(Caffe,Tensoflow,MxNet,ONNX,Kaiai)导入和训练模型。

推动计算机视觉和视觉AI发展的四大关键趋势

2019年5月14日

2019年5月14日

本文讨论了推动视觉应用快速发展和影响行业未来的关键趋势,解释了这些趋势背后的推动因素,并强调了对技术供应商、解决方案开发者和最终用户的关键影响。

Comments
发表评论

电子邮件地址不会被公开。 必填项已用*标注