多年来,宠物食品制造商使用机器视觉软件来验证狗粮和猫粮包装上是否存在独特的字符、代码、颜色和图形形状。然而,如今,这些公司可以通过使用深度学习视觉软件验证包装上是否有狗或猫的图像来补充这一过程。

与传统的图像处理软件不同,依赖于特定于任务算法,深度学习软件使用神经自学习算法的多层网络来基于那些被人类检查员标记的那些识别好的和坏图像。这些数据集(通常包含每个缺陷类型至少100个图像)通过网络馈送以创建分类每个输入图像内的对象的模型,并确保高水平的可预测性。

为了验证宠物食品包装上的特定动物照片,复杂的神经网络必须在训练阶段后几个层次模仿人类判断。低层算法检查图像,如简单的形状,如边缘,在更高层算法上专注于更复杂的特征,如面,四肢,爪子和尾巴。然后,其他高层算法辨别所有照片变形,背景,照明条件,观点和障碍物。最后,顶层算法给出了图像中的类型的动物的概率,并验证它是存在的或不在特定的动物食品包装上。所有四个步骤都在0.5到1秒内完成。

“许多节点构成每个神经网络层,每个节点都是单一决定,”康涅狄格公司的视觉软件营销总监John Petry解释说:“一起,他们认识到所有类型的图像模式并作出判断决定是否图像很好或没有。“

机器愿景的深度学习软件已经存在十多年,但它只是在过去几年中,它已成为用户友好和可行的。在此短时间内,若干行业的制造商已经开始使用它在应用中的应用中,作为检测手术器械的焊缝,验证汽车座椅组件中多个部件的存在并识别反射金属表面上的不同缺陷。

软件供应商表示,这些例子代表着第二次机器视觉革命的开始。在这个领域,深度学习不仅对机器视觉的各个方面都有积极的影响——比如精度、摄像机性能和灯光控制——而且,这种技术还使完成过去很难完成或需要太多投资的应用成为可能。

起源和开放

深度学习的概念对于机器视觉来说是相对较新的,但对于机器学习来说绝对不是新的。深度学习是机器学习的一种特殊类型,是人工智能(AI)的一种。

“当前神经网络算法用于深度学习都很好,但是他们还没有在人工智能的水平如果使用图灵测试作为晴雨表,”汤姆·布伦南解释说,阿耳忒弥斯总统愿景,丹佛的积分器,使用深度学习在一些医疗设备和制药应用。

图灵测试要求机器或技术表现出相同的行为。“AI级算法是那些可以直接回应人类级别智能的任何问题的算法,”布伦南说。

计算机愿景的初始深度学习架构是在20世纪80年代在kunihiko fukushima引入的新密架。一个人工神经网络,新ocockitron已被用于手写字符和模式识别任务,并作为常用于分析视觉图像的更复杂神经网络的基础。

开源深度学习软件最早出现在20世纪90年代,当时出现了许多关键的算法突破。从那时起,计算机科学家已经能够更好地利用巨大的计算能力和数据,这对制造神经系统是至关重要的
网络很好地工作。在线上可用的开源软件包括
C / C ++和Java库,框架和工具包。

“十年前,当深度学习软件和相关的硬件的能力较低时,它需要大约两周时间来训练软件进行深度学习,”安迪斯的龙头,CENO的CERS的CENO。“到2014年,大约两天时间,现在需要不到一天。”

雄心勃勃的集成商和制造商倾向于使用开源软件启动,因为它不需要许可或特许权使用费。在缺点方面,供应商提供很少的技术支持,最终用户必须在网络训练开始之前仔细分类数百到几千个数据集图像。

Petry指出:“那些以开源软件开始深度学习实践的公司需要一个真正的内部专家,比如工程学博士。”即便如此,用户也可能需要6到12个月的时间才能将软件应用到应用程序中。还有一个问题是,当需要检查不同的部件或装配过程发生变化时,必须重新制作软件。”

Brennan表示,Artemis使用了两个深度学习应用程序的开源软件。在这两种情况下,Artemis工程师需要按照Brennan的“约2%”略微修改和调整软件,以完全适合每个应用程序。

一个好选择

随着制造商对更智能、准确和可重复视觉系统的需求,深度学习软件越来越受欢迎。最终用户也喜欢这个软件可以在几分钟内自动编程视觉系统的事实。

深度学习最适合涉及可变形物体而不是刚性的应用程序。另一个好的应用程序正在验证在组件内具有颜色和纹理变化的许多部件的存在。此外,而传统的软件需要对正在检查的部件进行特定的公差范围,最好的深度学习是最大的,最明显标记的良好和坏部分图像的最大和最明显标记的数据集。

虽然深入学习通常被认为是化妆品检查应用,但PETRY说,它也非常擅长确认在套件中存在多个物品。例如,确保一条外科管道是医疗套件的一部分,无论管道所在的位置还是其对照相机的透视图。

“基本上,深入学习是应用统计的大型运动,”布伦南说。“每个节点[在神经网络中]的任务是统计地确定与良好或坏部分相关的图像数据。神经算法并不是聪明的,但它已经学会了以某种方式执行预处理操作,帮助软件产生与人类告诉它是正确的结果的结果。“

供应商表示,对许多公司来说,深度学习已经从实验阶段进入了体验阶段。这些制造商已经亲身体会到,并不是每一个应用程序都适合深度学习,而且它也不是使公司能够解决所有视觉应用程序问题的圣杯。

最终用户通常希望对特定的应用程序使用深度学习。然而,供应商知道必须进行几次测试才能确定这是最佳选择。软件供应商表示,深度学习软件比标准软件灵活得多。布伦南对此表示赞同,尤其是在照明方面。他说,深度学习通过减少图像的可变性来更好地控制光照。

“神经网络算法可以在明亮或昏暗的灯光下辨别好的和坏图像,”他指出。“他们可以学会认识到这些照明差异并不重要,准确地分类好和坏部分。”

Teledyne Dalsa亚太区技术总监布沙尔(Yvon Bouchard)表示,深度学习主要用于确保装配过程中的质量,尤其是在零件加工和最终表面检查等任务中。有时它也用于帮助“姿态估计”,或估计一个对象的位置和方向。这适用于当零件组装可能没有固定,或零件方位需要确定之前,它可以操纵。

Teledyne Dalsa的Sherlock 8.0软件是一款快速应用开发工具,使用传统的图像处理功能,并具有深度学习功能。该公司还为制造商的独特和高要求的视觉应用开发定制软件,优化深度学习模型。

“Sherlock软件更适合希望在环境中进行自己的培训,以简化基本视觉和深度学习过程,”Bouchard解释道。“关键点是该软件允许最终用户访问所有标准工具以及深度学习,以生成特定的解决方案。在许多应用中,传统的视觉工具执行部分检查任务和深度学习处理的检查,这些方面太难以编码。“

Sherlock软件与具有单色或颜色格式成像器的区域和线路扫描摄像机兼容。它直接连接到FireWire,GigE和USB相机。

Cyth Systems早在2008年就推出了第一个版本的神经视觉(NV)软件,但由于当时的硬件和技术限制,它的表现并不如公司所希望的那样。然而,到2014年,第三代NV已经开发出来,并被证明更有能力解决复杂的视觉问题。今天,将近80%的Cyth客户在他们的应用程序中使用深度学习。

长长表示,这些客户包括汽车,食品,航空航天,白色和电子制造商。后两次使用深度学习进行装配验证,而航空航天公司则依靠它来确保完美的内容座位和发动机。

“几年前,一位有机食品种植者开始使用我们的深度学习软件,以更好地对其具有过多颜色变化的水果和蔬菜进行排序,”很长。“在汽车行业中,一位客户使用深度学习来验证每个座椅组件与正确的车辆一起使用。一些座位在头枕中有一个麦克风,麦克风在头枕的每个训练照片上圈出,所以软件知道要找的东西。“

电子客户使用深度学习来组装和分类PCB,电阻和晶体管。食品制造商依靠它,以确保包装始终具有最佳美学,并包含正确的食品。

在医疗领域,Artemis开发了一个深入的学习应用,帮助制造商在将金属销连接到外科工具的端部钳口的焊接中进行卧铺。该工具密封截止血管以防止出血。

焊接在小型,粗糙的表面积上手动完成,并在使用深度学习软件之前通过标准机器视觉验证。这两项检查都在小型测试工作站中进行。

另一个Artemis项目涉及使用深度学习软件来检测玻璃瓶中的微小缺陷。药物最终用户需要完美的小瓶,握住材料而没有任何泄漏的机会。Brennan表示,Artemis转向深入学习,因为它更好地定位缺陷,只能在某些角度下出现在照明下。

Petry解释说:“深度学习是保证产品质量的一种好方法,比如在人们通常执行某种类型检查的应用中。”“它也非常适合在整个产品制作完成后、包装之前进行装配验证。例如,汽车前灯,徽章和车轮,装满各种各样的食物或糖果的盒子,以及装有支架、导管和夹子等物品的手术包。”

两年前,康涅克斯始于提供Vidi深入学习图书馆,去年与VisionPro一起提供,其旗舰视觉软件产品。该套件有四种基本工具:化妆品检验,零件位置,分类和光学字符识别(OCR)。

康耐仕ViDi可可靠地读取许多具有挑战性的日期和批号,以及压花和蚀刻文本。它还能自动检查复杂花纹织物并识别缺陷。

ViDi Blue-Locate算法定位零件,计数托盘上的半透明玻璃医疗药瓶,并对套件和包装进行质量控制检查。通过学习有目标区域的不同外观,Vidi红分析分析细分缺陷或其他感兴趣的区域。

Vidi Green-Classify识别基于包装的产品,或对焊缝质量等可接受或不可接受的异常进行分类。最后,Vidi蓝色读取Deciphers使用OCR严重变形,偏斜和蚀刻差的码。它的预制字体库识别大多数文本,无需额外编程或字体培训。

一个Teledyne客户最近使用深度学习软件来解决它具有涉及小螺钉的自动装配过程的问题。由于螺钉不正确,公司定期面临停机时间,从而导致螺钉将夹住部分进入组装的跨螺纹情况。

Bouchard指出:“尽管一些传统的软件可以检测螺纹特性,但在这种情况下,问题是螺纹尖端已经通过模具和锥形尖端头在主体上螺纹。”“深度学习是一个更好的选择,因为尖端的过渡区可以有无限种可能的形状。视觉系统可以显示成千上万个螺钉头的好和坏的例子,使它更容易快速决定它是好还是坏。”

改变挑战

深度学习给最终用户带来了挑战,传统视觉软件很难解决这些问题。Bouchard认为,大多数用户都不知道怎样才能通过深度学习获得成功。

“到目前为止,主导问题是缺乏高质量,适当的图像,”笔记Bouchard。“典型的深度学习应用程序需要数百甚至数千个图像样本。在更困难的情况下或自定义应用程序中,培训模型可能需要高达一百万或更多的图像样本。“

长时间说,制造商对深度学习的期望是一个理想主义和现实主义的混合袋。这就是为什么他向每个客户解释其限制和基本过程。Cyth还对每个申请进行了愿景研究,以了解它是否真正是深度学习的候选人。

“该公司将零件发送给照片,我们生成50到100个每个部分的好的和坏图像,”很长的解释。“在我们的测试之后,我们让他们知道基于虚假否定百分比的深度学习的成功概率。太多错误的否定是烦人的,但太多的误报可以导致产品质量问题。“

与其他软件不同,Cyth的神经视觉平台从生产环境中捕获图像,并将这些标记的数据集发送到云以进行脱机处理。然后将图像送回PC,软件培训用于大部分部件的深度学习检查。

长表示图像由红外线,3D,线路扫描或智能摄像机捕获。该软件仅需要25毫秒来分析图像并决定该部件是否好(绿色检查)或坏(红十字)。

据龙,任何有产品知识的人都可以训练系统功能,并且始终如一地训练系统
提供可重复的结果。该软件还让最终用户轻松推出新的应用,参考旧应用,并访问所有检查结果进行统计分析。

Inspekto的S70自主机器视觉系统使用一系列深度学习引擎作为其插头和检查软件的一部分。它可以快速(30到60分钟)和成本有效地安装和设置,无需在任何阶段都需要积分商或人工智能专家。紧凑型系统包括先进的视觉传感器和透镜,照明设备和一组可调节臂。

最终用户无需设置任何质量保证参数,因为系统自主地适应所检查的物品。此外,由于系统掺入生产线和足够的强大而不受任何周围环境和环境影响的鲁棒,因此消除了将特殊结构到位的需要。

该系统已经在欧洲的植物中,每天为Mahle等领先的汽车零件制造商检查数十万产品。据Inspekto的首席技术官Yonatan Hyatt称,它提供了一种越来越多的应用,包括完全归档和可追溯性,并且准确地消除了需要采取脱机的产品,以便在Inspekto的首席技术官。此外,该系统可用于手动组装线,以确保操作员正确执行每项任务。

“非自治机器视觉系统的最终用户与视觉质量保证解决方案没有直接的互动[该集成商]为生产线开发,并且[可能]对当代深度学习软件的预期有限,”首席执行官Harel Boren说Inspekto。“但是,他们希望软件[提供]整合者承诺的解决方案。或者使用深度学习发动机阵列的自主视觉系统将彻底解决他们的问题。“