(MV)是一种使用计算机和算法来解释、分析和理解周围视觉信息的解决方案,是不同技术和方法的组合,大多数都用在自动提取图像信息,为机器在工业和非工业环境中执行给定任务提供操作指导和关键数据。
在应用中,机器视觉系统由多个摄像头组成,这些摄像头分别捕捉、解释信号并将信号发送到控制管理系统。对机器视觉市场的新研究表明,相机、AI和芯片组的进步正在推动在工业应用中使用机器视觉系统的潜力。IoT Analytics预计,从2022年到2027年,机器视觉市场的复合年增长率将达到8%。
机器视觉技术已存在了30多年,但最近的技术转变为进一步拓展其采用提供了新的推动力。
分辨率超过4500万像素的相机现在不仅优于人眼,而且还能以极高的速度拍摄物体且不会失真。相机的进步是引入了“基于事件的视觉传感器”,与视神经处理信息的方式类似,基于事件的视觉传感器仅通过检验测试每个像素的亮度变化就能捕获图像,与传统的基于帧的视觉传感器相比,它可以工作在更黑暗的环境或更恶劣的天气条件下。
从基于规则的机器视觉(基于预定参数的决策)到基于AI的机器视觉的转变(基于适用MV模型输出的决策),这是一个极具影响力的转变。基于规则的MV是“刚性的”,仅适用于可量化、清晰和很具体的特征,例如产品上的某种划痕,它回答了一个yes/no的问题。而基于AI的MV可以为不可量化的特征提供准确的结果,在更广泛的背景和照明设置中识别缺陷,并灵活应对产品外观和缺陷类型的变化(如凹痕或变色)。深度学习作为人工智能的一个更复杂、更强大的子集,也慢慢变得多地应用与机器视觉应用中。
新一代的AI芯片功能更强大,适合处理图像和运行基于AI的机器视觉算法。这些进步有助于将深度学习训练时间从数周减少到数小时。现在,许多智能相机的机器视觉系统都配备了强大的AI芯片,例如ADLINK的NEON-2000-JNX系列内置了英伟达Jetson Xavier NX模块。
随着工业自动化的增加和智能设备数量的增长,物联网设备创建的数据将呈指数级增长。在各种工业应用中,机器学习(ML)可以智能地利用这一些数据,机器视觉(MV)系统能获得有价值的数据,在对有用的数据来进行排序,识别模式后将这一些数据用于分析和改进工业操作,避免决策中出现失误,还能改善预测性维护和使用者真实的体验等流程。
机器视觉取代了人眼,使机器人和计算机能够在视觉上感知和解释周围环境。它们使用先进的成像技术,如相机、传感器和成像处理算法来模拟人类视觉的能力,并使其能用来增强业务流程。这在某种程度上预示着机器可以执行需要视觉检查或分析的任务,从图像或视频流中提取有意义的信息,并使用这一些信息做出智能决策。
目前,机器视觉是极令人兴奋的工业物联网(IIoT)和工业4.0技术之一,它的出现将彻底改变工业供应链的运营。根据MarketsandMarkets Research的说法,2021年,全球机器视觉市场的价值为111亿美元,预计在2022-2027年间将以7.4%的复合年增长率(CAGR)增长,到2027年将达到172亿美元。
这一增长的市场驱动力主要是由于对加强质量控制和检查的需求持续不断的增加。与协作机器人和人工智能(AI)的集成,将极大地提高仓库、制造厂和整个供应链的工业自动化水平。当机器视觉与IIoT(工业物联网)设备集成时,系统实现了更大的独立性和先进的决策能力。两者的结合利用算法来提高机器视觉的智能,制造商可以更好地了解系统操作、工厂和工厂活动,并实施先进的检查流程。
机器视觉在检测中存在广泛的应用。通过AI传感器增强的高性能相机系统,允许在数据源立即分析数据,大幅度减少了向云服务器传输数据的需求,节省了网络带宽。
在制造业中,AI机器视觉常被用于机器人制导系统,机器间可直接相互通信,而不是通过中央企业服务器进行通信。减少了网络上的数据负载,同时提高了数据处理的效率。
机器视觉的另一个显著特点是能够发出警告信号。当要维护和维修时,先进的IoT系统能预测故障及所需的维修措施,避免因设备故障带来的全面停工。
机器视觉通过增加更多的自动化、增强数据分析和交流有必要了解的信息,显著改变了企业的服务模式。通过机器视觉的使用,公司能够创建富有创意、个性化和独特的使用者真实的体验,并推荐合适的产品,进而影响客户的购买行为。
近年来,随着物联网、AI和机器视觉等技术的进步,制造业迎来了一场数字革命。在机器视觉中,一个特别令人兴奋的发展是3D视觉的出现,它有效提升了制造业的效率、精度和自动化程度。虽然我们的人眼通过比较左眼和右眼的视角差异来自然地捕捉深度,但计算机通过硬件和软件解决方案的组合也能实现这一点,因此,3D视觉能使机器从视觉数据中感知深度和三维结构。
目前,已有多种不同的技术方案能轻松实现3D视觉。其中,立体视觉方案是借助放置在不同位置的两个或多个相机来捕捉同一场景,然后通过比较这些图像之间的差异提取深度信息;结构化光方案则是将图案(通常以光的形式)投影到场景上,相机捕捉其变形,通过一系列分析图案的变形方式将获得有关场景中对象的深度和形状的线索;飞行时间(ToF)方法有向物体发送红外光信号,然后测量光反射所需的时间,进而确定被测对象与相机的距离;激光三角测量是3D机器视觉中常用的方法之一,它使用一个有源光源和一个相机,当激光束投射在一条横截面的线上,并被物体的形状偏转,就可以获得被测物的详细轮廓。
ams OSRAM公司的Mira220是流水线式高灵敏度全局快门图像传感器,专为设计工程师提供了工业机器视觉应用的2D和3D解决方案,很适合无人机、机器人、智能锁以及移动和可穿戴设备中的主动立体视觉或3D结构光系统。
Mira220百万像素全局快门图像传感器有效分辨率为1600(H)x 1400(V),帧速率可达90fps,深度为12位。Mira220的先进背照(BSI)技术将传感器层堆叠在数字/读出层之上,这种设计产生的占地面积仅为5.3毫米 × 5.3毫米,非常有利于实现芯片级封装,使制造商能够更自由地优化智能眼镜和VR耳机等空间受限产品的设计。Mira220还有很高的灵敏度和量子效率,像素大小仅为2.79μm,可搭配使用低功率发射器,无惧昏暗的照明条件。
此外,Mira220的功耗非常低,在睡眠模式下仅需4mW,在空闲模式下仅有40mW,即使在90fps的全分辨率下功耗也仅为350mW。Mira220传感器采用MIPI CSI-2接口,可轻松与处理器和FPGA交互,芯片上的寄存器可通过标准I2C接口访问,便于传感器配置。JetCis评估系统采用基于Linux的开放式开发平台,运行在英伟达Jetson Nano嵌入式系统上。Mira220全局快门图像传感器可由JetCis评估系统支持,全部的产品和评估套件均可在Mouser官网上找到。
图1:Mira220高灵敏度全局快门图像传感器原理框图(图源:ams OSRAM)
视觉人工智能(Vision AI)是训练计算机复制人类视觉的系统,为此,设计人员开发了人脸检测器、二维码扫描仪等设备,以人类的方式识别和处理图像和视频中的物体。当研发人员面临新的基于视觉的物联网任务(如物体或人员检测等)的开发时,他们仍然面临着重大挑战。
Basler公司的AI视觉解决方案套件(AI Vision Solution Kit)是一种嵌入式视觉系统,用于物联网视觉解决方案的简单原型制作。该套件主要面向数据科学家和现场应用工程师,其集成的硬件和软件设计包括Basler新开发的物联网软件架构——Basler容器管理和云连接器,明显降低了嵌入式硬件和软件技术的复杂性和对研发人员专业相关知识的要求。
机器视觉领域的新兴技术包括将机器视觉和AI、机器人和智能眼镜相结合,它们能塑造物联网工业应用的未来。3D机器视觉在制造业中的作用已经慢慢渗透到主流产业中,随着人工智能的进步和物联网的扩展,3D机器视觉将在未来几年成为制造业不可或缺的一部分。
机器视觉技术为供应链提供了卓越的改进,通过人工智能的集成使之得到了更有效的增强。这种进步可以看作是AI与机器视觉的完美合作,机器视觉通过准确、快速地提供人工智能做出复杂决策,AI算法还使机器能不断学习,这在某种程度上预示着它们的性能会跟着时间的推移而逐步的提升。对于工业机器人而言,将机器视觉与机械臂拾取解决方案结合使用,可以为机器人提供从包含多个物品的包装中拾取单个物品所需的数据。从本质上讲,机器视觉为机器人提供了灵活的“眼睛”。
在快速发展的市场中,将物联网技术与机器视觉相结合的公司将通过展示创新、灵活性、效率和准确性而脱颖而出。物联网使企业能够更好地利用时间、材料和劳动力,来提升效率。物联网技术和AI、机器学习和机器视觉相结合,为发展和满足竞争市场一直在变化的需求提供了机会。