世界的加快速度进行发展让繁忙的我们无暇思考很多东西,忙碌中的人们总是会因为种种原因而分辨不清身边纷纷扰扰的各种突发情况,曾经火遍大江南北的一首歌中唱到“借我借我一双慧眼吧”,大概唱出了很多人的心声(一不小心就暴露了小编的年纪),而人类无法分辨清楚的情况,如今在人工智能的帮助下终于有了新的突破,虽然依旧无法看清很多场景,但在高科技的帮助下,拥有一双慧眼已经变得不再遥远。而在这背后的高科技就是今天我们要谈的主角——计算机视觉。
人工智能产业链大致上可以分为三个层次:基础层、技术层和应用层,技术层面包括计算机视觉、语言识别、深度学习等。据清华大学多个方面数据显示,计算机视觉作为作为人工智能的三大应用领域之一,占比达34.9%,已在交通、医疗、金融、教育、安防等多个垂直领域得到应用,并成为各行业发展的重要支撑。
在人类的各项感觉中,视觉比听觉、触觉要重要的多,人类大脑皮层的70%都在处理视觉信息,而AI的目标就希望可以让机器能够像人一样思考、处理事情,所以计算机视觉技术承担了很大的作用。随着深度学习的加快速度进行发展,计算机视觉已成为AI领域最重要的技术。相对人类视觉,计算机视觉在速度、感光范围、观测精度、环境要求等方面都存在非常明显优势,尤其是在有害环境下或重复性工作环境下。
计算机视觉发展的数十载,让人类看到了它的强大,而在2012 年出现了一个重要的分水岭,那就是深度学习技术的应用及带来的突破,众多研究人员利用深度学习并在比赛上屡创佳绩,到2017年的识别错误率只有2.3%,比人眼识别的错误率还有低,计算机识别技术对静态图像的识别可以说已经到了一个极高的高度,未来对于计算机视觉技术的期待将从图像识别、物体识别转向其它有待突破的领域,例如计算机视觉理解、视频理解。
视频在当代人的生活中逐渐重要,以当下最火的短视频APP抖音为例,其每日视频播放量过10亿,足以看出视频在我们的生活中无处不在。而在未来几年还会有许多智能设备增加到计算机视觉中,预测到2022年,我国超高清视频产业总体规模超过4万亿元,如此高的市场规模让我们正真看到如何让机器看得懂视频,对于 AI 的技术发展及商业应用有着逐渐重要的作用。
很多人认为,目前社会的发展,计算机能够识别图像已经足够用,视频识别为何还会有如此重要的地位?借用一个比喻,生活是一个动词,而非名词。我们的生活一直在发生着变化而呈现出不一样的动态,所以仅仅能够识别静态已经不能够满足当下我们生活中的各种需要。举例来说,一张照片上有一个人站在路边的角落,但是照片并不会告诉你“动作的叙述”:这个人在那边站了多久?是呆站着还是来回徘徊?也就是说,照片可提供的资讯在某些领域或应用是不够的,例如安防。
近些年,基于深度学习的发展,计算机视觉在AI和深度学习的大背景下,逐步渗透至各行各业,发展前途广阔,有望成为下一个智能时代的标配。安防的计算机视觉应用中,人脸识别和视频监控非常关注,同时还有楼宇对讲、出入口控制、门禁一卡通、防盗报警等技术的应用;在交通领域,则主要是车辆的检测、身份识别与比对、行为分析以及当前热门的无人驾驶和汽车辅助驾驶技术;在金融领域,计算机视觉大多数都用在金融支付验证,包括人脸验证、指静脉验证和虹膜验证等。
迁移学习是 AI 中的一门技术,例如当机器已经看过人奔跑的视频,下次看到一个马在奔跑的视频,也要能够理解这是相同动作,“这就是‘迁移学习’,当机器能够有效率地识别一个行为,再将其大范围应用,将快速缩短开发时间,并可能解决训练数据不足的问题,而将视频理解与迁徙学习结合就是视频识别的一个重要发展趋势,对于 AI 的未来会是很重要,能应用的领域像是安防、无人驾驶、老人照护等。
安防领域通常关注暴力行为及犯罪行为,爬围墙、挥舞手臂等动作可能只有短短 5 秒钟,另外,假设有一个人在人烟的 ATM 附近徘徊,系统侦测他滞留过久,就会向管理者发出警报,这些都牵涉了一段时间跟连续性的动作,为了强化智能安防业务,堃乾智能懂得只是依靠图片作为训练素材,开发出来的安防产品不足够智能聪明,在帮助公安系统解决安检的时候发挥的作用并没有想象中的大,因此必须依靠图片与视频结合,力求构建拥有计算机视觉和深度学习原创技术的领先智能安防平台。
,一遇风云便化龙。从准确率慢慢的升高的图片识别到如今被普遍的应用的视频识别,计算机视觉都担当着重要角色。如何有效地对视频数据来进行静态与动态的双重“智能化”存储、分析以及应用,是助力品牌脱颖而出的重要的条件,因此也成为安防企业新的竞技场。堃乾智能将不断加大研发创造新兴事物的能力,掌握计算机视觉的核心技术,相信随AI落地生花,终将解锁更多场景,在竞争中脱颖而出,为行业应用带来更大的价值。