人工智能无疑是2017年领域最火热的关键词,从各方面表现看,AI在2017年走向了新的拐点,很大程度上预示着人工智能的商业红利期即将来临,AI在所有的领域的应用开始爆发。
在此背景下,作为人工智能(AI)三大领域之一的计算机视觉近期也慢慢变得受到人们的关注。而计算机视觉作为一种人工智能的基础技术应用,使用场景多样,市场潜力巨大。因此在人工智能的牵引下,计算机视觉赋能视频行业也走进了智能化的时代。
视频行业在进入智能化之前,在互联网的影响下,还经历了三个阶段的变化:首先第一个阶段是传统视频时代,还处在以线下的电视、电影作为视频传播为主的阶段,没有办法进行交互,也无法自主选择内容;后来进入了互联网时代,开始涌出像优酷、土豆、爱奇艺等网络视频平台,用户利用互联网在平台上可以再一次进行选择观看内容,这是第二阶段;直到2016年直播的迅速爆发,让视频行业进入了第三阶段,也就是C2C传播时代,像斗鱼、YY、映客、秒拍这一些平台的特点是传播速度快、精准化且碎片化,因为技术背景是H5的链接,所以用户能随意地去发送。
那么接下来就是进入了现在的智能化时代,在人脸识别、深度学习等犹如雨后春笋一般成为行业热词的背后,技术导向型新锐公司的不断涌现,计算机视觉技术升级视频行业,让视频在安防、广告营销、新零售等领域全面升级开花,因此我们今天就来盘点,计算机视觉有哪些实际能应用到视频场景中的技术呢?
安防领域成为【计算机视觉+视频】结合的第一着陆点。这主要源于安防本身的两大特性:首先,以视频技术为核心的安防行业拥有海量的数据来源,可以充分满足人工智能对于算法模型训练的要求;其次,安防行业中事前预防、事中响应、事后追查的诉求和AI的技术逻辑完全吻合。
目前【计算机视觉+视频】在安防领域的应用其实是涉及对人脸、车辆的识别,包括生物特征识别技术、大数据及视频结构化技术等。其中,生物特征识别包含了指纹识别、虹膜识别、人脸识别、步态识别等,前两个主要使用在于特定场景的身份认证居多;而关于视频结构化技术,目前则主要融合了机器视觉、图像处理、模式识别、深度学习等人工智能技术,这也是视频内容理解的基础。并且在公安、交通、楼宇、金融、工业、民用等多个领域都有应用场景。
例如,公安行业用户的需求是在海量的视频信息中,发现嫌疑犯的线索。要实现这个需求,仅仅用摄像头捕捉到嫌疑人是远远不足的。它需要智能的前端摄像机实时分析视频内容,检测运动对象,识别人、车等属性信息;然后需要汇总海量的城市级信息到后端人工智能的中心数据库进行存储,再利用计算能力及智能分析能力,对嫌疑人的信息进行实时分析,最终给出最可能的线索建议。
从目前市场现在的状况来看,安防领域巨大的市场规模和可观的营收利润前景,也恰恰使其成为众多巨头以及勇于探索商业模式的公司的必争之地,其中传统巨头以海康威视、大华股份领衔,积极布局芯片、算法等上游关键技术领域,一方面也在向下游整合集成商或运营商业务延伸。
而在从计算机视觉切入的创业独角兽公司有在今年7月完成4.1亿美元B轮融资的商汤科技,以及在16年年底完成亿级美元C轮融资的旷视科技等企业,都是具有技术算法优势但较难独立实现商业化,前期多通过与传统巨头合作的方式实现市场布局。
什么是新零售,马云给出的定义是通过运用大数据、人工智能等先进的技术手段,对商品的生产、流通与销售过程进行升级改造,进而重塑业态结构与生态圈,并对线上服务、线验以及现代物流进行深层次地融合的零售新模式。
在各家的解决方案中,被提及最多的是基于卷积神经网络的视觉识别技术,那么计算机视觉在新零售领域如何与视频做结合呢?
即通过深度学习教会计算机认识商品,消费者自助购买时,计算机通过店内摄像头识别商品的类别价格,消费能轻松实现自动扣款,无需消费者人为结账。
计算机视觉赋予视频强大识别技术,为新零售推出完整的解决方案,集成人脸识别分析引擎,验证用户身份,引导新用户进行支付方式绑定及身份/信用信息录入。同时结合人脸属性分析技术,判断用户的性别、年龄等信息,生成用户画像。追踪用户行走的线路,结合人脸识别技术,收集用户在货架前停滞时间的长短,识别用户拿取和放回的行为动作和商品,分析不同用户的购物倾向和喜好。通过大量用户图像行为数据的分析,为商家提供商品货架布局摆放的建议。
比如亚马逊推出新型概念店Amazon Go,通过AI、深度学习等高科技,顾客只需下载Amazon Go的APP,在商店入口扫码成功后,便可进入商店开始购物。Amazon Go的传感器会计算顾客有效的购物行为,并在顾客离开商店后,自动根据顾客的消费情况在亚马逊账户上结账收费。其中涉及了计算机视觉、传感器、深度学习等技术,核心在于识别动作、商品和人,通过位置或姿势进行关联,亚马逊也形象地称之为“just walk out”技术。
伴随视频行业的发展及变化,特别是移动视频的快速地增长,互联网视频广告及营销的方式也随之变迁,同时,广告收入依然是在线视频行业收入的中流砥柱。而视频广告营销的逐渐升级,广告主的投放决策也不再仅仅是蜻蜓点水、浮于表面的简单植入。那么视频网站无论从用户基数还是增长速度来看,无疑都拥有巨大的想象空间。
在这样的背景下,产业链相关公司开始着眼为广告主提供更多元的内容营销形式、更高的广告投放效率以及更精准的广告投放策略,视频的商业经济价值被进一步挖掘。在这样的背景下,产业链相关公司开始着眼为广告主提供更多元的内容营销形式、更高的广告投放效率以及更精准的广告投放策略,视频的商业经济价值被进一步挖掘。其中,Video++基于AI的智能算法,将视频内容具有广告价值,打造视频内的创意互动形式成为业内新宠。
Video++所打造的消费级视频对于大多数人来说是一个陌生的概念,消费级视频可以指现在视频类别下的直播、电影、综艺娱乐节目、电视剧等拥有复杂场景、经过后期大量加工的视频。随着网络的发展壮大,很多产品的数据都利用互联网和云端进行传输和存储,数据量大也使得消费级视频的商业经济价值的潜力变得巨大。视频本身是一片广告的蓝海,这里面有很多商业变现方式,在不打扰使用者真实的体验的同时,加入一些娱乐互动方式,可以让用户在参与中完成了一种电商或广告商业经济价值转化。
对于视频来说内容层是最特别的,在内容上,AI 可以让机器拥有人的思维,将视频传到机器上进行识别分析时,可以识别出明星、物体、品牌、手机、场景等等,使机器像人类一样理解视频的内容,并发现其中有趣的点。到了逻辑层和应用层,可以用核心组件和视频应用将这些点进行商业化的变现,将机器识别出的结构化数据作为投放点,应用到广告和电商的场景中。
今年,Video++与搜狐进行深度合作,Video++为搜狐提供消费级视频领域的AI辨识技术服务、全套视频结构化数据应用系统,并为其打造整体的视频AI数据应用方案,基于视频AI数据的应用(元信息筛选、价值权重函数检索等),搜狐与Video+在内容营销产品上进行深度合作,为广告主提供内容营销解决方案,让搜狐的各种精彩内容得到充分的广告场景挖掘。
当计算机视觉遇到同样呼声很高的视频广告营销,技术与创意完美结合,连接品牌和用户,形成多样式的互动广告、场景营销,有了AI的赋能,“视”界将会被颠覆,视频消费场景将会形成。
随着人工智能的进步,视频编辑也变得更加轻松,运用AI明显提升剪辑视频的效率,也是意义巨大的。
全球知名的数字媒体编辑软件供应商 Adobe,也加入了人工智能的大潮,发布了旗下首个基于深度学习和机器学习的底层技术开发平台Adobe Sensei。能自动完成视频编辑过程,同时还可以让我们通过你自己的意愿对AI的剪辑风格进行控制。
系统会自动将所有的镜头,包括多个角度拍摄的画面,按照我们意愿的脚本进行组织,然后还能够准确的通过需求找到指定的内容。这套程序就可以准确的识别出这些剪辑的内容,系统利用面部识别和情绪识别系统,对每一帧画面做多元化的分析。在所有的元素都可以被组织之后,系统会按照不同的风格和习惯对视频进行剪辑和处理,并且对某种风格贴上标签。
同样瞄准运动爱好者和视频分享者的Graava,则推出智能运动相机和配套的移动端应用。该相机内置了智能感应模块,能够最终靠辨别人体心跳频率来识别出拍摄者激动瞬间,并自动剪辑成视频片段。而国内有一家名叫慧川智能的公司同样是一个能够将脚本文字快速转化为短视频的云平台。在用户输入一篇文章、一个链接或者一个关键词后,它将基于人工智能技术,自动搜索合适的图片及视频素材,并配以AI合成的语音,最后融合成一条短视频。
以上总结了计算机视觉与视频行业四大应用点,充分表明了计算机视觉技术让视频智能化一直在升级,互联网应用在视频中运作起来,并让视频成为互联网应用的一个超级入口。像素的世界已经延伸到图像之外,虽然视频对于机器学习研究人员来说一直都是个挑战,但现在的技术能够使得从视频中提取信息变得跟从图像中提取信息一样简单。人工智能这个新兴“工具”的出现,为人类加速前往高度智慧化形态提供能量,重构着整个视频行业的结构和协作方式。