摘要:提及人工智能(AI),恐怕大多数人首先想到的仍是多年前,斯皮尔伯格执导的那部电影。实际上,很长一段时间,人们对AI的研究尚且停留在文字层面,且计算机对普片的识别,要依靠人工添加的标签与注释。现在,这一窘境终于有望被打破。
提及人工智能(AI),恐怕大多数人首先想到的仍是多年前,斯皮尔伯格执导的那部电影。实际上,很长一段时间,人们对AI的研究尚且停留在文字层面,且计算机对普片的识别,要依靠人工添加的标签与注释。现在,这一窘境终于有望被打破。
今年5月份,谷歌推出了Google Photos,谷歌声称搜寻特定某人,你会找到对方从现在到婴儿时期的照片;搜索品种名,则能找到相应品种狗的照片。把名字和食品类别结合起来,比如输入‘最大披萨’,就能锁定特定图片。
之后,谷歌以TensorFlow平台形式开源了它的人工智能主体部分。尽管TensorFlow并不是第一个开源人工智能平台,但它却是与谷歌强大图片搜索关系最为密切一个。
同样在今年,一家名为CamFind的图片识别和视觉搜索公司,推出了一款“云视觉”(CloudSight)公共应用平台。该API支持开发者通过CamFind的人工智能,进行图片内容分析。
这样,可使大多数情况下扫描具有高度特定性,例如识别汽车的制造与模型,宠物狗的品种以及食品的具体类型。一旦分析出图片中的物品,开发者便可通过这一些信息来获取网络上的文字信息。
目前,Facebook已开始在Messenger应用上测试一项新功能“Facebook Photo Magic”,该应用会扫描手机相册照片,并对照片进行面部识别处理。“Photo Magic”会识别照片中的人物并建议你和他们一起分享这些照片。Facebook用AI对面部和名字进行匹配,人工智能掌握的照片越多其识别效果越佳,即便脸部被遮住,Facebook的“面部识别”一样能够识别出你的脸部。
当然,除了面部特征该系统还关注发型、姿势、衣着和身材。此外,Photo Magic拓展了图片库来源。也就是说,它除了收集Facebook外,还可以收集Messenger(聊天应用)的数据,扩充数据量。
近日,微软也更新了自己的牛津项目(Project Oxford)。实际上,Project Oxford是一个让开发者通过旗下的Azure云平台,使用微软AI系统的工具包。
据了解,Project Oxford工具包能够支持包括口语、视频以及别的媒体在内的AI应用。但与这些相比,其最强大的功能要属牛津项目现在支持开发者通过牛津人脸应用平台接口项目( Project Oxford Face API),检测照片中的人物表情。
例如用Project Oxford处理上图的五个人组成照片,Project Oxford可以识别照片中的人脸以及每个人的表情,或快乐或愤怒或者焦虑等等。必须得说,该项功能创造了一个全新的高度,让人工智能像人类一样“解读”图片。
巧合的是,Pinterest也在近期发部了自己全新的图片搜索功能“Visual Search”,帮助用户发现更多的信息,甚至帮他们购买在固定照片中找到的产品。该功能以伯克利视觉和学习中心的深度学习人工智能为基础。
用户在Pinterest页面看中的图片中,来回拖动一个盒状标识以选中自己心仪的物体。随后,搜索工具会找到具有相似图案与颜色的类似产品,系统将最匹配的结果链接到购买按钮上,点击这里就能购买该产品。这点倒是与淘宝中的“查找相似款”有些类似,只不过Pinterest是通过图片。
最后,再来说说Deepomatic。Deepomatic网络站点开发了一个服务型的智能搜索引擎,可以识别图片中的各类商品数据。Deepomatic不但可以为用户找到相匹配的颜色、图案以及其它数据,还能识别出图片中的物品,将该物品与一个全面的时尚产品数据库进行匹配。
对此,Deepomatic网站表示,该技术是模拟了人类大脑接收视觉信息的方式,并将这样的形式用来理解各种概念。
实际上,这仅仅是人工智能从文字层面迈向图片识别的一个开始。通过API,开源程序以及服务化处理让人工智能识别图片可成为实现。要知道,若想实际做到模拟人类,人工智能即计算机必须有自己的视觉。
凡文章来源标注为CPS中安网的文章版权均为本站所有,如需转载请务必标注明确出处为CPS中安网,违反者本网将追究有关规定法律责任。非本网作品均来自互联网,转载目的是传递更加多信息,并不代表本网赞同其观点和对其真实性负责。
为了更好的发挥CPS中安网资讯平台价值,促进诸位自身发展以及业务拓展,更好地为企业及个人提供服务,中安网诚征各类稿件,欢迎有实力安防企业、机构、研究员、行业分析师。投稿邮箱:/span>