不过,近年来随着计算机技术的一直更新升级以及人们对AI的不断实践与尝试,人工智能已向我们走来。乐观的估计,2035年我们就会目睹强人工智能的诞生,悲观的估计则是2080年也就是说,我们很可能在有生之年目睹奇点的降临。
以人工智能在图片处理方面的应用来说,一大批能看懂图片的人工智能技术已来到人间,下面不妨来看看机器之心的盘点:
5月份谷歌推出Google Photos时,媒体关注的焦点是:AI和图片搜索结合后所产生的强大功能。谷歌声称(并且用户也很快确认),搜寻特定某人,你会找到对方从现在到婴儿时期的照片。搜索品种名,你就能找到相应品种狗的照片。把名字和食品类别结合起来,比如输入「大披萨」,就能锁定特定图片。这款应用发布之初,媒体无从得知谷歌究竟研发了多长时间。不过,一些搜索功能在Google 上出现一年了。不久前,谷歌以TensorFlow平台形式开源了它的人工智能主体部分。尽管TensorFlow并不是个开源人工智能平台,但是,它是与谷歌强大图片搜索关系为密切一个。开源TensorFlow意味着,包括初创公司在内的其他公司,能利用谷歌的这个开源平台,快速将AI和图片结合起来。尽管谷歌并未开放人工智能关键技术,包括在众多服务器上运行的能力。谷歌也没有开放让其如此强大的用户数据库。但是,谷歌的此举毫无疑问将**整个机器学习和人工智能创业生态的发展。我们也期待着基于TensorFlow的各种震撼新应用能于明年进入市场。
Facebook近期开始在Messenger应用上测试一项新功能Facebook Photo Magic。这是一个可选应用,它会扫描手机相册照片并对它们进行面部识别处理。PhotoMagic会识别照片中的人物(他们也是你的Facebook好友),建议你和他们一起分享这些照片。毫无疑问,这项功能给Facebook带来了双重优势。首先,它鼓励用户更多在Messenger上分享。其次,它改善了识别。但是,仅仅这项便利功能是不够的,用户实际上可以赞成或拒绝在任意灯光条件、角度和其他参数条件下,Facebook用AI对面部和名字进行匹配。Facebook人工智能掌握的照片越多,识别效果也越好。令人吃惊的是,即使遮住了脸部,Facebook的「面部识别」一样能能识别出你的脸部。这个系统也关注发型、姿势、衣着和身材。(请注意,我们并不清楚Facebook是不是已经实现了这种先进系统,但很明显的是,它从用户照片中收集数据。)
Facebook的Photo Magic拓展了图片库来源,它不仅收集Facebook(社交网站),还收集Messenger(聊天应用)的数据,扩充了数据量。PhotoMagic还鼓励赞成或否定匹配结果,提高数据质量。
很明显,Facebook终目标是识别任意场景中的任何人,即使在看不清脸部的恶劣灯光条件下。毫无疑问,未来Facebook的AI会扫描和分析环境,发现可市场化的线索比如,如果某人在照片里经常打棒球,广告商就可通过这个信息锁定棒球迷,尽管他在上传照片的文字里并没有表露出这种兴趣。毫无疑问,他们也打算通过观察图片中一起出现的人,进一步建立社交图谱。
微软日前也更新它的牛津项目,这是一个工具包,让通过旗下的Azure云平台,使用微软的AI系统。这个工具包支持人工智能每个方面的应用,包括口语,视频和别的媒体。但是,震撼和强大的功能莫过于牛津项目现在支持通过牛津人脸应用平台接口项目(ProjectOxfordFaceAPI)检测图片中的人物表情。譬如,用牛津项目处理一张包含5个人的照片,识别照片中的脸以及每个人的表情快乐,愤怒或恶心。这项功能在新的高度,像人类一样「理解」图片质量。观看他人照片时,人们关注的重要特征就是个人或群体的情感状况。
Pinterest日前发布了全新的图片搜索功能,它能帮助用户发现更多的信息甚至帮助购买他们在固定照片里看到的产品。首先,在Pinterest的图片中选中任一物体(来回拖动一个盒状标识)。然后,搜索工具会找到具有相似图案和颜色的相似物,系统会将匹配的结果链接到购买按钮上,点击这里就能购买该产品。这个功能是以伯克利视觉和学习中心(BerkeleyVisionandLearningCenter)的深度学习人工智能为基础的。这种照片AI应用可以说是万维网照片的雏形,在这个万维网中,每张图片中的每个物体都与等同物或者相似物、相关物彼此关联。CloudSight一家名为CamFind的图片识别和视觉搜索公司,今年推出了一个「云视觉」(CloudSight)的公共应用平台接口。这个API支持使用CamFind的人工智能分析图片内容。这样的扫描大多数情况下具有高度特定性,比如,能识别汽车的制造和模型,或者狗的品种以及食品的具体类型。一旦分析出图片中的物品,就能够正常的使用这些信息来获取网络上的文字信息。
Deepomatic开发了一种服务型软件智能搜索引擎,它能识别图片中各种各样的数据。Deepomatic热衷时尚。它不仅匹配颜色,图案和其他数据,还能识别图片中的物品,并将它与一个全面的时尚产品数据库进行匹配。Deepomatic网站声称,其技术模拟了人类大脑接收视觉信息的方式并用这样的形式来理解各种概念。
每当想到这样一个令人惊喜的新世界:能够理解照片内容的AI将无处不在,具有强大扩展潜力且唾手可得时,这些无限可能性就会令人叹为观止。
而且,这仅仅是一个开始。在绝大多数情况下,这项技术几乎都能通过API,开源程序或服务化处理得以应用实现,因此,我们已站在了未来世界的入口:图像AI将和网络搜索一样普及,成为这样一个世界的一个基本特征。为了真正模拟人工智能,计算机必须有视觉,现在它们有了。
声明:凡来源标明“智慧城市网”的文章版权均为本站所有,如需转载请务必标注明确出处,违者本网将追究有关规定法律责任;所有未标明来源为“智慧城市网”的转载文章目的是传递更加多信息,均不代表本网立场及观点,“智慧城市网”不对这些第三方内容或链接做一切保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。上一篇:存储感知世界的视频编码 分析与评测
智慧城市一周热点回顾|《人形机器人创新发展指导意见》发布、2023年全国消防宣传月活动启动......
智慧城市一周热点回顾|前三季度我国信息通信行业运行向好、华为提供智能座舱服务......
交通领域动态速览|北京首个大型客车无人驾驶车辆获准路测、杭州四区全域开放智能网联测试应用
智慧城市要闻速览|李宁成立首个智能物流自动化仓、北京朝阳区旅游收入全市第一……