原标题:CNCC 2017丨陈熙霖:计算机视觉不只要“看到”,更要“看懂”
2017中国计算机大会(CNCC2017)26日在福州开幕,本次大会主题是“人工智能改变世界(AI Changes the World)”,从10月26日持续至28日。2017中国计算机大会(CNCC2017)由中国计算机学会(CCF)主办,福州市人民政府、福州大学承办,福建师范大学、福建工程学院协办。
在CNCC大会上,中国科学院计算技术研究所研究员陈熙霖作题为《从物体识别到场景理解》的报告,陈熙霖研究员在演讲完后接受了媒体的访问,并回答了黄河连线的专访问题。
黄河连线:现在普通大众都在享受着计算机视觉带来的便利,但是部分人对于具体哪里运用到这些技术不太清楚,您可以大概介绍一下现在较为普遍运用的计算机视觉技术吗?
陈熙霖:计算机视觉在应用上非常普遍,比如现在打开手机的照相功能,会自动识别人脸在哪里并框出来,再据此对焦,这就是个典型的应用。过去有几率存在照相机对焦对不好,但是现在识别到人脸在哪里,相机就自动给你调整好了。还有在停车场停车不用刷卡,通过拍照就可以计费,这也是个很好的应用,此外包括普遍的使用的指纹识别、OCR (Optical Character Recognition,光学字符识别)等,都是识别技术在应用上的标志。
黄河连线:前段时间苹果推出了人脸识别解锁、支付技术,在网上引起了热议,有的人觉得人脸识别并不比指纹识别方便。您怎么样看待这个问题?
陈熙霖:这是一个习惯的问题,技术同时也在应用需求的推动下会不断地改进、迭代,人脸识别技术的发展肯定也会慢慢的好用的。
黄河连线:有专家说,现有的人工智能系统,可以说有智能没智慧,有智商没有情商,会计算不会算计。您是怎么看待这个说法的?
陈熙霖:这要看智能系统对用户的理解定位在哪个层面。即使是人类,也会有理解上的差异,比方说你讲了一个笑话,有的人笑,有的人不笑,这背后就需要有一个背景知识作为支撑。如果想要机器有情商,那就需要有深刻的背景支撑。但反过来讲,我们到底需要有什么样的机器人?如果是想要一个聊天机器人,那可能需要考虑情商的问题(即使这个情商也是人造的),如果只是需要扛一个箱子、干体力活的机器,那要情商干嘛?所以说,合用的就好。
黄河连线:人工智能现在迅猛发展,但是在分工、隐私等人理道德方面也出现了很多不同的声音。您怎么看待现在人工智能与人之间的关系?
陈熙霖:近年来,人工智能在应用上的发展很快,但是相比技术的发展,教育和立法方面需要尽快跟上,不能忽视,只有这样才能解决好人和人工智能技术的关系。
我们国内有很多研究单位和企业在计算机视觉领域的工作都非常好,是可以和国际一流的技术水平相比肩的。因此,关于人工智能的理解是千人千面的。
我希望计算机视觉技术在未来的发展可以使机器人像人一样,能理解周围的事物。现在的机器人相对人来说在理解周边事物方面还很初级,很大的原因就是缺少一双明亮的“眼睛”。中国人说“耳听为聪,眼见为明”。如果能让机器人有一双查明秋毫的眼睛,能理解到周围的环境,这就是个很了不起的工作。至于大家关注的在手机上的人脸识别解锁、支付等技术,从推出到广泛使用可能需要一段时间,这是一个使用习惯的问题,同时技术会在需求的牵引下不断地改进、迭代,人脸识别技术的发展肯定是会慢慢的变好的。
有人会担忧人工智能像在电影中那样有了自己的意识,开始抢占人类生存资源。这毕竟是科幻片。但是人工智能倒是有一些伦理问题是需要思考,未来机器人能做什么、不能做什么,这些都是要求我们来思考的。
人的眼睛在看到物体后,在身体上会有一系列反应,机器人是相同的。计算机视觉的目的是想让计算机能够正常的看到一些东西进行反应、决策和动作。计算机视觉要达到的目的不是只是“看到”,更要达到“看懂”。例如对于无人驾驶汽车来说,就是要看懂行人的动作和预判出即将发生的动作。“看”是“做”的前提。随着需求的发展,如机器人、无人驾驶等,计算机视觉都需要为其提供支撑。技术的发展是一个漫长的过程,计算机视觉的发展任重而道远。很多人担心AI会不会操控人脑?至少从技术的角度,不用去担心这个问题。
未来,计算机识别技术的相关产业要发展,第一是要有自己的核心技术,第二是要追求差异化,第三是整个产品的设计、发展要找好定位。企业同时也能够最终靠产、学、研的结合,助力企业未来的发展。中国计算机学会就一直在致力于服务企业的发展。