在张江,机器人睁开慧眼–存在即被感知


今日 iTalk 沙龙探访了“图漾”并在粉丝群中进行了直播与场外问答,大家对“图漾”带来的产品有着各种好奇和疑问。在张江园区里的“图漾”,解决了什么样“慧眼”问题?

WechatIMG18

智能机器人能有多聪明?

对于人工智能和机器学习领域的领导厂商谷歌公司来说,2015 年的夏天可谓倒霉透了。

当年,谷歌公司为其 Photos 应用添加了新功能:当用户搜索照片时,机器通过识别照片中内容对照片进行自动分类并打上标签,方便管理和搜索。不过,这款更加“聪明”的 Photos 应用却让谷歌公司“摊上大事”了,两位黑人用户的照片被这款应用自动标记为“大猩猩”类别。

121747517

参考:谷歌照片应用误把黑人标记成“大猩猩”

也许是科幻电影把我们的口味惯坏了,网友们对于这种“低级”错误可没有多少容忍度,谷歌公司不得不就此事进行道歉。或许谷歌公司心中有些委屈,或许你很难相信被乱贴标签的可不只是非裔。直至今日,绝大多数机器人依然无法准确识别出,在它面前的究竟是人脸还是猫脸。

是的,对于今天的智能机器人来说,它们感知世界的“眼神儿有点儿差”。

深度摄像头=感知世界的眼睛?

为什么机器人的“眼神”并不好?计算视觉创业公司图漾科技的创始人费浙平给出的解释是:

图片只能记录颜色(RGB)信息,而并不能记录几何空间(XYZ)信息。当机器只能从已知颜色信息中寻找特征进行判断,乱贴标签也就不足为奇了。

费浙平介绍说,机器人的“眼睛”,也被叫做视觉传感器,其实就是摄像头。由于传统摄像头只能记录颜色数据,因此使用传统摄像头做“眼睛”的机器人具有“先天视觉缺陷”。那么,是否有能够精确获取周围环境里物体的三维尺寸和空间信息的视觉传感器,弥补机器人的“先天视觉缺陷”,使得机器人“深度感知”身边环境和识别物体?

2013 年成立的图漾科技致力于解决这一问题,图漾科技通过研发能够同时抓取颜色数据和空间数据的深度摄像头(又称 3D 传感器),革新机器人观看和理解世界的方式,使得机器人更加智能。

深度摄像头的组成

深度摄像头(嵌入在工业摄像机内)的组成

事实上,在深度摄像头这一领域已存在先行者,即以色列公司 PrimeSense。 PrimeSense 在 2006 年研发出 3D 传感器。几年之后,他们和微软合作出产的体感周边外设 Kinect,成为世界上最受关注的感应设备之一。2013 年, PrimeSense 以 3.45 亿美元的价格被苹果公司收购。

尽管跟随巨头的脚步,图漾科技并没有模仿 PrimeSense 的技术方案,而是花费了三年时间进行自主研发硬件和软件,拥有自主知识产权。计算视觉领域作为人工智能的重要组成部分,拥有很高的技术门槛。费浙平*是世界顶尖的处理器技术公司 ARM 在中国区的高管,团队其他核心技术成员则是国内第一个实时景深技术开发团队。

人工智能应用正在起步

人工智能领域有三大重要组成部分:深度学习技术计算视觉技术语音语义技术

其中,深度学习技术决定机器人是否聪明,计算视觉技术和语音语义技术则决定了机器人与外界环境的交互能力。费浙平说,目前在全球范围内,计算视觉技术的发展远低于深度学习技术和语音语义技术。

费浙平介绍,以深度摄像头为基础的计算视觉领域,关键技术指标主要有镜头视角最大检测距离检测精度检测速度四项。正因为计算视觉技术发展尚属早期,图漾科技以及它的竞争对手们,都在以不同技术方案进行“爬坡”,在不同的应用环境各自具有不同优势。

计算视觉技术的发展,将促进人工智能在人们生活中的应用。目前,已经面市的智能机器人产品多为桌面机器人(因为“眼神”不好,它们不能实现自由地走动)。在红星美凯龙上海金桥商场,则有目前较少见到的为顾客提供导购服务的智能机器人。费浙平解释,这种能够自由行走的智能机器人,技术难点在于需要实时感知商场环境,避免撞到行人和摆在地上的堆放物等,这需要计算视觉技术来实现。

由于深度摄像头能够获取世界的三维信息,给VR/AR、动作捕捉、三维扫描与打印、室内导航与定位等应用提供了基础的技术支持。目前,图漾科技正在为深度摄像头寻找更为丰富的应用场景:

  • 在机器人领域,深度摄像头可以用于视觉导航、规划路径、实现避障工作等;
  • 在安防领域,深度摄像头可用行为分析,通过这些动作轨迹进而识别出人背后的意图,从而提前进行预警;
  • 在物流仓储领域,深度摄像头可以实时检测包裹的大小,计算仓库的空间,提供最佳的摆放建议等。

图漾科技打算选择几个行业应用进行切入,将看似高大上的计算视觉技术落地。

市场爆发的前夜?

如今,计算视觉已成为全球高科技行业最热门的投资和创业热点之一。除了已经被苹果收购的 PrimeSense 之外,另外一家以色列技术公司 Pebbles Interfaces 也被巨头收购。苹果、英特尔、Facebook、微软等巨头公司在该领域的收购动作十分频繁。虽然被收购的多为以色列技术公司,但国内计算视觉创业公司也已逐渐开始崭露头角,今年年初,图漾科技完成 1500 万元 pre-A 轮融资。计算视觉领域已经到了市场爆发的前夜。

目前,图漾科技的定位是“计算视觉核心技术模块提供商”。它所要做的突破是:所采集的视觉数据达到与人眼识别相差无几,甚至比人眼识别有着更好的量化。可以预见,未来计算视觉市场将迎来大爆发。但费浙平表示,无论是人工智能还是计算视觉领域,未来都具有广阔的应用市场。然而,创业公司可能很难等到这一天,必须在短期内有产品落地。

“无论是人工智能还是计算视觉领域,都面临同样的困难需要克服:概念、技术、团队都不错,但暂时都拿不出亮眼的订单和收益。”费浙平道出了人工智能领域创业公司的生存现状,“但今年我们会率先在业务上有大的突破”,他补充道。

我们离科幻电影中的人工智能还有多远?

在费浙平看来,真正的机器人将不仅有 AlphaGo 的大脑;还要能够适应环境和感知环境,如能听见和听懂声音,自己避开障碍物和寻找路径等;并加入机械技术。最终成为既聪明,又能够获取信息,还能对外动作的机器人。

WechatIMG27

图:iTalk 沙龙创始人孔华威与图漾 CEO 费浙平

WechatIMG26

作者简介:老孔,本名孔华威,浙江新昌人,孔氏74 代繁字,虽然自称老孔,但还是个“60后”…

Share

发表评论