李艳缩小放大

2018-3-22 18:44

预计今年视觉能力将成为智能音箱的标配

专家投稿 原创作者: 李艳 收藏

阿里巴巴人工智能实验室总经理浅雪

3月22日消息,今天下午阿里巴巴人工智能实验室在北京召开“万物有灵”2018春季发布会,发布AliGenie 2.0,使得天猫精灵智能音箱在原有的语音交互之外,还具有视觉认知功能。

在发布会的开始,阿里巴巴人工智能实验室总经理浅雪公布了天猫精灵的销售数据,上市半年多销售量超过了200万台。根据天猫精灵反馈的数据,天猫精灵目前连接了4500万台家用电器,回答了1亿个问题,执行了9亿次任务。有意思的是,天猫精灵放屁的声音被播放了347万次,讲笑话1296次。除了自有功能,天猫精灵也和传统厂商合作,把灯泡、插座等老家电变成智能家居产品。

今日发布的AliGeni2.0,不仅是对原先产品的升级,而是新增加了视觉认知功能。AliGenie1.0是阿里巴巴推出的第一代中文人机交流系统,可以完成“听”和“说”, AliGenie2.0在“听”和“说”的基础上引入视觉能力,能够进行视觉认知、多模态交互、情景感知。

其中,AliGenie 2.0的视觉认知能力包括图像识别、人脸识别、物体检测;AliGenie 2.0的多模态交互能力可以通过对语音、图像、触摸等多种交互形态的融合,模拟人与人之间的交流方式;AliGenie2.0的情景感知能力,则基于你所在的上下文、对话场景自主学习,理解情景需求。

体现在产品上,天猫精灵火眼的核心能力有两个:“视觉认知”和“表情系统”。视觉认知方面,目前精灵火眼能识别117套图书、4万个药盒。通过现场演示来看,天猫精灵火眼可以阅读儿童书籍、为老人阅读药盒上的信息,并且反馈速度非常快。在表情系统中,天猫精灵火眼具有一块显示屏,可以显示比较萌的表情,声音非常甜美,比较适合儿童使用。据阿里巴巴人工智能实验室总经理浅雪介绍,未来也将推出“万物识别”、“人脸识别”等功能。

在发布会上,阿里巴巴人工智能实验室也推出了天猫精灵火眼的配件XHolder、天猫路由、天猫魔屏S1、天猫精灵曲奇版,但并未公布相关发售信息。

Time