手机AI、购物AI...还有哪个“AI+”被忽略了?

news/2024/7/7 19:33:02

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


AI 技术似乎成了一把“万能钥匙”,捅进任何一个拥有数据的行业钥匙孔里,它都具有一定的适配能力。

 

AI 应用在手机上,提升了图像识别和语音识别的效率;AI 应用在医疗影像中,可以辅助医生进行快速阅片诊断;AI 应用在汽车里,就会是解放人类驾驶员的自动驾驶……

 

现在,一种人工智能同样有所作为的应用场景正在浮现,它为人们所熟悉但又知之甚少。


根据战略咨询公司 Morar HPI 的数据调查,会议给全球 94% 的工作人员带来了恐惧感。人们对开会抱怨最多的两件事是会议进行时间超过实际需求(49%),以及找出适合每个人的会议时间(39%)。用一句话来说,无非就是乏味且效率低下。

 

日常工作中,本来是探讨和解决问题的会议,但繁冗无意义的流程让它成了一件疲惫的事情。天生带有“高效率”光环的 AI 此时来与它进行适配了,但它能在多大程度上改变这种糟糕的体验?以及如何改变?

 

近年来,众多技术供应商和系统集成商为改进电话会议付出了不懈努力,会议技术的易用性得到了显著提升。但一些问题仍然长期存在,譬如使用哪个系统、如何使用该系统以及遵循怎样的流程顺序。

 

而在会议上,大部分会议室仍然遵循一场会议由一个“主持人”主导的方案,这绝不会是敏捷工作方法所具备的特点,这些都造成了企业在低价值工作上浪费了大量时间,会议效果或会议时长因错误或技术性问题大打折扣,同时支持成本明显上升,企业整体的灵活性和生产能力也在一定程度上受到了影响。

 

只要有用户需求痛点,市场自然会提供相应产品。SparkRoom 70 是思科做出的适用于会议场景的一款 AI 产品,它对会议流程进行了新一轮智能化升级,主要体现在智能语音助理和人脸识别这两大功能上。



640?wx_fmt=png

思科协作对应不同大小会议室的四款产品



正如 Alexa 和 Siri 等语音助手一样,思科也专门打造了全球首款人工智能会议语音助手 Spark,用户可利用语音命令通过 Spark Room 70 进行语音唤醒,发起和结束预定的会议,抑或直接向某位人士拨号,如“Hi,Spark,呼叫 Sarah”。

 

人们最关心的或许是它的语音识别能力,尤其在会议室这种嘈杂的环境对麦克风的拾音效果有很大挑战。针对会议中可能出现的键盘声等噪音,它所使用的麦克风能自动消除并自动提高发言者的声音级别。而在参会人员发言阶段,当 Spark 识别到某一发言人声音后,会进行自动语音追踪,实现“听声辩位”,会议结束后,它还可以将会议速记分发给参会人员。不过,对于具体语音识别效果,思科方面并未有相关数据介绍。

 

会议期间也不用“主持人”对相关与会人员多做介绍,当他们在首次录入相关人脸信息后,屏幕上方的摄像头会对相关发言人进行人脸跟踪,并在屏幕上同步显示与会人员的姓名和职称,至于统计参会人数更是不在话下。这种人脸技术应用目前已经较为成熟,火车站快速检票、无人店分析用户需求都是基于该技术。

 

再看硬件配置,简洁优雅的工业设计下有强大的硬件支持,SparkRoom 70配备 70 英寸的 4K 屏幕(提供单屏和双屏两种型号)和四个 5K 摄像头。其中一个摄像头始终捕捉整个房间,支持智能取景,并能快捷显示最佳的房间全景图。SparkRoom 70 还支持企业自建模式部署和思科 Spark 云服务模式部署,但这些设置从第一款 4K 双流显示的 Spark Room Kit 就有了。新增的佐料是,前者采用了 NVIDIA Jetson 平台(众多自动驾驶车辆也采用了该平台),实现了摄像机技术和机器学习之间的平衡。

 

此外,Spark Room 70 能够实现全无线数据共享,无线接入将有效解决以往会议室布置中的难题,从而显著简化部署。


640?wx_fmt=png


 当然,现在的方案还只是 AI 技术在会议场景小试牛刀。在未来, AI 应用于会议领域还能提升多少业务价值?思科给出了它的战略方向,共 5 个层次:

 

  • 第 1 层,指令和控制:通过机器听觉和自然语言处理能力实现语音响应,从而简化会议设置机制;


  • 第 2 层,自然语言理解:通过 AI “机器人”(一种可模拟对话的机器算法)来处理各种指令,协助会议管理;


  • 第 3 层,基于领域专长的语义理解,支持系统创建和分发会议总结;


  • 第 4 层,智能团队成员:即系统理解会议情境和与会者需求的能力,通过系统的这种能力来合成相关数据,为团队提供帮助,比如通过自动创建数据表来协助决策的制定;


  • 第 5 层,团队及策略智能:即系统理解企业目标和团队成员技能,以及为与会人员提供建议的能力(比如“ Sarah 是这个领域的专家,我们是否邀请她参会?”)。 


第 1、2 层级的功能已得到了实现,可预见的是,越往技术金字塔顶端,突破会更艰难,但思科的战略目标已经非常清晰,其一是 AI 技术未来在塑造会议技术方面是大势所趋,其二则是思科在技术积累上的底气。

 

上世纪 90 年代,思科就率先跟进机器智能前沿技术,采用了多种话筒波束成形技术,推出了具备媒体适应能力的 DX80 小型视频会议终端。如今,随着深度学习的崛起,思科的设想是应用前沿的全数字化科技以及 AI 技术,将未联接的会议室和办公室打造为全功能协作空间,并最终实现让工作人员摆脱乏味的会议设置和其他后勤工作。实现这一目标任重道远,但思科已经出发了。

 

题图来自:pixabay


☟☟☟点击 | 阅读原文 |了解更多


http://lihuaxi.xjx100.cn/news/290425.html

相关文章

【动态规划】区间DP - 最优矩阵链乘(另附POJ1651Multiplication Puzzle)

最优矩阵链乘(动态规划) 一个n∗mn*mn∗m的矩阵由 nnn 行 mmm 列共 n∗mn*mn∗m 排列而成。两个矩阵A和B可以相乘当且仅当A的列数等于B的行数。一个nm的矩阵乘mp的矩阵,运算量为nmp。 矩阵乘法不满足分配律,但满足结合律。因此A…

linux中实现pxe的自动安装

linux中实现pxe的自动安装 什么是PXE PXE(preboot execute environment)是由Intel公司开发的最新技术,工作于Client/Server的网络模式,支持工作站通过网络从远端服务器下载映像,并由此支持来自网络的操作系统的启动过程,其启动过程中&#xf…

随想录一刷Day17——二叉树

文章目录Day17_二叉树12. 平衡二叉树13. 二叉树的所有路径左叶子之和Day17_二叉树 12. 平衡二叉树 110. 平衡二叉树 思路: 递归法:左右子树的高度差超过1,则不是平衡二叉树 class Solution { public:// 求树的高度,是后续遍历in…

RAID0、RAID1、RAID0+1模式实战评测

文章比较老了,但是很实用。对于要配置RAID的朋友来说值得一学。原文:Tom’s Hardware 作者:Patrick Schmid, Achim Roos 当你增加硬盘数量的时候,磁盘阵列的性能会怎样变化?我们此次RAID评测的第一部分将给出2~8个硬盘…

荣耀总裁赵明:AI 是核心战略,全球前五的目标不会变

作者 | DavidZh 出品 | AI科技大本营(公众号ID:rgznai100) 4 月 26 日的 GMIC 大会上,华为荣耀总裁赵明分享了荣耀品牌在人工智能和全球化上的策略和进展,并接受了 CSDN 等媒体的群访。 从产品上看,荣耀…

【动态规划、计算几何】最优三角剖分

整理的算法模板合集: ACM模板 目录最优三角剖分UVA1331 最大面积最小的三角剖分 Minimax Triangulation最优三角剖分 问题描述: 给一个有n个顶点的凸多边形,有很多方法进行三角剖分(polygon triangulation) 。给每个三角形规定一个权函数w(…

327 - Evaluating Simple C Expressions

2019独角兽企业重金招聘Python工程师标准>>> 题意:C 表达式运算, 变量为 a-z, 代表运算数为 1-26; 运算符包括 , -, , --; 要求输出原表达式的运算结果, 及运算完后各个变量的值.1. 每个变量只会出现一次;2. 不会出现 ab 这样带歧义的表达式;3. 或 -- 不会既出现在…

UVA10003 切木棍 Cutting Sticks(区间DP、细节)

整理的算法模板合集: ACM模板 本题其实就是一个区间DP 的模板题,总长度为len,有n个切割点,也就是说能被切割成n1段,所以左边界是0,有边界是n 1,所以答案就是f[0][n 1]。 其中我们要把两个端点…