ChatGlasses|炬思X5将如何重塑我们的工作模式

栏目:高等教育  时间:2023-03-24
手机版

  ChatGPT自发布以来,引发了各种讨论,既有赞赏也有担忧。

  这个新生事物最令人震惊的是直接冲击以认知类,经验类技能为主的高难度复杂任务。

  人类赖以谋生的工作能力或者说工作技能主要有以下三点,一类是体能类,仅需要在物理世界付出体力劳动就可以完成任务,第二类是认知类,需要动用人的认知能力,根据过往的经验,或者现有的资料(比如设备使用说明书,操作手册等)对现实问题进行分析进而实现问题的解决,第三类是创意类(creative skills),需要独特的创造性思维。比如写一段代码、一篇创意文案甚至管理策划,其结果会因人而异。

  近年来,随着各国在人工智能领域的巨额投入,能够实现固定动作流程的机器人,已经深刻地在物流、生产检测、安防、出行等场景不断替代人工,并改变流程。

  机器人要能够实现与人类一样的感知,判断及行动技能,目前还面临着成本过高,技术远未成熟,甚至道德层面问题,在提升工作效率和技能方面,另一种思路是高效培训新员工,让他们能够在几小时内,即可掌握完全陌生工作领域的工作技能。这在过去是完全不可能的,但是随着GPT-4(Generative Pre-trained Transformer, 生成式预训练变换器)这种能够将文字,图片,甚至视频作为输入的多模态识别+推理的人工智能能力上线,短期内我们将看到一个围绕GPT-4的新型软硬件产品的爆发,而快速实现员工培训已经变的不再那么遥不可及。

  下面我们以深速达智能推出的炬思X5这种可对话的智慧眼镜为例来具体说明,搭载GPT-4服务的Chat Glasses未来将如何重塑我们的工作模式。

  01、炬思X5为何定义为ChatGlasses (智能对话眼镜)

  4K画质且具备电子防抖的可旋转镜头

  为了确保人工智能实现最佳分析效果,炬思X5 配备了Sony 1200万像素的的图像传感器以获得4K 级别的视频或图像画质,同时,内置的6轴陀螺仪可以实现超强的视频防抖功能,而X5独特的镜头多角度旋转能力,极大地扩展了可视范围,为图像识别和分析进一步奠定了数据来源基础。

  00:11

  近在嘴边的降噪麦克风,确保最佳语音识别能力

  炬思X5将一颗高灵敏度降噪麦克风设计在其旋臂上,当用户佩戴X5时,麦克风与嘴的位置非常接近,即便在环境噪音很大的环境下,X5仍然可以清晰地将用户的语音指令传送到云侧进行解析。

  

  耳边的大功率音箱

  炬思X5配备了最大2瓦输出的全频喇叭,通过匠心的巧妙设计,确保了用户佩戴X5时,喇叭刚好位于左耳上方以获得最佳效果,即便是嘈杂的工业场景也能听得清楚,便携听觉之旅就此展开。

  00:10

  人体工程学的典范设计

  经过研发人员的多次改良,在实现了业内少有的超大续航能力前提下,炬思X5最大限度地实现了佩戴的舒适性,整机重量均匀分布,前后高弹海绵的保护更加贴心。而异常轻便的前置镜头,可以旋转到额头以上或者嘴角之下,方便使用者从不同角度对眼前事物进行观察。

  00:10

  端+云结合的超低时延音视频双向交互

  不同于传统的AR/MR眼镜,炬思X5对音频图像甚至视频的运算和分析能力是建立在云端之上,而通过独特的视频流传输协议,X5智能眼镜与云端的连接时延可达毫秒级范围,正是这种低延时技术,确保了整个端+云的架构成为最佳工作模式,即可以保证产品的超长续航,又让服务的灵活扩展成为可能。

  开放的云端服务能力

  炬思X5的设计理念,非常类似云手机的概念,X5是一个可佩戴的终端设备,而每一个用户除了拥有这台终端外,还拥有一个专属的云记忆(存储)和云大脑(运算),X5可以从人的视角,将声音,图像,甚至视频实时传输到个人的云脑空间,而运行于云脑的各种服务,类似手机的App,可以为用户提供从声音识别,到图片理解,视频问答等多种服务。

  02、X5如何结合GPT的深度学习能力来重塑工作模式

  

  在很多工作领域,当新员工到岗后,通常要进行长时间的培训,尤其是需要操作多种设备的工种,新员工需要学习包括操作手册,使用说明在内的多种文档,而文档因为要尽可能地覆盖完整的产品相关知识,所以内容通常会非常庞大,员工学习起来会非常吃力且耗时。

  ChatGPT 推出后,学习文档变得异常轻松。例如上面这款ChatPDF服务(完成了与炬思的云端对接),用户只需要将使用手册这类PDF说明文档上传到其个人的炬思云空间,炬思云脑会帮助用户读取PDF文件并提取文本,之后对提取的文本进行清理和标准化,然后使用OpenAI的Embeddings API将每个分段转换为向量,这个向量将对文本中的语义进行编码,以便于与问题的向量进行比较。

  当佩戴着炬思X5的用户提出一个问题后,X5将用户的语音发送到云空间,炬思云脑使用OpenAI的Embeddings API将问题转换为一个向量,并与每个分段的向量进行比较,以找到最相似的分段(答案),最后,炬思云脑将答案合成语音后返回给X5的扬声器或者耳机,无人模式从使用手册中找到答案并反馈给一线员工,完成一次查询任务。

  通过OpenAI 的理解能力对企业文档进行解读分类,实现企业知识库的数字化和知识图谱创建,而炬思X5通过第一视角,端云结合模式理解用户的语义,通过云端的OpenAI服务快速从知识图谱中找到答案,并实现流畅和个性化的人机语言交互,未来炬思X5可能成为每一个企业新人的智能助手和培训伙伴。

  举报/反馈

上一篇:这是我国最大的私人住宅,占地25万平米,整整耗时三百年才建成
下一篇:论文查重费什么意思 论文查重是什么意思?

最近更新高等教育