ChatGlasses｜炬思X5将如何重塑我们的工作模式

栏目：高等教育时间：2023-03-24

　　ChatGPT自发布以来，引发了各种讨论，既有赞赏也有担忧。

　　这个新生事物最令人震惊的是直接冲击以认知类，经验类技能为主的高难度复杂任务。

　　人类赖以谋生的工作能力或者说工作技能主要有以下三点，一类是体能类，仅需要在物理世界付出体力劳动就可以完成任务，第二类是认知类，需要动用人的认知能力，根据过往的经验，或者现有的资料(比如设备使用说明书，操作手册等)对现实问题进行分析进而实现问题的解决，第三类是创意类（creative skills），需要独特的创造性思维。比如写一段代码、一篇创意文案甚至管理策划，其结果会因人而异。

　　近年来，随着各国在人工智能领域的巨额投入，能够实现固定动作流程的机器人，已经深刻地在物流、生产检测、安防、出行等场景不断替代人工，并改变流程。

　　机器人要能够实现与人类一样的感知，判断及行动技能，目前还面临着成本过高，技术远未成熟，甚至道德层面问题，在提升工作效率和技能方面，另一种思路是高效培训新员工，让他们能够在几小时内，即可掌握完全陌生工作领域的工作技能。这在过去是完全不可能的，但是随着GPT-4（Generative Pre-trained Transformer, 生成式预训练变换器）这种能够将文字，图片，甚至视频作为输入的多模态识别+推理的人工智能能力上线，短期内我们将看到一个围绕GPT-4的新型软硬件产品的爆发，而快速实现员工培训已经变的不再那么遥不可及。

　　下面我们以深速达智能推出的炬思X5这种可对话的智慧眼镜为例来具体说明，搭载GPT-4服务的Chat Glasses未来将如何重塑我们的工作模式。

　　01、炬思X5为何定义为ChatGlasses （智能对话眼镜）

　　4K画质且具备电子防抖的可旋转镜头

　　为了确保人工智能实现最佳分析效果，炬思X5 配备了Sony 1200万像素的的图像传感器以获得4K 级别的视频或图像画质，同时，内置的6轴陀螺仪可以实现超强的视频防抖功能，而X5独特的镜头多角度旋转能力，极大地扩展了可视范围，为图像识别和分析进一步奠定了数据来源基础。

　　00:11

　　近在嘴边的降噪麦克风，确保最佳语音识别能力

　　炬思X5将一颗高灵敏度降噪麦克风设计在其旋臂上，当用户佩戴X5时，麦克风与嘴的位置非常接近，即便在环境噪音很大的环境下，X5仍然可以清晰地将用户的语音指令传送到云侧进行解析。

　　耳边的大功率音箱

　　炬思X5配备了最大2瓦输出的全频喇叭，通过匠心的巧妙设计，确保了用户佩戴X5时，喇叭刚好位于左耳上方以获得最佳效果，即便是嘈杂的工业场景也能听得清楚，便携听觉之旅就此展开。

　　00:10

　　人体工程学的典范设计

　　经过研发人员的多次改良，在实现了业内少有的超大续航能力前提下，炬思X5最大限度地实现了佩戴的舒适性，整机重量均匀分布，前后高弹海绵的保护更加贴心。而异常轻便的前置镜头，可以旋转到额头以上或者嘴角之下，方便使用者从不同角度对眼前事物进行观察。

　　00:10

　　端+云结合的超低时延音视频双向交互

　　不同于传统的AR/MR眼镜，炬思X5对音频图像甚至视频的运算和分析能力是建立在云端之上，而通过独特的视频流传输协议，X5智能眼镜与云端的连接时延可达毫秒级范围，正是这种低延时技术，确保了整个端+云的架构成为最佳工作模式，即可以保证产品的超长续航，又让服务的灵活扩展成为可能。

　　开放的云端服务能力

　　炬思X5的设计理念，非常类似云手机的概念，X5是一个可佩戴的终端设备，而每一个用户除了拥有这台终端外，还拥有一个专属的云记忆（存储）和云大脑（运算），X5可以从人的视角，将声音，图像，甚至视频实时传输到个人的云脑空间，而运行于云脑的各种服务，类似手机的App，可以为用户提供从声音识别，到图片理解，视频问答等多种服务。

　　02、X5如何结合GPT的深度学习能力来重塑工作模式

　　在很多工作领域，当新员工到岗后，通常要进行长时间的培训，尤其是需要操作多种设备的工种，新员工需要学习包括操作手册，使用说明在内的多种文档，而文档因为要尽可能地覆盖完整的产品相关知识，所以内容通常会非常庞大，员工学习起来会非常吃力且耗时。

　　ChatGPT 推出后，学习文档变得异常轻松。例如上面这款ChatPDF服务（完成了与炬思的云端对接），用户只需要将使用手册这类PDF说明文档上传到其个人的炬思云空间，炬思云脑会帮助用户读取PDF文件并提取文本，之后对提取的文本进行清理和标准化，然后使用OpenAI的Embeddings API将每个分段转换为向量，这个向量将对文本中的语义进行编码，以便于与问题的向量进行比较。

　　当佩戴着炬思X5的用户提出一个问题后，X5将用户的语音发送到云空间，炬思云脑使用OpenAI的Embeddings API将问题转换为一个向量，并与每个分段的向量进行比较，以找到最相似的分段（答案），最后，炬思云脑将答案合成语音后返回给X5的扬声器或者耳机，无人模式从使用手册中找到答案并反馈给一线员工，完成一次查询任务。

　　通过OpenAI 的理解能力对企业文档进行解读分类，实现企业知识库的数字化和知识图谱创建，而炬思X5通过第一视角，端云结合模式理解用户的语义，通过云端的OpenAI服务快速从知识图谱中找到答案，并实现流畅和个性化的人机语言交互，未来炬思X5可能成为每一个企业新人的智能助手和培训伙伴。

　　举报/反馈

上一篇：这是我国最大的私人住宅，占地25万平米，整整耗时三百年才建成
下一篇：论文查重费什么意思论文查重是什么意思？

ChatGlasses｜炬思X5将如何重塑我们的工作模式

最近更新高等教育