36 氪专访 BodyPark 林宜立:“ + 生成式 AI ”需要垂直场景、产

栏目:未来教育  时间:2023-04-24
手机版

  文|沈筱

  编辑|王与桐

  上线 2 个月 1 亿月活,ChatGPT 以其强大的对话能力迅速刷新全球用户对人工智能的认知。在 OpenAI 和微软公布开启模型、应用更新加速度后,兴奋和焦虑的双重情绪开始在国内创投圈中蔓延。

  在颠覆和被颠覆的讨论中,有一个在近期颇受关注的交叉带—— "+Gen AI(生成式 AI)",即寻求将生成式 AI 技术与判别式 AI 技术和现有产品、场景结合。

  然而,在思考生成式 AI 技术能否与业务耦合,以及技术如何落地的同时,创业公司还面临着诸多现实的问题:"+Gen AI" 带来的增益真的能 cover 新增的投入吗?这样的加法,能帮助诞生于上一波 AI 技术浪潮,仍在谋求发展的创业公司带来新的价值创造机会吗?

  尽管存在上述不确定性,从现实情况来看,其并没有阻挡各方拥抱新技术的态度。已经有很多企业正在努力搭上生成式 AI 技术革命的 " 车 "。但是,这辆车是快是慢,能否通往企业理想的目的地,还需要很多思考和探索。

  为了获得来自行业一线实践者关于生成式 AI 技术可能带来何种影响,以及有关新技术商业化落地机会和挑战的看法,36 氪与 BodyPark 型动公园创始人兼 CEO 林宜立进行了交流。

  林宜立曾任「出门问问」高管,在 2021 年创办了专注大健康运动赛道的 AI 智能数字化平台 BodyPark。36 氪曾报道过 BodyPark 的 Pre-A 轮融资。

  2023 年 3 月,BodyPark 正式启动了 AI 2.0 战略,在原有 "AI+ 真人私教 " 产品,和自研 DeepBody Engine 人体姿态识别 AI 引擎的基础上,推出了三款新产品:AI 虚拟教练「ChatBPK」,AI 游戏化健身新品「JustFive5 分钟」,以及面向行业教练 / 康复师的 AI 远程授课 SaaS 系统「Coach Copilot」。

  其中,ChatBPK 是 BodyPark 整合当前主流大型语言模型(LLM),并以现有课程内容和用户数据为 Grounding(校准),开发的 AI 多模态虚拟教练。用户可以在课前、课中、课后任意阶段,用自然语言的方式与 ChatBPK 交互,获得关于课后评估、健身计划等个性化、专业问题的解答。同时,ChatBPK 的回答不限于文字形式,还支持拉取课中体态识别图片、教练指导语音等。

  以下为 36 氪与 BodyPark 的对话,经编辑整理

  01 老场景新解法 vs 新场景原生机会

  36 氪:BodyPark 也是从做健身垂直领域小模型开始的。有说法认为上一波 AI 创业公司很难做,在您看来,到底难在哪?

  林宜立:我们公司的核心成员不少是上一波 AI 公司出来的老兵,都经历过从 2014/15 年开始的 AI 创业热潮。我的最大感受是 AI 公司难是难在商业化变现,得找场景。

  上一波往往是 AI 团队先有很牛的技术,但需要持续寻找落地场景," 拿着锤子找钉子 ",往往会走一些弯路(尽管有时难以避免)。所以我们做 BodyPark 再创业的那一刻,就已深知场景和技术应该是紧密耦合的。不管是 B 端还是 C 端的场景,只有紧密结合用户场景去做技术创新,才可能将技术本身的价值和商业化前景发挥到最大。

  36 氪:说到 " 拿着锤子找钉子 ",这一波想要直接利用生成式 AI 技术来做的企业会不会也有这样的情况?

  林宜立:这个肯定也会有。比如现在 OpenAI,ChatGPT 火,很多创业团队就会直接拿着大模型的 API 直接封装做应用,很快的做出一些智能的聊天机器人,然后再去找应用场景。这多少也是 " 拿着锤子找钉子 " 的逻辑。

  这个思维本身也没有大错,但我认为,以终为始来看,技术最终还是服务于场景,终局一定是找到解决特定问题的场景。在这个场景里,技术、产品能发挥非常核心的作用,帮助企业形成稳健的、具备长期壁垒的商业模式。

  36 氪:在您看来,所谓的 AI 1.0 和这一波 AI 2.0/ 生成式 AI 技术相比,在场景或者应用上会有什么区别?

  林宜立:我觉得有两大类需求。一类是技术范式变化带来的新场景需求,这个目前还需要时间去观察。另一类是老场景新解法,用户需求其实一直在,但采用新的技术,可以做一些原来做不到的事情,创造新体验、解锁新人群、构建新玩法。

  比如我们现在做的在线运动健身私教课。新一波大语言模型 / 生成式 AI 技术会可能会十倍,甚至百倍地提升这些场景中的体验和效率。

  我觉得对所有正在路上的创业团队、或者已经有成熟商业模式的公司来说,都要拥抱 AI 2.0 的机会。因为,站在企业的角度,相当于工具箱里多了一个非常有力的工具。

  同时,AI2.0 也会有原生的机会,会涌现出一些新的商业模式。比如技术 2B 创业,做大模型等更偏底层的基础设施的机会。像我们这样做垂直场景应用的企业可能就会为之买单。

  还会有做中间件比如专门提供模型训练能力的,做算力加速的等等。另外,也会产生很多新的应用,可能不是老场景,但需求却可能早就存在,比如做情感陪伴类聊天机器人的。

  36 氪:您刚刚提到,BodyPark 瞄准的其实是一个确定的老场景,那当初在考虑采用生成式 AI 技术时,主要考虑了哪些因素?

  林宜立:当所有人都在聊大模型和 AIGC 时,BodyPark 是带着自己的视角和场景来看这件事的。一方面我们一直密切关注并深度参与 AI 技术的发展。另一方面,本质上我们是一家 AI 产品服务公司,也很强调用户思维。用户不会只因为你有很好的技术而买单,但会因为你为他们提供了完整的体验价值而持续付费。

  因此,我们首先考虑的是,新的 AI 技术能不能非常接地气地在现有场景中得到应用,解决具体问题。其次,另一个核心在于叠加新技术之后,能不能达成 1+1 远远大于 2 的效果。

  过去我们通过 "AI+ 真人 " 的组合搭配,把在线私教课的体验从 0 做到了 1,把一个之前大家觉得做不到的体验做得还不错,跑通了商业化。现在有了 Coach Copilot 和 ChatBPK 这两个新产品模块后,我们有机会把服务效率和用户体验再从 1 提升到 10 甚至 100,能更快地实现最初创业时想做 AI 虚拟智能教练的愿景。

  02 小模型 + 产品 + 数据——生成式 AI "Connecting the dots"

  36 氪:您刚刚提到创业之初的愿景就是做 AI 虚拟智能教练产品,为什么创业之初没做,而是等到今天?是受限于技术,还是有其他的具体路径考虑?

  林宜立:其实 AI 智能教练这件事是从创业之初就开始的,一直在做积累。但我们最初并没有关于什么时候能够真正构建一个完整 AI 虚拟教练的清晰时间表。

  一方面,虽然团队有自研的人体姿态识别与动作理解算法引擎,但团队对专业教练的知识或者行业 know-how 还需要积累。另一方面,纯 AI 虚拟教练如何与用户更自然地交互也是一个比较大的难点。

  这次大型语言模型出来之后,我们发现,这一波生成式 AI 技术可以把原来做的所有事情串起来,Connecting the dots。

  我们基于深度学习人体姿态识别模型 Deepbody Engine,叠加上生成式 AI 技术后,一些表面看似不相关的产品和业务其实可以构成更完整的、端到端的全栈服务生态。这背后的底层核心能力就是 AI Virtual Coach 智能教练。

  现在,BodyPark 每个业务线都可以更好地反哺这个核心能力,同时核心能力的每一次升级也能衍生新的业务、强化已有的业务。

  例如,除了运动健身,我们也可以将相应能力迁移到康复和慢病管理领域。目前我们正在和一些知名的三甲医院康复科进行合作试点,用运动处方进行远程的慢病管理。这也是基于已有技术能力涌现的新商业机会。

  36 氪:您认为 BodyPark 能在现阶段快速实现 "+Gen AI" 的关键是什么?

  林宜立:"+Gen AI" 对我们来说是一个厚积薄发,顺势而为的事情,关键可能是垂直的小模型和大模型的协同。

  在垂直场景中,如果没有专业领域知识,没有对相关用户数据的准确量化和记录,可能就无法从大语言模型(LLM)精调出可以和用户进行专业化、个性化交互的对话模型。只是简单调用大模型接口来和用户进行泛娱乐化互动,解决不了 LLM " 胡说八道和不够专精 " 的问题,不会对业务有实际帮助,也不会有用户为之长久付费。

  拿 BodyPark 的例子来讲,我们需要达到的效果是 ChatBot 在前端,以自然语言、以图文并茂的多模态方式,与用户交互。这个 ChatBot 要能够在课前、课中、课后给用户提供个性化的内容,进行实时和异步的专业化指导,同时能够让它的指导与平台的课程内容体系联通。

  我们过去两年打造的 "AI+ 真人私教 " 这套体系,核心是基于 AI 算法,在自研深度学习模型 DeepBody Engine 的基础上,自建和叠加课程体系(BIPT 进阶课程体系、课程动作库),以实现算法、数据、内容与产品的闭环飞轮。

  所以,我们现阶段可以快速推出垂直场景的 ChatBPK 智能教练,主要也是得益于之前投入自研的这个 AI 小模型,实现了用户健身场景的数字化。在这个过程中,我们积累了大量图文、视频数据,包括用户在训练中做了哪些动作,练的怎么样,经常犯什么错误,真人教练给了什么指导。

  只有把这些数据喂给大模型,让它理解这些数据,才能让大模型实现 Grounding,接地气,也就是不会像 ChatGPT 那样胡说八道,或者仅给出一些泛泛的回答。

  当然,在这个过程中,我们还需要去克服一系列技术和工程优化方面的挑战,这些都是沉淀和壁垒。

  36 氪:谈到数据规模和质量,垂直场景的专有 AI 小模型也需要好的数据来迭代优化,BodyPark 是怎么做的?尤其是,在一开始还没有自有用户数据或者量很小的情况下。

  林宜立:近年来,在学术界和工业界其实是有一些关于人体关键点识别(Human Pose Estimation)的公开模型和方法论的,但都仅适用通用场景,无法直接商用。在运动健身场景之下做人体姿态识别模型,要让 AI 既能看得清又能看得懂,确实有特定的难点。一是公开数据库里数据少且质量较差,二是垂直模型构建需要行业的 know- how。

  AI 仅仅做到 HPE 人体姿态识别是不够的,还需要能理解人体的动作(Human Motion Understanding)。比如算法看懂人体骨骼关键点后,仅仅是记录了相关的空间坐标,并不知道学员是在做 " 深蹲 " 还是 " 俯卧撑 ",以及动作到底标不标准。后者属于典型业务场景的需求逻辑,没有开源算法可用,需要积累数据和专家输入,自研摸索。

  这也是为什么我们第一天就采用了 "AI+ 真人 " 的模式。只有打通了从 0 到 1 的用户场景,做出有用户愿意持续付费的产品,才能有数据闭环,进而帮助我们在后续,利用真人教练反馈和训练数据来反哺和持续迭代算法。

  现在来看,我们前期做的这些工作,正好也为接入大模型能力提供了更垂直、更丰富的数据。

  BodyPark 的 "+Gen AI" 企业供图

  03 1+1 现阶段体验优化>效率提升

  36 氪:具体到 BodyPark AI 2.0 战略中,生成式 AI 技术到底发挥了什么作用?

  林宜立:生成式 AI 技术在这个时期非常重要,它大大强化了现有 AI 的体验度。用户体验更好了,感知更智能了,留存和粘性就会更高,最终会体现在复购上。复购变好了,LTV 生命周期价值会更好,我们就有更多的空间去投资品牌、研发算法。

  BodyPark 的产品服务一直是算法和数据驱动的,核心价值也在于通过 " 量化自我 " 来解决消费者在运动场景中的启动难、坚持难问题。生成式 AI 技术能够降低互动门槛,使用户和教练都能更直观地感知训练 / 教学数据,进而认可数据的价值。包括课中实时指导(AI Coach CoPilot)和课后的互动和智能报告(ChatBPK),课后高光时刻 AI 滤镜这样的 AIGC 功能,都会提升数据的交付价值,提升用户体验。使得双边用户都会更加离不开这个工具。

  另外,我们还有「JustFive」5 分钟的纯 AI 游戏化互动的健身产品,可以以更低的门槛触达更广泛的新客群体,让更多用户感知到 AI 对专业度和趣味性的赋能。

  36 氪:之前您提到生成式 AI 技术其实对一些老场景的生产力提升是有帮助的,对 BodyPark 来说,这方面有体现吗?

  林宜立:效率提升方面,其实没有生成式 AI,我们的效率也还蛮高的,因为有自研的识别引擎,以及基于引擎新开发的 AI Coach Copilot。AI 可以辅助真人教练以更高的人效进行课中实时在线教学。

  但同时,我们也在 Coach Copilot 里接入了 LLM 的能力,比如教练端用户训练日志的生成,以及多样性指导话术的生成,也能在一定程度上提升教练的生产力。

  推出 Coach Copilot 后,教练相当于多了一个智能助教,可以实时监控和捕捉多个学员的动作数量与质量。Copilot 除了可以在课中给学员即时的游戏化反馈,还能在教练端屏幕适时地给真人教练提示,帮助教练更从容地对不同学员进行针对性、精细化指导。据我们测算,Copilot 提升了近 3 倍以上的教练单位时间人效产出。这样的沉浸式体验也提升了学员的付费意愿。

  另外,对完整的健身服务来说,不能只是上课,课前、课后的辅导和问题解答等也很重要。而这一部分内容,生成式 AI 技术能帮我们更高效地做到。现在我们一样可以给助教做一个 Copilot,同时用 ChatBot 替代一些职能。消费者问的很多问题,ChatBot 都能智能解答。

  36 氪:在没有推出引入大模型的 ChatBot 之前,你们应该也是能出智能课后报告的,区别在哪?

  林宜立:能做,但是用上一代 AI 对话技术来做会比较生硬,效率也比较低。生成式 AI 的特点是自然语言交互界面天然更友好,消费者不需要做复杂操作,随便一问,AI 就能 " 听得懂 " 并给出非常直观、易理解的回复。

  我们目前发布的 ChatBPK,通过接入大语言模型并进行 Fine-Tune,就像一个真实的、有温度的教练,用户可以有针对性地询问自己的训练情况,规划训练课程。就像前面提到的,人机互动门槛更低,数据价值感知更直观。这样用户的粘性也会更强。

  36 氪:目前 BodyPark 的商业化进展如何?从您的描述来看,有了更可用的生成式 AI 技术,BodyPark 对未来有了更清晰的规划,能展开讲讲吗?

  林宜立:数据上,用户规模已经有了十几倍增长,整体付费用户活跃留存续费数据指标,与行业传统的模式比,都有显著提升。同时,我们已经有了一批忠实的核心用户持续复购,积累了不错的口碑,也已经跑通商业模型 UE(Unit Economics,单位经济模型)。

  BodyPark 的长期愿景是打造全球最领先的下一代「AI 智能教练」和原生「AI 数字化智能运动平台」,让更多消费者养成更积极、健康的生活方式。

  中国的运动健身行业付费渗透率目前不到 3%,而欧达到了 20% 以上。随着疫情的结束和经济的复苏,我们相信新一代消费者对健康运动的需求会更加强烈,未来 3 到 5 年国内的市场规模将有成倍增长。

  我们认为,长期增长的需求、变化的人群结构,叠加新的技术范式突破,一定会让新一代的创业团队有机会 " 抢存量 ",并解锁 " 新增量 " 市场。

  所以今年开始,我们会基于核心的「AI+ 数据 + 课程内容」积累,持续推出更多产品,进一步降低用户参与运动健身的门槛,打造更有趣上瘾、专业安全的智能产品、服务矩阵。同时我们也会探索更多大健康 / 运动 / 医疗康复场景的 C 端和 B 端商业模式,做到 "AI 仰望星空,业务脚踏实地 "。

  36 氪:BodyPark 对未来虚拟教练的畅想是怎样的?会不会是三维的?

  林宜立:三维体验一定会到来,我觉得苹果 XR 发布之后可能会有一波新的机会。未来 XR 设备逐步成熟,我们可以把 2D 的体验复刻成眼前就是有个 3D 虚拟教练站在身边,获得更加沉浸、有临场感的体验。

  这就回到为什么我们说 " 精细量化人体动作 " 这件事具备长期价值。未来 3D 体验普及时,我们今天做的这套体系价值也会更高。因为无论 2D 或 3D,体感交互的用户体验创新,一定需要精准判断人体的动作和姿态,依然需要知道科学训练的课程和动作是怎样的,依然要具备结构化分析用户数据、做智能推荐的能力,以及,能用自然语言交互的方式去和用户互动。

  对 BodyPark 而言,无论是智能手机,智能 TV,可穿戴设备还是 XR,都只是交互方式和载体的变化,都是我们内核算法和数据的外化方式。

  36 氪:未来纯 AI 智能虚拟教练会对现有的商业模式造成影响吗?真人教练和 AI 教练是什么样的关系?

  林宜立:我觉得真人教练和 AI 教练并不是替代关系,反而很长一段时间内都会是相辅相成、互相促进的。对商业模式来讲,是产品矩阵的逻辑,不同的组合创造不一样的价值,消费者的选择会更加分层和多元。

  我们的不少用户,除了上 BodyPark 的线上真人私教课,也会去线下做户外锻炼,也会在碎片时间用 JustFive App 打卡。

  当然,在一些场景中,AI 虚拟教练对真人教练确实有替代作用。比如 JustFive 轻量的游戏化产品,可以让用户获得比传统录播课更加有趣的体验。但是,在另一些场景里,AI 扮演教练 Copilot 的角色,可以辅助真人教练提升教学质量和效率,让用户获得更深度的付费指导体验。

  我们在乎的是消费者的使用频率是不是整体提升了,TimeShare 和 WalletShare 是不是增加了,而不是说未来市场上只能有唯一的一种产品方案。

  尽管 AI 技术飞速发展,我们相信优秀的真人教练是具有不可替代的专业度、信任感和情绪价值的。但是 AI 赋能会拉高行业的平均值,AI 可以在数据化、专业化上增强教练的能力,教练们的行业经验、专业知识也能积累到 AI 技术的应用中,让 AI 技术在健身行业的应用变得更加游刃有余。

  DeepBody Engine 解读 企业供图

上一篇:河北省被低估的高校,非双一流,但就业率高达90%,男生具优势
下一篇:聘期待遇参编!3年后就有正式编啦!

最近更新未来教育