AI 画的一只鸟,啄开了京东云的技术大门

栏目:人物资讯  时间:2022-11-22
手机版

  距离2017年京东提出三个技术的口号已经过去五年。

  这五年来,京东通过技术沉淀的决心,进一步坐实了以供应链为基础的技术与服务企业的定位。

  在数智供应链成为京东标签的同时,京东云也依托强大的 AI 技术,完成了它从里到外的华丽转身,成为京东技术对外输出的核心发力点。

  1、一只不会飞的鸟

  那时 AIGC 还没火。

  何晓冬记得,当时他刚回国不久。他与合作者提出的一个工作,叫「AttnGAN」,可以在计算机上输入一行文字描述,这个模型就会自动生成一只红白肚皮、蓝背的小鸟。

  就像能读懂人的意志一样,让创造了它的何晓冬也感到震惊。

  加入京东后,他把这个工作展示给了几位高管看后,大家都很赞叹,没想到 AI 的能力已经如此强大——

  文字与图像是两种不同的模态,模态之间的交流与互动往往如跨越千山才能遇万水,但在人也尚且不能很好地理解 AI 的时候,AI 就已经能通过一段简短的文字描述画出相应的图像,而且准确率和清晰度都能与人类媲美。

  那是 2018 年。输入文本控制图像生成的技术已经出现,但想象力还未形成。大家虽然赞叹,但回头一想,不知道这样的技术可以用在什么地方。

  后来何晓冬告诉雷峰网,那时他刚加入京东,其实还做了不少 AIGC 方向的基础研究,例如文案生成、AI 写诗,还有跟中央美院的邱志杰教授合作探索AI画图、AI写书法等。而这篇 AttnGAN 的论文现在已经被引用超过1千多次了,是AIGC领域的经典工作之一。

  

  何晓冬及同事在2018年提出文本-图像生成模型「AttnGAN」

  但如果回顾京东的整个 AI 技术研发进化史,何晓冬用 AI 画鸟的研究,恰是其中一个缩影,也是一个不可缺少的注脚:雷峰网

  时间回到2017年,在那一年的京东年会上 「技术!技术!技术」被提出来,京东也由此迈入技术研发高速发展的阶段。雷峰网

  然而,彼时支撑京东技术野心之一的人工智能(AI)技术研发并没有成立一个单独的部门,而是散落在各个业务部门的单点研发中。雷峰网

  当年9月,京东成立了「AI 平台与研究部」,聚焦于 AI 技术探索,并陆续成立了一系列实验室,包括 AI 研究院、深度学习及语音和语言实验室、计算机视觉与多媒体实验室、数据智能实验室…到2018年年初,京东已经聚集了一批业内顶尖的 AI 科学家,如何晓冬、梅涛、郑宇等。

  

  何晓冬

  从2017年年底到2018年,这批科学家探索了许多夯实的 AI 基础技术研究项目,如大数据、优化算法、语音与语义识别算法,为京东奠定 AI 研究基础。

  这几年,京东的 AI 团队在变化中不断壮大,如今,京东的 AI 能力以京东云为核心出口,对外输出。

  2、供应链中的 AI

  大体来说,技术互联网公司可以分为三种类型:

  第一种是卖基础产品,如微软,从磁盘操作系统(DOS)开始,然后到 Windows 与其他软件产品,成为一家软件为主的公司;

  第二种是技术驱动,如谷歌,先基于搜索引擎技术做出的「谷歌搜索」(Google Search),没有作为单一产品卖出,后面才逐渐找到盈利的方法;

  第三种就是业务驱动,先有业务需求(如卖货),再渐渐成型、建立起一个技术系统,如京东。

  这也意味着,京东的技术研发必然与业务赋能捆绑。这甚至是所有 AI 科学家在加入京东时就了然于心的共识。比如,京东在2017年9月宣布成立AI平台与研究部的时候就明确提到, AI 研究与平台部承载着推动第四次零售革命中发挥重要作用。

  

  京东亚洲一号仓

  京东的三个技术口号,实际上也各有侧重:

  第一个技术代表了京东最基础、最朴素的需求,即如何提升京东现有业务(尤其是零售与物流)的效率。京东的自营模式决定其供应链涉及多个环节,不仅包括采购采销、运输仓储、服务交易,还有商品在平台上的展示、搜索、推荐与售后客服等。这一块以京东零售与物流为主。

  第二个技术指可以标准化、模块化、产品化输出的通用技术,如云计算、智能客服,代表了京东向外链接千行百业的愿景。京东认为,实际上大量的行业都有与供应链相关的技术需求,例如金融与航空,所以第二个技术是基于第一个技术在内部的实践与沉淀来展开。

  而第三个技术,是面向未来的基础技术研发,如过去十年以深度学习为代表的 AI。如今,这一块由京东探索研究院(2020年成立)、京东 AI 研究院(2017年成立)等团队主要承担,近年来以陶大程为代表对外发声的可信 AI、产业元宇宙等概念,均属于第三个技术对前沿的展望。

  AI 研发在京东供应链的整体落地,也是沿着这三个技术排序走:

  过去五年,1.0 时代,京东零售与物流打头阵,研发人员规模多达几千人,在京东内部的各个供应链环节都部署了 AI 技术,覆盖语音、文本、图像与决策。

  有数据统计,在维持现货率 95% 以上水平的同时,京东通过智能供应链系统下发的采购单超过上亿条,内配自动化率达到 90% 以上。自营 SKU 超过 1000 万、全国 1400 个仓,也能将库存周转天数从90余天降至近30天左右,背后正是京东云的大数据与 AI 算法等技术的加持。

  AI 与供应链结合的一个特点,就是摸索出产业对多模态技术研发的需求。以智能对话为例:

  2018年7月,何晓冬带领深度学习及语音和语言实验室启动了一个叫「AlphaSales」的研究项目,后来对应的产品中文名就叫京小智。

  与采购、计划、配送相比,客户服务被认为是供应链中最末端的环节。但实际上,京东当时每天接待数百万客户咨询、导购、服务等需求(现在已经超过一千万),智能对话的应用价值显然巨大。基于 AlphaSales框架,结合语音识别、图像理解、情绪理解、文字生成甚至序列决策(根据客户回复、结合上下文内容推断下一句生成的文字回复)等基础的 AI 技术,京小智大大改善了京东的客服质量与效率。

  具体来说,供应链很长,分生产、流通、消费、服务四大环节,四大环节的基础上又可以细分出设计、定价、交付等十余个环节,人工智能技术也如此(非单一技术方向):

  

  而当 AI 落地在供应链上,你会惊奇地发现:AI 是一项基础技术,可以应用在供应链的各个环节上;且 AI 在每个环节上的应用,都涉及到两个以上的单点技术。例如,在智能对话一环的语音、语言、图像、优化、决策,相互组合时,也是供应链中设计、生产、采购、运输、仓储管理等等环节的核心技术:

  

  作为最早加入京东研究 AI 的参与者之一,何晓冬表示,在京东研究 AI,最大的感触就是:如果从供应链的角度看 AI 研究,AI 的应用范围和潜力都会被放大。AI技术的先进性也在被重新定义,供应链向 AI 提出了融合、多算法联合优化的需求,而非单点算法的进步。

  在这样的背景下,京东的 AI 研究也不可避免地走向多模态融合,其技术成果也天然地具备为大多数行业服务的特质:标准化,模块化,端到端,全链条。

  3、迈向 2.0:京东云的「野望」

  与许多大厂不同的是,京东招聘 AI 科学家,一开始往往就定了十分明确的目标:技术商业化。也就是说,不仅服务京东内部的零售、物流、金融、健康等业务,还要基于服务内部所积累的能力走出去,服务千行百业。

  这个目标使京东的 AI 团队在初成立时就同时扮演了两种角色:既是支持京东业务的子部门,也是京东内设的一个「AI 创业公司」。

  京东的 AI平台与研究部刚成立时,也陷入过与其他企业 AI 研究团队雷同的「困境」:其他部门常常过来寻求 AI 算法的支援,但他们帮忙做了一年后发现,一方面业务提供的场景对 AI 技术的打磨很关键,但另一方面,针对业务定制AI技术往往做不成大项目,而且成本还很高。

  例如,帮忙跟进的内部项目往往需要不断修改完善,十分消耗时间,对高人力成本的 AI 算法团队来说颇有点「大材小用」。另一方面,时间与精力被占据,也无法「创业」。

  因此,从2019年开始,京东各个业务的定制化技术需求由其自建的研发团队负责,京东的 AI 部门不再接低ROI的商业项目,而是致力于研发高价值的、可以模块化、可复制的技术产品。

  这就好比原来给屠宰场磨牛刀的铁匠,决心要自己单干,开了个工厂,聚集一批专注于打造武器的人,生产不仅能够用在屠宰场,还能用在战场、军事训练基地、龙门镖局等等不同场所的兵器武器,降本增效地将技术商业化。

  何晓冬认为,技术的成功商业化是技术走向成熟的一个标志。

  2020年,这座集中生产武器的工厂有了一个新的名字:京东言犀人工智能应用平台(简称「言犀」)。言犀隶属于京东科技集团,可以看成是京东云的AI武器库,聚集了京东过去在供应链各个环节的智能技术的积累,包括语音识别与合成、自然语言处理、视觉智能、机器学习、知识图谱、多轮对话、多模态智能人机交互、大模型等都汇聚其中。

上一篇:日本女网红跑到印度恒河水中沐浴,结果高烧重病!她如此“想不开”的原因是……
下一篇:30句高考作文万能句型,背过直接用!