灵魂拷问“京东言犀大模型” 究竟有啥不一样?
继文心、阿里通义之后,姗姗来迟的言犀大模型可谓吊足了大家的胃口。
在13日的2023全球科技探索者大会上,言犀大模型如约亮相。而与现有的千亿级通用大模型不同,言犀大模型成为京东“大模型基础设施能力”打造的样板间,其“源于产业,服务产业”的发展路径让大模型背后的“AI开发计算平台”更加引人瞩目。
问:京东大模型这么晚才发卖什么关子?
答:不能在“最后一公里”掉链子
从2021年构建天琴超算集群开始训练大模型,到2022年百亿级大模型的雏形初成,京东集团技术委员会主席、京东云事业部总裁曹鹏一直被追问:“京东怎么还不发大模型?”
对此,曹鹏的回答是——大模型不应该只是拿来聊天写诗作画的玩具,对话类的通用大模型不应该是全部,而这正解释了京东千亿级大模型“言犀”诞生的初衷。
于京东而言,创造产业价值是大模型的目标。
“大模型真正实现自己的价值,一定是在产业应用中。”京东集团CEO许冉亲自为京东大模型定调。她表示,大模型的价值=算法×算力×数据×产业厚度的平方。“如果大模型研发只在前三个指标发力,忽视了产业厚度,就好比电商在物流最后一公里掉链子,产品和服务满足不了消费者需求,再多努力也没用。对大模型来说,这产业落地的最后一公里,看起来并不遥远,却是能用和不能用的区别。”
许冉坦言,过去的技术发展,曾经数次达到应用爆发的边缘,但最终往往昙花一现。技术没有在产业端形成扎实的应用,是重要的原因之一。“创造明确的价值应当是技术的目标。我们笃信:当产业效率和产业的边界拓展,得到质的提升后,大模型才有了更重要的实际价值和意义,将不亚于又一次工业革命。”她说。
据介绍,与通用大模型相比,京东言犀大模型源于产业、服务产业,融合了70%通用数据与30%数智供应链原生数据,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。
“供应链产业链上的大模型更有价值,因为供应链的链条越长,带来的数据相关性更高,相关性高的训练数据越多,模型越大,才越有可能产生产业端的智能涌现。同时这些模型更能切实解决实际场景中的问题,带来更好的经济和社会价值,也有助于模型获取更多的资源持续发展。”曹鹏坦言,言犀在训练时除了使用通用语料数据之外,还大量使用了京东各种场景积累的优质数据,可以说天然具有产业基因,能够更好地适配实体场景,解决真实的产业问题。
而在言犀之外,京东更像是在通过大模型秀技术肌肉。早在2017年初,京东推出“技术、技术、技术”口号,开始的布局与落地。在2020年的JDD大会上,京东对外发布言犀智能应用平台。2021年,京东就推出十亿级模型K-PLUG,2022年推出百亿级模型Vega。
7月13日,京东推出言犀大模型的同时,还发布了一套大模型的完整工具,包括支撑大模型研发的基础设施——言犀AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。
“京东的大模型技术演进,遵循了京东的技术追求:成本、效率、体验、可信、普惠、突破。成本、效率和体验是从京东的经营理念传承而来,也是零售的第一性原理。可信、普惠和突破则是技术服务于产业和社会的承诺。”许冉表示,“从产业切入大模型,这条路虽然难走,却如同从北坡攀登珠峰,有更波澜壮阔的风景,有巨大的探索价值。”
问:如何深入产业、服务产业?
答:三步走,刚刚走到第二步
“言之有物,心有灵犀”,这是京东赋予“言犀大模型”的内涵。
按照京东大模型的“三步走”策略:目前,京东云已经基于内部实践构建了通用大模型;到今年年底,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务;预计在2024年初,会将大模型能力向外部严肃商业场景开放。目前,京东已经走到第二步,并在内部取得了丰富的实践成果。
京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬表示,京东的数据是“鲜活的”,京东平台每年产生数百亿的交互数据,这保证了模型的持续迭代和优化。
“某种意义上,我们的大模型相当于既做了通识,又读了四年专业性的本科。”何晓冬表示,“目前大模型发展已经处于‘百花争艳’的状态,站在这个时间点,我们应该思考的不是技术追赶,而是产业突破。”据介绍,京东计划进一步将大模型聚焦于行业应用,包括在零售、物流、政务、金融等行业引入更多的行业知识,使大模型更好地沉淀并服务于行业需求。
在大会现场,京东演示了多个将通用大模型转化为可用的“产业大模型”的实践案例。
以大健康产业为例,通常,客户完成这套流程,从数据准备、模型训练到模型部署,需要10余名科学家花费一周时间。但利用言犀AI开发计算平台,只需要1至2名算法人员,在数分钟就能完成。通过平台模型加速工具的优化,还能节省90%的推理成本。
发布的京医千询大模型,就是建立在京东言犀通用大模型基础之上,能快速完成在医疗健康领域各个场景的迁移和学习,从而实现产品和解决方案的全面AI化部署,能为远程提供坚实的技术底座。
此外,在金融财富管理场景中,目前京东机构代销系统中已经上线言犀有方模块,给机构客户提供更便捷的基金筛选和投研分析功能。
问:大模型背后还有“野心”?
答:解耦、输出,让AI成为新型基础设施
在京东大模型的背后,言犀AI开发计算平台成为最受业界关注的产品。记者从京东方面了解到,为了降低企业享受大模型技术红利的门槛,京东把大模型的底层能力解耦出来,包括但不局限于算力、算法和数据,由此打造的“言犀AI开发计算平台”目前已启动预约注册,8月将正式对外使用。平台不仅提供京东自研的言犀大模型,也支持行业各类开源通用模型。这意味着,依托该平台,垂类行业大模型的开发门槛进一步降低,通用大模型的“长尾效应”有望被进一步释放。
据曹鹏介绍,言犀AI开发计算平台沉淀了京东在零售、物流、健康、金融等行业多年积累的知识,通过算法工具集成到平台,并部署了京东技术团队开发出的100多种训练和推理优化工具,结合低代码应用平台,为客户提供从数据建设到模型应用的一站式服务。不到一周时间,用户即可完成从数据准备、模型训练到模型部署的全流程;之前需要10余人的科学家团队工作,现在只需要1至2个算法人员;通过平台模型加速工具优化,节约90%的推理成本。
此外,京东丰富的业务场景,可以为平台上的基础大模型提供具体的行业应用场景,促进入驻企业加速基于大模型的商业化落地。
在高性能HPC方面,言犀大模型开发计算平台可提供GPU、CPU、IPU等各类型算力资源,可以针对推理速度、推理成本以及模型大小不同的业务需求,提供定制化解决方案。同时,平台还能为入驻企业提供大模型开发应用的各种硬件资源的支持。
在大会现场,京东还宣布携手零售和金融行业伙伴,在零售场景探索供应链优化、顾客体验、营销降本增效等方面,以及金融场景探索金融客服、智能投顾、产品营销等方面,共建零售和金融行业的大模型创新应用。
正如许冉所说:“京东发展大模型的旅程,注定会与产业伙伴携手同行。”唯有这样,才能让技术走出实验室和公司的围墙,真正推动社会和生产力变革,在产业场景发挥更大价值。
最近更新人物资讯
- 青年节专题时文精选,1个专题+5篇模板+12篇范文+1个作文合集(角度+金句+精
- 最新质量管理体系基本要求(五篇)
- 赤坂丽颜值巅峰之作,禁忌之爱代表作品-高校教师成熟
- [王仲黎]人茶共生:布朗族茶文化话语中的生态伦理
- 北京文艺日历 06.12~06.18
- 有什么好看的少女漫画推荐?
- 为了孩子陪睡校长,请别拿这电影洗白
- 当贝市场tv版apk下载
- 茉
- BBC评出有史以来美国最伟大的100部电影
- 泰山岱庙古建筑之文化特色初探
- 阴阳五行学说范文
- 2022伦敦大学学院Bartlett建筑学院Part2毕业展
- 观看平凡英雄观后感1000字
- 纽约大都会博物馆(二)古希腊艺术与神话
- 收藏 | 带你穿越500年,看一看这50位著名艺术家
- ab血型女人的性格
- 春节活动策划方案
- 为什么孕妇生产有危险时,部分丈夫和婆婆会选择保小孩?
- 《员工自发管理的儒家修为智慧》
- 菲律宾尺度片的全明星阵容,菲律宾女人质量这么高的吗?
- 文学课 | 韩少功:文学与记忆
- 《人性的污秽》中的伦理道德世界
- 宋惠莲背夫和西门庆幽会后自缢,看透情色表象下的死亡真相
- 秋波多少画(五代词全集)