腾讯自研混元大模型亮相,将通过腾讯云对外开放
国产大模型进入长跑期,从参数至上转向实用优先。
在今天举行的 2023 腾讯全球数字生态大会上,腾讯混元大模型亮相,并宣布通过腾讯云对外开放。据悉,腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超 2 万亿 tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
据腾讯称,腾讯混元大模型是 " 从实践中来,到实践中去 " 的实用级大模型。腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ 浏览器等超过 50 个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。混元大模型将作为腾讯云 MaaS 服务的底座,客户不仅可以直接通过 API 调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。
腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生表示:" 以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新的思路。大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。"
全链路技术自研,在中文理科、高考题和数学上表现突出
腾讯集团副总裁蒋杰介绍,腾讯混元大模型从第一个 token 开始从零训练,掌握了从模型算法到机器学习框架,再到 AI 基础设施的全链路自研技术。
从 2021 年开始,腾讯先后推出千亿和万亿参数的 NLP 稀疏大模型,打破 CLUE 三大榜单记录,实现在中文理解能力上的新突破。
目前,业界大模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。
针对大模型容易 " 胡言乱语 " 的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了 30% 至 50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。
得益于全链路自研技术,腾讯混元大模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。除此之外,它还能进行文学创作、文本摘要、角色扮演等内容创作,做到充分理解用户意图,并高效、准确的给出有时效性的答复。
在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中,混元大模型共测评 66 个能力项,在 " 模型开发 " 和 " 模型能力 " 两个重要领域的综合评价均获得了当前的最高分。在主流的评测集 MMLU、CEval 和 AGI-eval 上,混元大模型均有优异的表现,特别是在中文的理科、高考题和数学等子项上表现突出。
上海财经大学校长刘元春认为:" 借助于全链路自研,中国将不断积累大模型相关人才和技术,逐渐形成体系化的产业链、人才链、技术链和创新链,最终走出一条发展通用人工智能的中国路径,助力我们在数字技术的创新上取得突破性进展。"
腾讯全面拥抱大模型
腾讯自研混元大模型亮相,也代表着腾讯在大模型上的全面拥抱态势。蒋杰表示,研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。"
此次大会上,蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。比如腾讯会议基于混元大模型打造了 AI 小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。
在文档处理方面,腾讯混元大模型支持数十种文本创作场景,在腾讯文档推出的智能助手功能中已有应用。同时,混元还能够一键生成标准格式文本,精通数百种 Excel 公式,支持自然语言生成函数,并基于表格内容生成图表,目前这些功能正在内测阶段,将在成熟后面向用户开放。
据了解,今年 6 月,腾讯云推出了模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务。最近,腾讯云也全面接入 Llama 2、Bloom 等 20 多个主流模型,和混元一样,都支持直接部署调用。客户可以根据实际需求,基于混元、也可以基于开源模型,打造自己专属的行业大模型。
作者:徐晶卉
编辑:商慧
责任编辑:戎兵
* 文汇独家稿件,转载请注明出处。
上一篇:花样迎新 家校共育!德州学院7350名新生启航逐梦
下一篇:头部企业集中落户福田,这里已成建装行业头部企业集聚区
最近更新职业教育
- 加强行刑衔接协作 合力守护绿水青山
- 名单公布!南昌31名学霸上榜!
- 北京有车型优惠超10万元,南阳有门店贴出“国货惠民价7.59万元起”海报,合资车
- 事业单位编外人员转为雇员制行不行?银川市人社局回复了这份提案
- 老师曝光教室无窗帘被约谈 校长停职、教室已全部安装窗帘
- 大祥区中小学心理健康教育教师能力提升培训圆满结束
- 最美家庭展播二:梁芳清家庭
- 王晓龙谈国内青训:我们只有初中水平老师,教不出大学水平的学生
- 11月起 四川学业规划行业有了“国家标准”
- 河南2023年度全省职称评审工作开始
- gre数学有哪些备考方法
- 最优模型估算:祁连山国家公园青海片区雪豹种群数量为251只
- 家庭教育公开课第八讲 | 关爱青少年心理健康
- 重磅消息 | 第十二届商学院数字化论坛即将启幕!
- 《志愿军:雄兵出击》发布路演特辑
- 建筑“黑科技”闪耀长沙筑博会
- 为青春点赞!你最喜爱哪支广东青年大学生“百千万工程”突击队?
- 扬州各学校开展形式多样的庆祝活动 喜迎建队日争做好队员
- 深圳发布农贸市场综合治理第三轮测评结果 低于80分市场数量大幅度减少
- 2023下半年湖南英语四六级考试时间安排
- 朝阳营商环境考评成绩连续五年居全市第一
- 小米 14 表现如何?数据库实测性能续航充电等
- 发表SCI论文,申请专利,青年标兵……她是曲园学子李雯鑫
- “湿”意盎然的生态答卷丨马鞍山:水清岸绿 石臼湖风光美如画
- 「一线新动态」十年深耕涉外高端电力人才培养,“电力工程师的摇篮”助力“一带一路”