9月7日,在2023腾讯全球数字生态大会上,备受期待的腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。
据介绍,腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生在会上就透露,目前混元大模型已经接入腾讯50多个业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。汤道生表示,千行百业也可以调用混元,或者将混元作为基底模型,为不同产业场景构建大模型应用。
特别值得期待的是,针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;还提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。
火爆的大模型领域终于迎来了腾讯的加入,虽迟但到,值得期待。
南方日报记者 叶丹