よしだやなお(吉田矢奈绪)网

腾讯吐露最新大模子磨炼措施,可节约50%算力老本

时间:2025-03-17 15:18:14 来源:

21世纪经济报道记者白杨 北京报道

随着大模子时期到来  ,腾讯吐露模子参数呈指数级削减 ,最新已经抵达万亿级别。大模与此同时,磨炼大模子也逐渐从反对于繁多模态 、措施繁多使命睁开为反对于多种模态下的可节多种使命。

在这种趋向下,约算大模子磨炼所需算力重大,力老远超单个芯片的腾讯吐露处置速率,而多卡扩散式磨炼通讯斲丧重大 。最新若何后退硬件资源运用率 ,大模成为影响国产大模子技术睁开以及适用性的磨炼紧张条件 。

在此布景下 ,措施腾讯于11月23日宣告,可节腾讯混元大模子眼前的约算自研机械学习框架Angel再次降级,可将大模子磨炼功能提升至主流开源框架的2.6倍 ,千亿级大模子磨炼可节约50%算力老本 。

Angel能耐提升眼前,是基于磨炼框架以及推理框架的迭代。据悉 ,面向大模子磨炼,腾讯自研了机械学习磨炼框架AngelPTM,可针对于预磨炼 、模子精调以及强化学习等全流程妨碍减速以及优化,可能以更少的资源以及更快的速率磨炼更大的模子 。

而为了处置推理老本的不断回升 ,腾讯自研的大模子推理框架AngelHCF经由扩展并行能耐、接管多种Attention优化策略等方式对于功能妨碍了提升。同时,框架还适配了多种缩短算法 ,之后退吞吐能耐,从而实现更快的推理功能以及更低的老本。

实测数据展现,相较于业界主流框架,AngelHCF的推理速率后退了1.3倍 。在腾讯混元大模子文生图的运用中  ,推理耗时从原有的10秒延迟至3-4秒。

此外 ,降级后的Angel还提供了从模子研发到运用落地的一站式平台,搜罗数据处置、精调 、模子评估 、一键部署以及揭示词调下等效率 ,让大模子的“开箱即用”成为可能 。

据介绍 ,在运用开拓层面,腾讯外部已经有逾越300项营业以及运用途景接入腾讯混元大模子内测,比照上个月数目翻了一倍。

(作者  :白杨 编纂 :骆一帆)

推荐资讯
【亚泰同框】毕津浩诠释中超赛场妙不可言的缘分

【亚泰同框】毕津浩诠释中超赛场妙不可言的缘分

一加12三款配色宣告:号称“行业最顶级工艺”

一加12三款配色宣告:号称“行业最顶级工艺”

詹姆斯高效+无解,22分钟轰30+8,再次刷爆纪录,湖人队持续升级37年前,那个出生时14.5斤的“巨婴”,现在长大后成啥样了?

詹姆斯高效+无解,22分钟轰30+8,再次刷爆纪录,湖人队持续升级37年前,那个出生时14.5斤的“巨婴”,现在长大后成啥样了?

主打轻越野细分市场 哈弗猛龙值得入手吗

主打轻越野细分市场 哈弗猛龙值得入手吗

马竞3-1费耶诺德取3连胜,埃尔莫索破门30年前那位渴望上学的“大眼睛女孩”,国家重点培养,现咋样了

马竞3-1费耶诺德取3连胜,埃尔莫索破门30年前那位渴望上学的“大眼睛女孩”,国家重点培养,现咋样了

[瞎话板]哈利赛后更推:We going to the ship(咱们要去决赛了)!

[瞎话板]哈利赛后更推:We going to the ship(咱们要去决赛了)!

copyright © 2016 powered by よしだやなお(吉田矢奈绪)网   sitemap