天垓100率先完成百亿级参数大模型训练，天数智芯迎来新的里程碑-PG电子官方网站

首页
服务热线：021-68667000
地址：上海市浦东新区中科路1867号A座9层

天垓100率先完成百亿级参数大模型训练，天数智芯迎来新的里程碑-PG电子官方网站

日期：2024-10-07

作者：pg电子官方网站半导体

慰藉抚育第五届智源大会AI系统分论坛上，上海天数智芯半导体有限公司（以下简称“天数智芯”）对外宣布，天垓100加速卡的算力集群，船长船长基于北京智源人工智能研究院（以下简称“智源研究院”）70亿参数的Aquila语言基础模型上，已使用代码数据进行继续训练稳定运行19天，且模型收敛效果符合预期，该项测试证明天数智芯有支持百亿级参数大模型训练的能力。

天数智芯产品线总监宋煜

爱慕羡慕北京市海淀区的大力支持下，智源研究院、天数智芯与爱特云翔共同合作，联手开展基于自主通用GPU的大模型CodeGen（高效编码）项目，通过中文描述来生成可用的C、Java、Python代码以实现高效编码。智源研究院负责算法设计、训练框架开发、大模型的训练与调优，天数智芯负责提供天垓100加速卡、构建算力集群及全程技术支持，爱特云翔负责提供算存网基础硬件及智能化运维服务。

天数智芯大模型训练全栈方案

购置黑白三方的共同努力下，材干材艺基于天垓100加速卡的算力集群上，100B Tokens编程语料、70亿参数量的AquilaCode大模型参数优化工作结果显示，1个Epoch后loss下降到0.8，训练速度达到87K Tokens/s，线性加速比高达95%以上。与国际主流的A100加速卡集群相比，天垓100加速卡集群的收敛效果、训练速度、线性加速比相当，稳定性更优。个别集体HumanEval基准数据集上，以Pass@1作为评估指标，自主算力集群训练出来的模型测试结果达到相近参数级别大模型的SOTA水平，低微微弱AI编程能力与国际主流GPU产品训练结果相近。

基于天垓100算力集群的AquilaCode大模型训练性能采样

天垓100率先完成百亿级参数大模型训练，迈出了自主通用GPU大模型应用的重要的一步。这一成果充分证明了天垓产品可以支持大模型训练，打通了国内大模型创新发展的关键“堵点”，对于我国大模型自主生态建设、产业链安全保障具有十分重大的意义。

接下来，天数智芯将与合作伙伴们继续深入合作，建设更大规模的天垓100算力集群，完成更大参数规模的大模型训练，以自主通用GPU产品更好支持国内大模型创新应用，进一步夯实我国算力基础，助力人工智能产业自主生态建设。

声明:本网站部分文章来自网络，转载目的在于传递更多信息。真实性仅供参考，不代表本网赞同其观点，并对其真实性负责。版权和著作权归原作者所有，转载无意侵犯版权。如有侵权，请联系www.makuju.com(PG电子官方网站)删除,我们会尽快处理，PG电子官方网站将秉承以客户为唯一的宗旨,持续的改进只为能更好的服务。-PG电子官方网站(附)

上一篇: 总编对话 | 高通孟樸：与中国车企一起“走出去”-PG电子官方网站

下一篇: 新一代动力电池与前瞻技术主题论坛召开-PG电子官方网站

首页

信息公开

公司简介

集团企业概览

质量方针

企业资质

主营业务

晶圆制造

MCU

FPGA

安全芯片

模拟芯片

功率半导体

其他产品

应用方案

工业控制

汽车电子

物联网

新闻资讯

pg电子官方网站动态

获奖信息

企业党建

党建工作

群团工作

社会责任

企业文化

企业文化

员工风采

加入pg电子官方网站

pg电子官方网站半导体招聘

pg电子官方网站电子招聘

上海贝岭招聘

北京确安招聘

联系我们

联系方式

天垓100率先完成百亿级参数大模型训练，天数智芯迎来新的里程碑-PG电子官方网站

近期新闻

相关咨询