近日,腾讯TEG数据平台部机器学习团队与北京大学-腾讯协同创新实验室,合作研发了全新的稀疏大模型训练加速解决方案HET,其研究成果《HET:ScalingoutHugeEmbeddingModelTrainingviaCache-enabledDistributedFramework》已被国际顶会VLDB2022录用。HET提出了一种新颖的基于Embedding缓存的训练方法,能够显著降低稀疏大模型分布式训练时通信开销,提升模型训练整体效率。HET目前已正式开源:https://github.com/PKU-DAIR/Hetu稀疏大模型日