大模型再掀算力浪潮，曙光“ALL in”

ralf 2023-09-04 13:34:46

伴随8家大模型陆续通过《生成式人工智能服务管理暂行办法》备案，文心一言率先向全社会全面开放，AIGC将真正迎来在国内实际落地开花的时期，“百模大战”也将愈演愈烈。

　　ChatGPT带动AIGC火爆的背后，人工智能算力需求也随之暴涨。公开资料显示，GPT-4的模型拥有近1.8万亿参数、13万亿训练数据，其训练一次的成本高达6300万美元，大模型对算力的依赖显而易见。除增加算力资源供给外，算力利用率优化、使用门槛降低也至关重要。

　　无疑，实现算力、算法及应用的智能、协同调度，将算力更高效地转化为生产力，成为制胜百模争“算”时代的关键。

　　作为全产业链覆盖的核心信息基础设施企业，曙光对于大模型及大规模算力的支持与经验，远早于2023年。

　　近年来，基于对产业的深入洞察和前瞻预判，曙光在全国范围内构建了包括智算中心、云中心、一体化大数据中心在内的各类算力中心，掌握了丰富多样且通用性极强的算力资源。通过智能化调度和资源管理，将算力资源上云联网，并以创新型算力服务平台为出口，面向不同行业区域的用户提供可便捷获取的算力和应用。

　　截至目前，曙光已参与“悟道2.0”、“紫东太初”、“文心一言”、“通义千问”等多类大模型的训练、微调、推理等工作，为其提供强劲算力支撑。累计完成30余个国内外主流大模型的适配孵化，包括业界熟知的GPT系列、LLaMA系列、GLM系列等。同等条件下，大模型训练效率及训练稳定性都得到显著提升。

　　此外，针对大模型训练带来的挑战，曙光紧密协同生态伙伴，与百度、阿里、智源研究院、智谱AI、复旦大学、之江实验室、捷通华声等业内领先企业及科研院所深度合作，充分调动起政、产、学、研、用各方力量，打造了面向不同应用场景的大模型一体机、大模型存储解决方案等，提供从底层算力、框架、算法、应用等全栈AI能力，满足多场景需求，加速大模型探索创新及产业化落地。

　　与此同时，由于大模型对算力的巨大需求，能耗问题日益严峻。自2011年开启，曙光便致力于相关探索，研发了领先的浸没式相变液冷技术和冷板式冷却技术，构建了包含计算和存储的全栈绿色计算方案，并已成功实现商业化部署。相比传统风冷模式，在同等功率下，可为AI计算核心部件降温20-30°C；在同等性能下，为算力设备降低能耗30%。目前，中国有超过58%的液冷数据中心选择了曙光的技术方案。

　　信息产业在演变的每个阶段，都会有主流的技术应用方向。在“万变”的环境中，唯有把握前瞻趋势、坚持打造核心竞争力才是应对变化的“不变”法则。无论是大模型，还是下一个新“风口”，曙光早已在等候。

暂无

<<三星注册“Samsung Gauss”商标或为即将推出的生成式AI平台

科技巨头大力发展AI之举加剧能源消耗>>

大模型再掀算力浪潮，曙光“ALL in”

您可能还会对下面的文章感兴趣：

相关文章