首页 运营技巧正文

智源发布悟道3.0,天数智芯从底层赋能大模型发展

hezhisheng026 运营技巧 2024-02-08 09:00:02 67 0

     6月9-10日,由北京智源人工智能研究院举办的2023智源大会正式召开。与会期间,智源发布了完整的悟道3.0大模型系列,标志着大模型进入到了全面开源的新阶段。此次悟道3.0包含首 个支持中英双语知识、开源商用许可的“悟道·天鹰(Aquila)”语言大模型系列,提供“能力-任务-指标”三维评测框架的“天秤(FlagEval)”大模型评测体系,力求打造大模型时代“新Linux”生态的FlagOpen大模型开源技术体系,以及6项“悟道·视界”视觉大模型研究成果。

       一年一度的智源大会是国际人工智能生态发展的标志性活动,全球人工智能精英汇聚一堂,用最前沿的成果、最广阔的国际视野进行思想碰撞。大模型成为主角的背后,是此前ChatGPT掀起全球技术革命和商业浪潮的必然结果。如今,伴随着大模型的快速崛起及广泛应用,底层算力的支撑作用愈发凸显。潮流之下,国内领先的AI硬件公司天数智芯与此次智源大会有多方面的深度合作。

       在技术推动层面,基于天数智芯天垓100加速卡的算力集群,仅用19天便成功完成北京智源人工智能研究院70亿参数大模型全量训练,收敛效果与英伟达A100集群相当。天数智芯从硬件、软件两个角度推动战略升级,打造高性价比、广通用性的全栈式集群解决方案,为大模型时代提供强大算力底座。

       天数智芯的通用GPU产品天垓、智铠系列具有自主可控、高性能、通用性、灵活性等特点,广泛支持PyTorch、TensorFlow、PaddlePaddle 等各种原生框架,支撑了200余种人工智能算法模型稳定运行。在此基础上,天数智芯自主研发了IXCCL分布式通信技术,显著提升多机多卡高速互联性能,打造基于自主通用GPU的算力集群方案,持续优化自动混精训练、流水线并行、张量并行、数据并行以及模型并行等并行加速策略,让大模型训练、推理变得更加有效。

       大模型应用的海量爆发,天数智芯以持续的研发和技术升级,支撑算力成规模增长的需求。用国际领先的高性能通用GPU产品,不断升级算力解决方案,适配支持更多参数量、更大数据集、更复杂算法的大模型。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

本文链接:https://www.16i.cc/post/46413.html