Skip to content

国产加速卡介绍

目前集群可用的国产加速卡为异构加速卡1、异构加速卡2和异构加速卡AI,异构加速卡1、异构加速卡2为全精度卡,支持科学计算、AI for sicence、人工智能多种场景。其中,异构加速卡AI支持FP32、TF32、BF16、FP16、INT8等精度,是为人工智能计算场景推出的专业加速卡。

一、异构加速卡AI卡介绍

新一代国产AI加速卡,是基于通用 GPGPU架构设计,覆盖主流AI算力精度,性能可对标NVIDIA类产品,具有应用生态完善,迁移成本低的特点,基于PyTorch、TensorFlow 等主流框架实现的代码无需转码,可直接使用,是构建 AI算力的不二之选,具有较高性价比。支持在人工智能的全领域应用,如自然语言大模型、多模态大模型、MOE大模型、视觉大模型、通用模型、语音模型等,支持模型训练及推理落地,实现快速的国产加速卡人工智能应用迁移、开发及迭代。

经过验证测试,在异构加速卡AI上实现了训、推一体,AI场景全覆盖,70B及以上大模型推理实测性能达到L20的80%。llama2-70B 模型在首字响应,吞吐性能等方面都表现出较好的性能。

二、异构加速卡AI生态介绍

DTK类比CUDA,是搭配国产加速卡使用的基础环境平台,DTK集成了DCC编译器、经验证和优化的计算库, 支持多种编程语言,同时提供运行、编译、调试和性能分析功能。 DAS是针对国产加速卡推出的一套完整的人工智能基础软件,包含基础算子层、框架工具层、扩展组件层,与国产加速卡基础硬件系统、DTK 开发工具栈、模型空间 Model Zoo 、镜像仓库等形成一套完整的国产加速卡人工智能软硬件生态体系。

DAS支持新一代异构加速卡AI,实现了AI的全场景覆盖和高效性能表现,为满足人工智能的快速发展需要,整体发版节奏以月度更新,同时为满足开源开放需求,在开发者社区建立OpenDAS开源空间,加速国产加速卡的人工智能软件生态建设。

常见框架轮子包可在网址:光合开发者社区-DAS下载,轮子包与国产卡深度适配,包含PyTorch、TensorFlow等主流框架,覆盖多个常用版本,其他版本不断维护更新中。 想了解更多DTK、DAS相关内容可查看附件。

为了方便人工智能相关用户的使用,异构加速卡AI支持在Notebook中使用,提供多个支持异构加速卡AI使用的基础镜像,预装常用AI框架与依赖,便捷高效,更有多种模型镜像,封装热门开源项目,开箱即用。可参考以下具体产品的使用引导。