摩尔线程 摩尔线程确实收获了不少。不仅如此,MTTS80也是业内首个PCIe5.0的显卡,支持双向128GB/s的传输带宽。更重要的是,哪怕标榜的是游戏显卡,MTTS80依然支持3D图形渲染、智能多媒体、物理仿真及科学计算和AI计算加速的全功能应用。
MTTS3000/摩尔线程 除了MTTS80以外,春晓这一芯片也为摩尔线程带来了面向服务器GPU市场的新产品,MTTS3000。单从芯片规格上来看,MTTS3000与MTTS80都用的是完整的MT-春晓芯片,都内置了4096个MUSA流处理单元,但前者将主频提高到了1.9GHz,FP32也因此提升到了15.2TFLOPS。为了让MTTS3000更适用于服务器市场,摩尔线程也将其显存提升至了32GB,并增加了对虚拟化的支持,可对GPU弹性切分。MTTS3000也从MTTS80的主动散热改为了被动散热。到了AI上,摩尔线程的MUSA架构和软件栈为MTTS3000提供了训推一体的支持。
芯动科技 在使用GPU这类产品的过程中,支持不同的图形与计算API对于开发者来说尤为重要。而芯动科技的风华GPU在这API上的支持尤为亮眼,目前已经完美支持到OpenGL4.3、OpenGLES3.2、Vulkan1.2和OpenCL3.0,这为风华GPU的开发生态奠定了基础。虽然其产品性能本身已经足够亮眼,但风华GPU最大的优势在于芯动自研高性能接口IP。这些接口IP包括高带宽内存(GDDR6x、HBM3)、高速SerDes(PCIe5.0、CXL2.0)和高清多媒体(HDMI2.1、eDP1.4),同时这些IP也实现了对先进工艺的覆盖。
壁仞科技 壁仞科技的BR100系列通用GPU芯片在性能上达到了极高水准。与摩尔线程和芯动科技不同,BR100更适合于AI和科学计算这样的高性能计算场景,所以并没有去做DirectX和Vulkan这样的图形API支持。单个BR100由16个流处理簇构成,每个都采用了16个执行单元的设计,每个执行单元包含16个流处理核心(V-core)和一个向量引擎(T-Core)。V-Core支持到FP32、FP16、INT32、INT16,用于通用计算。T-Core在SPC级别的2.5DGEMM架构下,可以极大加速常见的AI运算,如MMA矩阵乘加和卷积等。