Arm SME即将落地Android 移动端AI性能将迎来大提升

Antutu

阅读 1227

近日,Arm在官方社区博客中发布了《Get Ready for Arm SME, coming soon to Android》一文,宣布其面向 Armv9 架构的可扩展矩阵扩展(Scalable Matrix Extension,简称 SME)将在下一代Android移动设备上得到支持,开发者无需修改现有代码,即可在多款设备上利用SME2提升AI应用的性能与能效。

SME是在Armv9架构之上,对可扩展向量扩展(SVE、SVE2)进行的补充与增强,专门针对矩阵运算场景进行了优化设计。

图片

与传统的向量指令不同,SME引入了对大规模矩阵数据的硬件级处理能力,能够在指令集层面高效执行矩阵乘加等核心运算,从而显著提高机器学习与深度学习推理的吞吐量。在性能方面,SME可提供以数倍级别计的浮点运算加速。

根据Arm的技术介绍,SME2不仅在硬件中加入了大量矩阵寄存器,还优化了数据在矩阵寄存器与系统内存之间的读写带宽,确保在大中型矩阵运算时,能充分发挥出算力优势。这对于神经网络中的多层全连接、卷积等计算密集型操作,能够带来显著的延迟与吞吐量提升。

面向Android平台,SME2的接入也做到了几乎“零成本”——开发者不需要对已有的AI框架或模型代码进行改动。Arm已经与主流深度学习框架(如 TensorFlow Lite、ONNX Runtime、PyTorch Mobile)和相应的运行时环境深度合作,通过底层库的更新,一键开通SME2支持后,即可在搭载Armv9+A SME2硬件的智能手机、平板等设备上自动启用矩阵加速功能。

图片

SME2目前已在iOS设备上可用,开发人员可以开始在具有SME2原生支持的各种AI框架和运行时库之上构建AI应用程序,应用程序中SME2增强的性能将可在基于Arm的平台(从iOS和iPadOS到MacOS和Android)之间移植。

原创文章,作者:HyperZ-Ton,如若转载,请注明出处:http://www.antutu.com/doc/134797.htm

相关推荐

登录后才能评论

评论列表 ( )

返回
顶部