大算力模型优化

聚焦智能驾驶领域,专注于提升车载软件的效率和可靠性,推动汽车产业的智能化发展。

大模型算力优化

利用大规模计算能力优化模型,有利于提高计算效率、减少计算时间,并加速模型的训练和推理过程,提高应用的实时性和响应性

自定义算子

合理指定数据通道加载各种数据,并运用并行技术设计编写深度神经网络层的实现方法,通过自定义算子可以更好地适应特定需求,提高计算效率和灵活性

自定义算子的加速方法

专用硬件核矢量指令集
流水线并行计算
加速数据搬运

算力利用率提升

在计算系统中有效地利用可用的计算资源,以实现更高效的计算和任务处理。通过提高算力利用率,可以最大限度地发挥计算系统的性能,并提高计算资源的利用效率


TI模型、TI设备
(优化前)(8TOPS*4)
TI模型、TI设备
(优化前)(8TOPS*4)
TI模型、TI设备
(优化前)(8TOPS*4)
TI模型、TI设备
(优化前)(8TOPS*4)
TI模型、TI设备
(优化前)(8TOPS*4)
每帧计算量(GFLOP)6.366.366.366.366.36
每帧推理耗时(ms)6.36.366.366.366.36
利用率3.15%*46.366.366.366.36


实现降本增效

目前已在TDA4VH,英伟达Xavier,地平线J5平台均进行了算力优化,TDA4VH优化后的算力利用率有200倍以上,能够部署更多算法,实现降本增效

TI 地平线 华为 瑞芯微 英伟达