摘要

系统阐述了在分布式人工智能计算负载中使用低延迟Fabric技术出现的问题,包括虚拟化环境支撑、通信原语抽象化、网络拥塞控制等。针对这些问题,提出了使用基于可编程智能网卡的解决思路。