1、高性能网络拥塞控制 数据中心内,端到端网络延迟通常小于5微秒。以TCP Reno为代表的传统拥塞控制机制无法及时响应拥塞状态变化,导致交换机队列长度失控,进而大量丢包,影响服务器后端应用性能。我们致力于新一代拥塞控制机制的研究,并积极推进相关算法的硬件实现与大规模部署。
2、网络&应用联合调度 数据中心内, 不同应用的流量有着不同的性能指标和分布规律。例如大数据流量对带宽敏感而对时延不敏感,而交互性流量则相反。我们致力于数据中心流量调度机制的研究,通过网络调度来平衡各类应用的性能。
3、网络切片 数据中心网络需要同时承载多租户、多类型的流量。我们致力于研究新一代数据中心网络切片技术,以实现在节点、租户、类型等多维度下的动态带宽分配。
4、RPC机制优化 远程过程调用(RPC)机制已经成为现代数据中心中分布式系统运行的基石,然而RPC机制仍然存在着许多性能瓶颈。为了提升分布式系统的性能,我们致力于运用扎实的系统和网络优化来提升RPC机制的性能。
5、网络自动化运维 互联网运营正在经历高风险时期。对云计算提供商而言,下层网络演进速度之快、复杂程度之高,使网络运营面临着前所未有的挑战。今年来,网络变更事故率出现持续性增长,导致云计算的稳定性面临新的挑战。我们致力于通过形式化验证、自动化测试等方法在变更执行前保障变更方案的正确性,以降低网络变更带来的风险。2019年,该方向文章发表于SIGCOMM主会,是南京大学第一篇SIGCOMM。SIGCOMM是计算机网络领域最顶级会议(唯一),年均论文录用量仅30余篇。