-
机柜托管到交易所机房
将服务器部署在交易所所在的数据中心,实现“近距离托管”(Proximity/Colo)。利用最短光纤交叉连接,使服务器与交易所撮合系统仅相隔几米。BSO 的实践表明,这种 “Colocation” 方案可将网络延迟降低到单个位数微秒。光纤中每缩短 1 米,可减少约 5 纳秒传播时延。近距离部署不仅加速行情传输,还能减少订单执行过程中的滑点,提高成交效率。
-
减少链路跳数与物理距离
在交易链路中应尽量减少路由器或交换机的数量,采用直连或单跳的 cut-through 交换机,并选择最短的专线或微波链路。BSO 指出,通过优化 BGP 路由减少网络跳数可显著降低延迟。一项案例显示,通过部署最小跳数的微波专线,伦敦–纽约交易路径的延迟下降 40%;另一案例中,新加坡–东京路径使用光纤与微波混合方案后延迟降低 25%。
-
采用低延迟网卡与硬件时间戳
选择专为 HFT 设计的网络适配器(如 NVIDIA Mellanox ConnectX、AMD Solarflare X2 系列),这些网卡支持硬件时间戳、PTP 精确时钟同步和 RDMA/Onload/DPDK 内核旁路。Mellanox 白皮书指出,InfiniBand 网卡应用延迟可低至 1 微秒,端口到端口的交换延迟小于 100 纳秒;先进的卸载功能保证了高吞吐和极低的 CPU 占用。Solarflare X2522 网卡结合 Onload/DPDK 内核旁路后,可实现亚微秒级硬件延迟并支持纳秒级时间戳。
-
启用内核旁路与零拷贝
传统 Linux 网络栈难以在 1M PPS 以上稳定运行,容易产生中断和上下文切换。采用 Solarflare Onload、Mellanox VMA、DPDK 等用户态网络栈,通过直接访问网卡的 TX/RX 缓冲区实现内核旁路,绕过内核处理。Databento 指出,内核旁路可在 10 Gbps 以上速率下实现低延迟并避免丢包;零拷贝环形缓冲进一步减少 CPU 和内存开销。
-
FPGA 行情预处理与订单加速
在服务器中安装 FPGA 卡,将行情解包、解码、簿构建等环节前移到硬件完成。FPGA 常被用于“市场数据接收和订单执行”阶段,因为它们能以极低的延迟处理数据。FPGA 的并行流水线和确定性性能可以达到纳秒级,让 CPU 仅承担轻量决策,显著缩短“行情→决策”链路。
-
使用高品质短距线缆与 Cut-through 交换机
内部连接应使用 DAC/Twinax 铜缆或超短单模光纤,减少每米约 5 ns 的传播时间。选择 Cut-through 交换机并关闭不必要的二层功能,可将端口延迟压到 250 ns 以下。高品质线缆及交换机组合能减少信号干扰,保持抖动稳定。
-
精确时钟同步
部署双冗余 PTP 主时钟(或 SyncE)并配合支持硬件时间戳的 NIC,使所有系统在 TAI/UTC 时间域内对齐。Solarflare 网卡支持 PTP 精确时间协议和纳秒级时间戳,是延迟监控和合规审计的基础。