计算机系统延迟全景表

🕒 计算机系统延迟全景表(从最快到最慢)

本表以“1 个 CPU 周期 ≈ 0.3ns ≈ 1 秒”为基准建立“相对时间”概念,帮助理解系统中各类延迟的数量级差异。适用于性能调优、架构设计、教学演示等场景。


✅ 一、CPU / 缓存层

层级 事件 延迟范围 相对比例 关键影响因素
CPU 1 个 CPU 周期 0.3 ns 1 秒 制程工艺(如 5nm)
缓存 L1 缓存访问 0.9 ns 3 秒 核心独占,容量约 32KB
L2 缓存访问 2.8 ns 9 秒 共享于核心组,容量约 256KB
L3 缓存访问 8-12 ns 26-40 秒 所有核心共享,容量约 32MB

🧠 二、内存 / 本地通信

层级 事件 延迟范围 相对比例 关键影响因素
DRAM 主存访问(DRAM) 50-120 ns 3-6 分钟 NUMA 架构、频率、预取、bank 冲突等
内存共享 共享内存(进程间) 50-200 ns 3-11 分钟 原子同步机制,缓存一致性开销
本地主机 localhost TCP 通信 0.5-2 μs 28 分钟 - 1.8 小时 内核协议栈处理、loopback 接口
UNIX 域套接字 0.3-1.5 μs 17 分钟 - 1.5 小时 绕过网络协议栈,用户态更高效
管道(pipe)通信 2-6 μs 2-6 小时 内核缓冲区拷贝、上下文切换

💾 三、存储层

层级 事件 延迟范围 相对比例 关键影响因素
快速存储 NVMe SSD(随机 IO) 10-30 μs 9 小时 - 1 天 PCIe 4/5 接口、IO 队列
SATA SSD(随机 IO) 50-150 μs 2-6 天 接口带宽(6 Gbps)、控制器架构
慢速存储 机械硬盘(HDD) 1-10 ms 1-12 个月 寻道、旋转延迟

🌐 四、网络通信层

层级 事件 延迟范围 相对比例 关键影响因素
高性能网络 RDMA(InfiniBand) 0.5-2 μs 28 分钟 - 1.8 小时 零拷贝、内核旁路
局域网 内网同机房(10Gbps) 50-500 μs 2-23 天 跳数、协议、交换机负载
城域网 跨机房通信(100km) 1-5 ms 1-6 个月 光速极限(每 100km ≈ 0.5ms)
蜂窝网络 5G 网络空口延迟 1-20 ms 1 月 - 2 年 调度、负载、基站资源等
跨国通信 旧金山 → 纽约(互联网) 40 ms 4 年 光缆路径、BGP 跳数
旧金山 → 伦敦(跨洋) 81 ms 8 年 跨大西洋光缆、协议转换
卫星网络 卫星互联网(LEO 星链) 20-50 ms 2-5 年 低轨卫星高度(~550km)、拥塞控制

🚨 五、极端与慢路径场景

层级 事件 延迟范围 相对比例 说明
网络异常 TCP 重传超时(RTO) 1-3 s 105-317 年 拥塞控制算法,丢包重传等待
虚拟化 虚拟机热迁移 10 ms - 10 s 1 - 317 年 脏页、网络带宽、QEMU 传输控制
系统级 物理服务器重启 1 - 5 分钟 32k - 158k 年 BIOS、磁盘检查、系统服务初始化

🔬 六、新兴技术层

层级 事件 延迟范围 相对比例 关键说明
存算融合 存算一体(PIM) 1-10 ns 3-33 秒 近内存计算,减少数据移动
存储互连 CXL 内存池化 100-300 ns 6-17 分钟 Compute Express Link 协议开销
通信实验 量子通信(实验室) 1-10 ns 3-33 秒 非经典通信,量子纠缠
高带宽内存 HBM 访问(HBM3) 2-5 ns 6-17 秒 用于 AI/GPU,近缓存访问
存储新介质 Intel Optane / SCM 300 ns - 1 μs 17 分钟 - 1 小时 非易失性持久内存,已停产

🧩 七、软件层延迟参考

层级 事件 延迟范围 相对比例 说明
系统调用 getpid() 100 - 300 ns 6 - 17 秒 内核切换 + syscall 开销
read()(page cache) 200 - 800 ns 11 - 45 秒 非阻塞读路径
write()(无同步) 200 - 1 μs 11 秒 - 1 分钟 仅写入内核缓冲区
线程调度 上下文切换(用户线程) 1 - 10 μs 1 - 9 小时 与核迁移/优先级相关
sched_yield() 2 - 8 μs 2 - 7 小时 主动让出 CPU
锁与同步 互斥锁(无竞争) 100 - 400 ns 6 - 22 秒 fast path(如 futex 快速锁)
条件变量唤醒 5 - 20 μs 4 - 18 小时 有线程阻塞,涉及调度器切换
动态分配 malloc()(私有线程池) 30 - 100 ns 2 - 6 秒 jemalloc/tcmalloc 快速路径
malloc()(慢路径) 0.5 - 5 μs 28 分钟 - 7 小时 系统调用触发 brk/mmap
GC 行为 JVM Minor GC 5 - 50 ms 6 个月 - 5 年 STW 停顿与代回收
JVM Full GC 100 - 500 ms 6 - 31 年 与 GC 类型、堆大小相关
Go Stop-the-World GC 50 - 200 μs 4 - 17 小时 混合写屏障算法,低暂停
语言特性 Python GIL 切换 1 - 100 ms 1 月 - 8 年 多线程实际串行
Java 虚方法调用 10 - 100 ns 0.5 - 6 秒 通过虚表跳转,开销较小

🧮 八、分布式/系统层延迟补充

层级 事件 延迟范围 相对比例 说明
本地队列 SPSC 队列(无锁) 10 - 200 ns 0.5 - 11 秒 高性能事件环、用于 producer-consumer
消息中间件 Redis / NATS 本地调用 0.5 - 2 μs 28 分钟 - 1.8 小时 IPC/loopback
Kafka 消息写入 Kafka + ack=1 1 - 10 ms 1 - 12 个月 取决于磁盘落盘与 batch 策略
分布式一致性 Raft / Paxos 选主或提交 10 - 500 ms 1 年 - 31 年 网络 RTT + 节点确认 + quorum
分布式文件系统 Ceph 同步写入 1 - 100 ms 1 月 - 12 年 对象同步 + OSD 通信
对象存储 S3 PUT/GET(冷数据) 10 - 200 ms 1 年 - 50 年 DNS + TLS + 存储查找延迟
文件系统同步 fsync() 0.5 - 10 ms 28 天 - 1 年 磁盘实际同步,影响数据一致性安全性
时间同步 NTP 同步误差 10 - 200 ms 1 年 - 50 年 常用于非金融场景
时间同步 PTP 精密同步 100 ns - 10 μs 6 分钟 - 9 小时 适用于工业控制、金融撮合等高精度场景

🌩 光纤:理论值计算与实际延迟分析

理论值计算

  1. 光纤中的光速:
    光在真空中的速度约为 c ≈ 299,792 km/s。光纤中光的传播速度受折射率 n 影响,通常 n ≈ 1.47(石英光纤),因此光纤中的光速为:
    v = c / n ≈ 299,792 / 1.47 ≈ 204,000 km/s

  2. 中国到美国的距离:
    以北京到旧金山为例,直线距离约 9,500 km。但光纤路径并非直线,需绕地形和海底电缆布局,实际路径长度约为直线距离的 1.5 ~ 2 倍。假设为 15,000 km。

  3. 理论延迟(单向):
    延迟 = 距离 / 速度 = 15,000 / 204,000 ≈ 0.0735 秒 ≈ 73.5 ms

实际值及影响因素

  • 实际延迟:
    通常为 100 ~ 200 ms(双向 ping 值约 200 ~ 400 ms),显著高于理论值。

  • 影响因素:

    1. 中继设备:光纤信号需定期放大/中继,电光转换增加延迟。
    2. 路由跳数:数据经过多个路由节点,每跳增加 1 ~ 10 ms。
    3. 协议处理:TCP/IP 封装、错误校验等消耗时间。
    4. 拥塞控制:网络拥堵时数据包排队或重传。
    5. 路径波动:动态路由可能导致路径变化。
    6. 其他因素:海底电缆维修、跨运营商互联延迟等。

总结

  • 理论延迟:约 73.5 ms(单向,理想路径)。
  • 实际延迟:100 ~ 200 ms(单向),受设备、协议和网络环境综合影响。
------ 本文结束 ------
------ 版权声明:转载请注明出处 ------

欢迎关注我的其它发布渠道