🕒 计算机系统延迟全景表(从最快到最慢)
本表以“1 个 CPU 周期 ≈ 0.3ns ≈ 1 秒”为基准建立“相对时间”概念,帮助理解系统中各类延迟的数量级差异。适用于性能调优、架构设计、教学演示等场景。
✅ 一、CPU / 缓存层
层级 |
事件 |
延迟范围 |
相对比例 |
关键影响因素 |
CPU |
1 个 CPU 周期 |
0.3 ns |
1 秒 |
制程工艺(如 5nm) |
缓存 |
L1 缓存访问 |
0.9 ns |
3 秒 |
核心独占,容量约 32KB |
|
L2 缓存访问 |
2.8 ns |
9 秒 |
共享于核心组,容量约 256KB |
|
L3 缓存访问 |
8-12 ns |
26-40 秒 |
所有核心共享,容量约 32MB |
🧠 二、内存 / 本地通信
层级 |
事件 |
延迟范围 |
相对比例 |
关键影响因素 |
DRAM |
主存访问(DRAM) |
50-120 ns |
3-6 分钟 |
NUMA 架构、频率、预取、bank 冲突等 |
内存共享 |
共享内存(进程间) |
50-200 ns |
3-11 分钟 |
原子同步机制,缓存一致性开销 |
本地主机 |
localhost TCP 通信 |
0.5-2 μs |
28 分钟 - 1.8 小时 |
内核协议栈处理、loopback 接口 |
|
UNIX 域套接字 |
0.3-1.5 μs |
17 分钟 - 1.5 小时 |
绕过网络协议栈,用户态更高效 |
|
管道(pipe)通信 |
2-6 μs |
2-6 小时 |
内核缓冲区拷贝、上下文切换 |
💾 三、存储层
层级 |
事件 |
延迟范围 |
相对比例 |
关键影响因素 |
快速存储 |
NVMe SSD(随机 IO) |
10-30 μs |
9 小时 - 1 天 |
PCIe 4/5 接口、IO 队列 |
|
SATA SSD(随机 IO) |
50-150 μs |
2-6 天 |
接口带宽(6 Gbps)、控制器架构 |
慢速存储 |
机械硬盘(HDD) |
1-10 ms |
1-12 个月 |
寻道、旋转延迟 |
🌐 四、网络通信层
层级 |
事件 |
延迟范围 |
相对比例 |
关键影响因素 |
高性能网络 |
RDMA(InfiniBand) |
0.5-2 μs |
28 分钟 - 1.8 小时 |
零拷贝、内核旁路 |
局域网 |
内网同机房(10Gbps) |
50-500 μs |
2-23 天 |
跳数、协议、交换机负载 |
城域网 |
跨机房通信(100km) |
1-5 ms |
1-6 个月 |
光速极限(每 100km ≈ 0.5ms) |
蜂窝网络 |
5G 网络空口延迟 |
1-20 ms |
1 月 - 2 年 |
调度、负载、基站资源等 |
跨国通信 |
旧金山 → 纽约(互联网) |
40 ms |
4 年 |
光缆路径、BGP 跳数 |
|
旧金山 → 伦敦(跨洋) |
81 ms |
8 年 |
跨大西洋光缆、协议转换 |
卫星网络 |
卫星互联网(LEO 星链) |
20-50 ms |
2-5 年 |
低轨卫星高度(~550km)、拥塞控制 |
🚨 五、极端与慢路径场景
层级 |
事件 |
延迟范围 |
相对比例 |
说明 |
网络异常 |
TCP 重传超时(RTO) |
1-3 s |
105-317 年 |
拥塞控制算法,丢包重传等待 |
虚拟化 |
虚拟机热迁移 |
10 ms - 10 s |
1 - 317 年 |
脏页、网络带宽、QEMU 传输控制 |
系统级 |
物理服务器重启 |
1 - 5 分钟 |
32k - 158k 年 |
BIOS、磁盘检查、系统服务初始化 |
🔬 六、新兴技术层
层级 |
事件 |
延迟范围 |
相对比例 |
关键说明 |
存算融合 |
存算一体(PIM) |
1-10 ns |
3-33 秒 |
近内存计算,减少数据移动 |
存储互连 |
CXL 内存池化 |
100-300 ns |
6-17 分钟 |
Compute Express Link 协议开销 |
通信实验 |
量子通信(实验室) |
1-10 ns |
3-33 秒 |
非经典通信,量子纠缠 |
高带宽内存 |
HBM 访问(HBM3) |
2-5 ns |
6-17 秒 |
用于 AI/GPU,近缓存访问 |
存储新介质 |
Intel Optane / SCM |
300 ns - 1 μs |
17 分钟 - 1 小时 |
非易失性持久内存,已停产 |
🧩 七、软件层延迟参考
层级 |
事件 |
延迟范围 |
相对比例 |
说明 |
系统调用 |
getpid() |
100 - 300 ns |
6 - 17 秒 |
内核切换 + syscall 开销 |
|
read() (page cache) |
200 - 800 ns |
11 - 45 秒 |
非阻塞读路径 |
|
write() (无同步) |
200 - 1 μs |
11 秒 - 1 分钟 |
仅写入内核缓冲区 |
线程调度 |
上下文切换(用户线程) |
1 - 10 μs |
1 - 9 小时 |
与核迁移/优先级相关 |
|
sched_yield() |
2 - 8 μs |
2 - 7 小时 |
主动让出 CPU |
锁与同步 |
互斥锁(无竞争) |
100 - 400 ns |
6 - 22 秒 |
fast path(如 futex 快速锁) |
|
条件变量唤醒 |
5 - 20 μs |
4 - 18 小时 |
有线程阻塞,涉及调度器切换 |
动态分配 |
malloc() (私有线程池) |
30 - 100 ns |
2 - 6 秒 |
jemalloc/tcmalloc 快速路径 |
|
malloc() (慢路径) |
0.5 - 5 μs |
28 分钟 - 7 小时 |
系统调用触发 brk/mmap |
GC 行为 |
JVM Minor GC |
5 - 50 ms |
6 个月 - 5 年 |
STW 停顿与代回收 |
|
JVM Full GC |
100 - 500 ms |
6 - 31 年 |
与 GC 类型、堆大小相关 |
|
Go Stop-the-World GC |
50 - 200 μs |
4 - 17 小时 |
混合写屏障算法,低暂停 |
语言特性 |
Python GIL 切换 |
1 - 100 ms |
1 月 - 8 年 |
多线程实际串行 |
|
Java 虚方法调用 |
10 - 100 ns |
0.5 - 6 秒 |
通过虚表跳转,开销较小 |
🧮 八、分布式/系统层延迟补充
层级 |
事件 |
延迟范围 |
相对比例 |
说明 |
本地队列 |
SPSC 队列(无锁) |
10 - 200 ns |
0.5 - 11 秒 |
高性能事件环、用于 producer-consumer |
消息中间件 |
Redis / NATS 本地调用 |
0.5 - 2 μs |
28 分钟 - 1.8 小时 |
IPC/loopback |
Kafka 消息写入 |
Kafka + ack=1 |
1 - 10 ms |
1 - 12 个月 |
取决于磁盘落盘与 batch 策略 |
分布式一致性 |
Raft / Paxos 选主或提交 |
10 - 500 ms |
1 年 - 31 年 |
网络 RTT + 节点确认 + quorum |
分布式文件系统 |
Ceph 同步写入 |
1 - 100 ms |
1 月 - 12 年 |
对象同步 + OSD 通信 |
对象存储 |
S3 PUT/GET(冷数据) |
10 - 200 ms |
1 年 - 50 年 |
DNS + TLS + 存储查找延迟 |
文件系统同步 |
fsync() |
0.5 - 10 ms |
28 天 - 1 年 |
磁盘实际同步,影响数据一致性安全性 |
时间同步 |
NTP 同步误差 |
10 - 200 ms |
1 年 - 50 年 |
常用于非金融场景 |
时间同步 |
PTP 精密同步 |
100 ns - 10 μs |
6 分钟 - 9 小时 |
适用于工业控制、金融撮合等高精度场景 |
🌩 光纤:理论值计算与实际延迟分析
理论值计算
光纤中的光速:
光在真空中的速度约为 c ≈ 299,792 km/s。光纤中光的传播速度受折射率 n 影响,通常 n ≈ 1.47(石英光纤),因此光纤中的光速为:
v = c / n ≈ 299,792 / 1.47 ≈ 204,000 km/s
中国到美国的距离:
以北京到旧金山为例,直线距离约 9,500 km。但光纤路径并非直线,需绕地形和海底电缆布局,实际路径长度约为直线距离的 1.5 ~ 2 倍。假设为 15,000 km。
理论延迟(单向):
延迟 = 距离 / 速度 = 15,000 / 204,000 ≈ 0.0735 秒 ≈ 73.5 ms
实际值及影响因素
总结
- 理论延迟:约 73.5 ms(单向,理想路径)。
- 实际延迟:100 ~ 200 ms(单向),受设备、协议和网络环境综合影响。