计算机系统延迟全景表

发表于 2025-07-12 分类于计算机系统延迟全景表阅读次数：

计算机系统延迟全景表

🕒 计算机系统延迟全景表（从最快到最慢）

本表以“1 个 CPU 周期 ≈ 0.3ns ≈ 1 秒”为基准建立“相对时间”概念，帮助理解系统中各类延迟的数量级差异。适用于性能调优、架构设计、教学演示等场景。

✅ 一、CPU / 缓存层

层级	事件	延迟范围	相对比例	关键影响因素
CPU	1 个 CPU 周期	0.3 ns	1 秒	制程工艺（如 5nm）
缓存	L1 缓存访问	0.9 ns	3 秒	核心独占，容量约 32KB
	L2 缓存访问	2.8 ns	9 秒	共享于核心组，容量约 256KB
	L3 缓存访问	8-12 ns	26-40 秒	所有核心共享，容量约 32MB

🧠 二、内存 / 本地通信

层级	事件	延迟范围	相对比例	关键影响因素
DRAM	主存访问（DRAM）	50-120 ns	3-6 分钟	NUMA 架构、频率、预取、bank 冲突等
内存共享	共享内存（进程间）	50-200 ns	3-11 分钟	原子同步机制，缓存一致性开销
本地主机	localhost TCP 通信	0.5-2 μs	28 分钟 - 1.8 小时	内核协议栈处理、loopback 接口
	UNIX 域套接字	0.3-1.5 μs	17 分钟 - 1.5 小时	绕过网络协议栈，用户态更高效
	管道（pipe）通信	2-6 μs	2-6 小时	内核缓冲区拷贝、上下文切换

💾 三、存储层

层级	事件	延迟范围	相对比例	关键影响因素
快速存储	NVMe SSD（随机 IO）	10-30 μs	9 小时 - 1 天	PCIe 4/5 接口、IO 队列
	SATA SSD（随机 IO）	50-150 μs	2-6 天	接口带宽（6 Gbps）、控制器架构
慢速存储	机械硬盘（HDD）	1-10 ms	1-12 个月	寻道、旋转延迟

🌐 四、网络通信层

层级	事件	延迟范围	相对比例	关键影响因素
高性能网络	RDMA（InfiniBand）	0.5-2 μs	28 分钟 - 1.8 小时	零拷贝、内核旁路
局域网	内网同机房（10Gbps）	50-500 μs	2-23 天	跳数、协议、交换机负载
城域网	跨机房通信（100km）	1-5 ms	1-6 个月	光速极限（每 100km ≈ 0.5ms）
蜂窝网络	5G 网络空口延迟	1-20 ms	1 月 - 2 年	调度、负载、基站资源等
跨国通信	旧金山 → 纽约（互联网）	40 ms	4 年	光缆路径、BGP 跳数
	旧金山 → 伦敦（跨洋）	81 ms	8 年	跨大西洋光缆、协议转换
卫星网络	卫星互联网（LEO 星链）	20-50 ms	2-5 年	低轨卫星高度（~550km）、拥塞控制

🚨 五、极端与慢路径场景

层级	事件	延迟范围	相对比例	说明
网络异常	TCP 重传超时（RTO）	1-3 s	105-317 年	拥塞控制算法，丢包重传等待
虚拟化	虚拟机热迁移	10 ms - 10 s	1 - 317 年	脏页、网络带宽、QEMU 传输控制
系统级	物理服务器重启	1 - 5 分钟	32k - 158k 年	BIOS、磁盘检查、系统服务初始化

🔬 六、新兴技术层

层级	事件	延迟范围	相对比例	关键说明
存算融合	存算一体（PIM）	1-10 ns	3-33 秒	近内存计算，减少数据移动
存储互连	CXL 内存池化	100-300 ns	6-17 分钟	Compute Express Link 协议开销
通信实验	量子通信（实验室）	1-10 ns	3-33 秒	非经典通信，量子纠缠
高带宽内存	HBM 访问（HBM3）	2-5 ns	6-17 秒	用于 AI/GPU，近缓存访问
存储新介质	Intel Optane / SCM	300 ns - 1 μs	17 分钟 - 1 小时	非易失性持久内存，已停产

🧩 七、软件层延迟参考

层级	事件	延迟范围	相对比例	说明
系统调用	`getpid()`	100 - 300 ns	6 - 17 秒	内核切换 + syscall 开销
	`read()`（page cache）	200 - 800 ns	11 - 45 秒	非阻塞读路径
	`write()`（无同步）	200 - 1 μs	11 秒 - 1 分钟	仅写入内核缓冲区
线程调度	上下文切换（用户线程）	1 - 10 μs	1 - 9 小时	与核迁移/优先级相关
	`sched_yield()`	2 - 8 μs	2 - 7 小时	主动让出 CPU
锁与同步	互斥锁（无竞争）	100 - 400 ns	6 - 22 秒	fast path（如 futex 快速锁）
	条件变量唤醒	5 - 20 μs	4 - 18 小时	有线程阻塞，涉及调度器切换
动态分配	`malloc()`（私有线程池）	30 - 100 ns	2 - 6 秒	jemalloc/tcmalloc 快速路径
	`malloc()`（慢路径）	0.5 - 5 μs	28 分钟 - 7 小时	系统调用触发 `brk/mmap`
GC 行为	JVM Minor GC	5 - 50 ms	6 个月 - 5 年	STW 停顿与代回收
	JVM Full GC	100 - 500 ms	6 - 31 年	与 GC 类型、堆大小相关
	Go Stop-the-World GC	50 - 200 μs	4 - 17 小时	混合写屏障算法，低暂停
语言特性	Python GIL 切换	1 - 100 ms	1 月 - 8 年	多线程实际串行
	Java 虚方法调用	10 - 100 ns	0.5 - 6 秒	通过虚表跳转，开销较小

🧮 八、分布式/系统层延迟补充

层级	事件	延迟范围	相对比例	说明
本地队列	SPSC 队列（无锁）	10 - 200 ns	0.5 - 11 秒	高性能事件环、用于 producer-consumer
消息中间件	Redis / NATS 本地调用	0.5 - 2 μs	28 分钟 - 1.8 小时	IPC/loopback
Kafka 消息写入	Kafka + ack=1	1 - 10 ms	1 - 12 个月	取决于磁盘落盘与 batch 策略
分布式一致性	Raft / Paxos 选主或提交	10 - 500 ms	1 年 - 31 年	网络 RTT + 节点确认 + quorum
分布式文件系统	Ceph 同步写入	1 - 100 ms	1 月 - 12 年	对象同步 + OSD 通信
对象存储	S3 PUT/GET（冷数据）	10 - 200 ms	1 年 - 50 年	DNS + TLS + 存储查找延迟
文件系统同步	`fsync()`	0.5 - 10 ms	28 天 - 1 年	磁盘实际同步，影响数据一致性安全性
时间同步	NTP 同步误差	10 - 200 ms	1 年 - 50 年	常用于非金融场景
时间同步	PTP 精密同步	100 ns - 10 μs	6 分钟 - 9 小时	适用于工业控制、金融撮合等高精度场景

🌩 光纤：理论值计算与实际延迟分析

理论值计算

光纤中的光速：
光在真空中的速度约为 c ≈ 299,792 km/s。光纤中光的传播速度受折射率 n 影响，通常 n ≈ 1.47（石英光纤），因此光纤中的光速为：
v = c / n ≈ 299,792 / 1.47 ≈ 204,000 km/s
中国到美国的距离：
以北京到旧金山为例，直线距离约 9,500 km。但光纤路径并非直线，需绕地形和海底电缆布局，实际路径长度约为直线距离的 1.5 ~ 2 倍。假设为 15,000 km。
理论延迟（单向）：
延迟 = 距离 / 速度 = 15,000 / 204,000 ≈ 0.0735 秒 ≈ 73.5 ms

实际值及影响因素

实际延迟：
通常为 100 ~ 200 ms（双向 ping 值约 200 ~ 400 ms），显著高于理论值。
影响因素：
1. 中继设备：光纤信号需定期放大/中继，电光转换增加延迟。
2. 路由跳数：数据经过多个路由节点，每跳增加 1 ~ 10 ms。
3. 协议处理：TCP/IP 封装、错误校验等消耗时间。
4. 拥塞控制：网络拥堵时数据包排队或重传。
5. 路径波动：动态路由可能导致路径变化。
6. 其他因素：海底电缆维修、跨运营商互联延迟等。

总结

理论延迟：约 73.5 ms（单向，理想路径）。
实际延迟：100 ~ 200 ms（单向），受设备、协议和网络环境综合影响。

------ 本文结束 ------

------ 版权声明：转载请注明出处 ------

欢迎关注我的其它发布渠道