tcpreplay/tcpprep安装方法

发表于2025-06-23由麦芽爸

tcpprep 是 tcpreplay 工具集的一部分，主要用于在流量回放前对 pcap 文件进行预处理（如划分客户端/服务器流量）。安装 tcpreplay 后即可使用 tcpprep。以下是不同系统下的安装方法及常见问题解决方案：

1. 主流 Linux 系统安装方法

CentOS/RHEL

yum install -y tcpreplay  # 安装整个工具集
tcpprep -V                # 验证安装，输出版本信息

Ubuntu/Debian

sudo apt update
sudo apt install -y tcpreplay
tcpprep -V

2. 源码编译安装（适用于无 root 权限或定制化需求）

若系统仓库版本过旧，可手动编译：

# 安装依赖
yum install -y libpcap-devel gcc flex bison  # CentOS
sudo apt install -y libpcap-dev gcc flex bison  # Ubuntu

# 下载并编译 tcpreplay
wget https://github.com/appneta/tcpreplay/releases/download/v4.4.4/tcpreplay-4.4.4.tar.gz
tar -xzvf tcpreplay-4.4.4.tar.gz
cd tcpreplay-4.4.4
./configure
make
sudo make install

3. 离线安装（无网络环境）

需提前下载依赖包（Bison、flex、libpcap、m4）和 tcpreplay 源码包：

上传依赖包：将下载的依赖包上传至服务器。
安装依赖： # 依次解压并编译每个依赖 tar -zxvf [依赖包名].tar.gz cd [依赖目录] ./configure && make && sudo make install
安装 tcpreplay： tar -zxvf tcpreplay-*.tar.gz cd tcpreplay-* ./configure && make && sudo make install

4. 常见安装问题解决

报错 GNU M4 1.4 is required 或 lex insufficient
原因：缺少编译工具链。
解决：安装 GCC 及开发工具： yum groupinstall -y "Development Tools" # CentOS sudo apt install -y build-essential # Ubuntu
运行时提示 libpcap not found
原因：未正确安装 libpcap。
解决：重新安装 libpcap-devel（CentOS）或 libpcap-dev（Ubuntu）。
离线环境编译失败
建议：确保依赖安装顺序正确（Bison → flex → m4 → libpcap → tcpreplay）。

5. 验证安装

tcpprep -V  # 输出示例：tcpreplay suite version: 4.4.4 (libpcap)
tcpprep -h  # 查看帮助文档

💡 提示：tcpprep 需配合 tcprewrite 和 tcpreplay 使用。典型流程：

用 tcpprep 生成缓存文件（划分流量方向）。

用 tcprewrite 修改报文（如 IP/MAC 地址）。

用 tcpreplay 回放流量。

安装完成后，可通过 tcpprep --auto=client -i input.pcap -o output.cache 测试功能。

发表在 linux文章 | 留下评论

基于RDMA-Tutorial生成的测试代码

发表于2025-05-26由麦芽爸

以下是基于 RDMA-Tutorial 开源项目编写的可运行 RDMA 通信 Demo，包含完整的代码、编译和运行步骤，并结合实际场景进行说明。

一、环境准备

硬件/模拟环境
- 物理 RDMA 设备：若使用 Mellanox 网卡（如 ConnectX 系列），需安装 MLNX_OFED 驱动。
- 模拟环境：若无物理设备，可通过 Soft-RoCE 模拟（Ubuntu 示例）： sudo apt install libibverbs-dev librdmacm-dev # 安装依赖 sudo modprobe rdma_rxe # 加载内核模块 sudo rxe_cfg add ens33 # 绑定网卡（替换为实际网卡名）
克隆项目并编译 git clone https://github.com/jcxue/RDMA-Tutorial.git cd RDMA-Tutorial mkdir build && cd build cmake .. && make # 编译项目（需已安装 CMake）

二、示例代码：RDMA 双向通信

以下是一个简化的 客户端-服务器 双向通信 Demo，基于 librdmacm 和 libibverbs 实现零拷贝数据传输。

代码文件：`rdma_demo.c`

#include <stdio.h>
#include <stdlib.h>
#include <rdma/rdma_cma.h>

#define BUFFER_SIZE 1024

struct context {
    struct rdma_cm_id *id;
    struct ibv_mr *mr;
    char *buffer;
};

// 连接建立回调
static void on_connect(struct rdma_cm_id *id) {
    struct context *ctx = (struct context *)id->context;
    printf("Connection established.\n");
}

// 数据接收回调
static void on_completion(struct ibv_wc *wc) {
    if (wc->status == IBV_WC_SUCCESS) {
        printf("Data received: %s\n", (char *)wc->wr_id);
    }
}

// 服务端初始化
void run_server(const char *port) {
    struct rdma_cm_event *event;
    struct rdma_cm_id *listen_id;
    struct rdma_addrinfo hints = { .ai_flags = RAI_PASSIVE };
    
    // 创建监听端
    rdma_create_addr_info(&listen_id, NULL, port, &hints);
    rdma_listen(listen_id, 5);
    
    while (1) {
        rdma_get_cm_event(listen_id->channel, &event);
        if (event->event == RDMA_CM_EVENT_CONNECT_REQUEST) {
            struct context *ctx = malloc(sizeof(struct context));
            ctx->id = event->id;
            ctx->buffer = malloc(BUFFER_SIZE);
            ctx->mr = rdma_reg_msgs(ctx->id, ctx->buffer, BUFFER_SIZE);
            rdma_accept(ctx->id, NULL);  // 接受连接
        }
        rdma_ack_cm_event(event);
    }
}

// 客户端初始化
void run_client(const char *server_ip, const char *port) {
    struct rdma_cm_id *conn_id;
    struct rdma_addrinfo hints = { .ai_port_space = RDMA_PS_TCP };
    struct ibv_wc wc;
    
    // 建立连接
    rdma_create_addr_info(&conn_id, server_ip, port, &hints);
    rdma_connect(conn_id, NULL);
    
    // 发送数据
    char *msg = "Hello from client!";
    rdma_post_send(conn_id, NULL, msg, strlen(msg)+1, conn_id->mr, 0);
    rdma_get_send_comp(conn_id, &wc);  // 等待发送完成
}

int main(int argc, char **argv) {
    if (argc == 2) {
        run_server(argv[1]);  // 服务端：./demo <port>
    } else if (argc == 3) {
        run_client(argv[1], argv[2]);  // 客户端：./demo <server_ip> <port>
    }
    return 0;
}

三、编译与运行

编译命令 gcc rdma_demo.c -o rdma_demo -lrdmacm -libverbs
运行示例
- 服务端（监听端口 12345）： ./rdma_demo 12345
- 客户端（连接至服务端）： ./rdma_demo 192.168.1.100 12345
预期输出
- 服务端： Connection established. Data received: Hello from client!
- 客户端： Send completed.

四、关键机制解析

零拷贝传输
- 通过 rdma_reg_msgs() 注册内存缓冲区，RDMA 设备直接访问用户空间内存，避免内核拷贝。
异步事件驱动
- 使用 rdma_get_cm_event() 监听连接事件，on_completion() 处理数据传输完成通知。
连接管理
- librdmacm 抽象了 RDMA 连接建立过程，支持 TCP-like 的通信模式。

五、常见问题解决

编译错误：确保安装 libibverbs-dev 和 librdmacm-dev。
连接失败：检查防火墙设置，确认服务端 IP 和端口正确。
设备不可用：通过 ibv_devices 验证 RDMA 设备状态，或使用 Soft-RoCE 模拟。

六、扩展应用场景

高性能计算：用于 MPI 进程间通信加速，减少延迟。
分布式存储：结合 SPDK 实现高速存储访问。
实时数据处理：在 Kafka/Pulsar 中优化消息队列吞吐量。

参考文档：

RDMA-Tutorial 项目主页
Mellanox RDMA 编程手册
Soft-RoCE 配置指南

发表在 linux文章 | 留下评论

crash工具详解

发表于2025-05-24由麦芽爸

Crash工具详解

Crash是Linux系统中用于分析内核崩溃转储文件（如vmcore）的核心工具，结合了GDB的调试能力与内核数据结构解析功能，广泛应用于内核崩溃调试、内存泄漏分析、死锁检测等场景。以下是其核心知识点及使用指南：

一、Crash工具概述

定义与用途
- Crash是基于GDB开发的内核转储分析工具，支持解析多种格式的转储文件（如kdump、diskdump、ramdump等）。
- 主要功能：
  - 查看崩溃时的调用栈（bt）、进程状态（ps）、内核日志（log）等。
  - 分析内存布局（vm）、设备信息（dev）、中断状态（irq）。
  - 反汇编函数（dis）、查看结构体定义（struct）、搜索内存值（search）。
核心优势
- 离线分析：无需系统运行即可调试转储文件。
- 多格式支持：兼容kdump、Xen/KVM虚拟机转储等。
- 动态扩展：支持通过插件扩展功能（如SACK优化分析）。

二、安装与配置

安装步骤
- Debian/Ubuntu： sudo apt install crash gdb # 基础安装
- 源码编译（推荐避免版本冲突）： git clone https://github.com/crash-utility/crash.git cd crash && make && sudo make install # 编译安装
依赖项准备
- 内核符号表：安装与内核版本匹配的调试符号包（linux-image-$(uname -r)-dbgsym）。
- 转储文件：确保vmcore或ramdump文件路径正确（默认位于/var/crash）。
启动命令 crash /path/to/vmlinux /path/to/vmcore # 加载符号表与转储文件
- 调试选项：
  - -s：静默模式启动。
  - -i script：执行预定义脚本。

三、常用命令分类与示例

命令类型	核心命令	功能与示例
系统状态	`sys`	显示系统基本信息（CPU、内存、内核版本）。
	`kmem -i`	查看内存统计（类似`free`）。
崩溃分析	`bt`	显示当前调用栈（`bt -a`查看所有CPU栈）。
	`log`	输出崩溃前的内核日志（`log -m`过滤关键信息）。
进程与内存	`ps`	列出进程状态（`ps -t`显示线程）。
	`vm`	查看进程虚拟内存映射（类似`/proc/pid/maps`）。
数据结构	`struct 结构体名地址`	解析指定地址的结构体（如`struct task_struct 0xffff8801184c0000`）。
	`rd 地址`	读取内存内容（`rd -x 0xffffffffc0000000`显示十六进制值）。
模块与设备	`mod`	列出已加载的内核模块。
	`dev`	显示块设备/字符设备信息。
高级调试	`dis 函数名`	反汇编函数（`dis sys_signal`）。
	`search -k 0xdeadbeef`	在内核内存中搜索特定值。

四、核心功能与实战场景

崩溃点定位
- 步骤：
  1. 启动Crash后执行bt，查看崩溃时的调用栈。
  2. 结合log命令分析日志，确定触发崩溃的函数（如panic: sysrq）。
  3. 使用struct检查相关数据结构（如task_struct中的信号处理字段）。
内存泄漏排查
- 方法：
  - 通过kmem -i查看内存使用趋势，定位异常分配。
  - 使用search搜索未释放的内存块地址，结合struct page分析引用链。
死锁检测
- 工具：
  - lock -t显示当前锁持有状态。
  - waitq查看等待队列中的进程。

五、优缺点总结

优点	缺点
支持多种转储格式，适用性广	依赖精确的符号表，版本不匹配时无法解析。
结合GDB能力，调试功能强大	学习曲线陡峭，需熟悉内核数据结构。
提供丰富的命令集，覆盖多数调试场景	处理大规模转储文件时性能较低。
可扩展性强（通过插件/脚本）	对非拥塞性崩溃（如硬件故障）支持有限。

六、注意事项

符号表一致性：确保vmlinux与转储文件的内核版本完全匹配。
内存分析技巧：
- 使用vtop将虚拟地址转换为物理地址。
- 通过mach查看CPU架构信息，辅助反汇编分析。
性能优化：对大型vmcore文件，优先使用-s静默模式减少输出延迟。

七、应用场景

服务器运维：快速诊断内核崩溃原因，减少系统停机时间。
驱动开发：调试内核模块的内存泄漏或竞态条件。
安全分析：检测内核漏洞利用痕迹（如恶意代码注入）。

以上内容综合了Crash工具的核心功能与使用技巧，具体操作时可结合help命令进一步探索。

发表在 linux文章 | 留下评论

TCP协议通过多种核心技术确保数据传输的可靠性，其核心机制可归纳为以下六大关键技术：

发表于2025-05-24由麦芽爸

TCP协议通过多种核心技术确保数据传输的可靠性，其核心机制可归纳为以下六大关键技术：

一、序列号与确认应答机制

字节流编号
TCP为每个传输的字节分配唯一序列号（Sequence Number），接收方通过确认号（ACK）反馈已成功接收的连续字节范围。例如，若发送方发送序号为1-1000的数据，接收方返回ACK=1001，表明已正确接收前1000字节，并期待下一段数据从1001开始。
- 作用：确保数据有序性和完整性，解决网络乱序问题。
累积确认与延迟确认
- 累积确认：ACK确认号为当前连续接收的最大字节序号（如ACK=5000表示0-4999字节已接收）。
- 延迟确认：接收方延迟发送ACK以合并多个确认，减少网络开销。

二、超时重传与快速重传机制

超时重传（RTO）
- 原理：发送方启动定时器，若在往返时间（RTT）内未收到ACK，则重传数据。
- 动态调整：RTO基于RTT估算值动态调整，避免过早或过晚触发重传。
快速重传（Fast Retransmit）
- 触发条件：发送方连续收到3次重复ACK（如ACK=1001重复三次），立即重传对应数据段。
- 优势：无需等待超时，减少延迟（例如视频流中丢包时快速恢复）。

三、滑动窗口与流量控制

滑动窗口协议
- 发送窗口：动态调整未确认数据的最大发送量，基于接收方的接收窗口（rwnd）通告值。
- 流量控制：防止接收方缓冲区溢出，例如当rwnd=0时发送方暂停发送，直到窗口更新。
窗口动态更新
- 接收方通过ACK报文中的窗口字段实时反馈剩余缓冲区空间，发送方据此调整发送速率。

四、校验和与错误检测

校验和机制
- 计算方式：TCP首部和数据部分均参与16位校验和计算，接收方验证后丢弃错误报文。
- 作用：检测传输过程中的数据损坏（如比特翻转）。
自动丢弃重复数据
- 接收方通过序列号识别重复报文（如网络重传导致的数据冗余），直接丢弃以避免重复处理。

五、拥塞控制算法

慢启动（Slow Start）
- 初始阶段：拥塞窗口（cwnd）从1个MSS（最大报文段）开始，每收到一个ACK，cwnd指数增长（cwnd *= 2）。
- 退出条件：cwnd达到慢启动阈值（ssthresh）后进入拥塞避免阶段。
拥塞避免（Congestion Avoidance）
- 线性增长：每RTT增加1个MSS，避免窗口膨胀导致网络拥塞。
快速恢复（Fast Recovery）
- 触发后调整：发生快速重传时，ssthresh设为当前cwnd的一半，cwnd = ssthresh + 3，后续线性增长。

六、选择性确认（SACK）

机制原理
- 接收方通过SACK选项告知发送方已接收的非连续数据块（如已接收1000-2000和3000-4000，但缺少2001-2999）。
- 示例：发送方仅重传丢失的2001-2999数据，避免全量重传。
优化效果
- 减少冗余重传，提升带宽利用率（尤其在高速网络或高丢包率场景中显著）。

总结

TCP通过序列号与确认机制保证数据有序性，重传机制应对丢包，滑动窗口实现流量控制，校验和确保数据完整性，拥塞控制算法动态适应网络状态，以及SACK优化重传效率。这些技术协同工作，使TCP成为互联网可靠传输的核心协议。

发表在 linux文章 | 留下评论

TCP拥塞控制

发表于2025-05-24由麦芽爸

TCP拥塞控制机制详解

TCP拥塞控制是确保网络高效、稳定运行的核心机制，通过动态调整发送速率避免网络过载。其核心思想是探测网络容量并平衡公平性，主要包含以下四个阶段及关键技术：

一、核心机制与阶段划分

慢启动（Slow Start）
- 触发条件：TCP连接建立或发生超时重传时启动。
- 窗口调整：初始拥塞窗口（cwnd）设为1个MSS（最大报文段大小），每收到一个ACK确认，cwnd指数增长（+1 MSS）。
- 退出条件：
  - 当cwnd超过慢启动阈值（ssthresh，初始值通常为65535字节或动态设置）时，进入拥塞避免阶段。
  - 若检测到丢包（如超时），cwnd重置为1，ssthresh设为当前cwnd的一半，重新进入慢启动。
拥塞避免（Congestion Avoidance）
- 窗口调整：cwnd线性增长，每经过一个往返时延（RTT），cwnd增加1 MSS（即每收到一个完整窗口的ACK后加1）。
- 目标：避免因窗口指数增长导致突发的网络拥塞。
- 丢包响应：若发生超时，ssthresh设为当前cwnd的一半，cwnd重置为1，回到慢启动阶段。
快速重传（Fast Retransmit）
- 触发条件：发送方连续收到3个重复ACK（表示接收方检测到数据包丢失）。
- 动作：立即重传丢失的报文段，无需等待超时定时器（RTO）触发。
- 优势：减少因等待超时而导致的传输延迟。
快速恢复（Fast Recovery）
- 触发条件：快速重传后执行。
- 窗口调整：
  - 设置ssthresh = cwnd/2，cwnd = ssthresh + 3（补偿已传出的3个重复ACK对应的数据）。
  - 后续每收到一个重复ACK，cwnd增加1 MSS；收到新ACK后，cwnd重置为ssthresh，进入拥塞避免阶段。
- 目标：避免因快速重传后直接进入慢启动导致的吞吐量骤降。

二、算法原理与关键特性

AIMD（加性增/乘性减）原则
- 加性增：在拥塞避免阶段，cwnd线性增长（每RTT +1 MSS），逐步试探网络容量。
- 乘性减：检测到拥塞时（丢包或重复ACK），cwnd大幅减少（通常减半），快速缓解网络压力。
动态适应性
- 根据网络状态（丢包、ACK延迟）动态调整cwnd，平衡公平性与效率。例如：
  - 高带宽时延积（BDP）网络：通过慢启动快速探测带宽上限。
  - 短突发流量：快速重传/恢复减少恢复时间。
与流量控制协同
- 实际发送窗口取min(拥塞窗口, 接收窗口)，同时考虑接收方缓冲区限制和网络拥塞程度。

三、优缺点分析

优点
- 高效性：通过AIMD平衡网络利用率与公平性，避免全局同步拥塞。
- 快速响应：快速重传/恢复机制减少丢包恢复延迟。
- 自适应性：动态调整cwnd，适应不同网络环境（无线网络、广域网等）。
缺点
- 高BDP网络性能不足：传统慢启动和线性增长在大带宽时延积网络中收敛速度慢，导致带宽利用率低。
- RTT依赖问题：窗口调整依赖RTT测量，高延迟或波动网络可能导致误判。
- 丢包误判：非拥塞丢包（如无线链路错误）可能触发不必要的窗口缩减。

四、优化与改进机制

SACK（选择性确认）
- 允许接收方明确反馈已接收的非连续数据块，减少冗余重传。
ECN（显式拥塞通知）
- 路由器通过标记IP头部的ECN位显式通知拥塞，避免依赖丢包判断，降低延迟。
BBR（基于带宽与时延的拥塞控制）
- 通过测量带宽和RTT动态调整发送速率，替代传统AIMD，提升高BDP网络性能。
CUBIC算法
- 使用三次函数调整cwnd增长，减少RTT不公平性，适用于Linux系统。

五、应用场景与总结

适用场景：广域网通信、实时流媒体传输、云计算数据中心等需平衡吞吐量与稳定性的场景。
总结：TCP拥塞控制通过慢启动、拥塞避免、快速重传/恢复四大阶段，结合AIMD原则实现网络资源的高效利用。尽管存在高BDP网络性能不足等问题，但通过SACK、ECN等优化机制仍能适应复杂网络环境。未来结合机器学习与显式反馈（如XCP、VCP）可能进一步突破传统限制。

发表在 linux文章 | 留下评论

tcp滑动窗口详细原理、详细过程、优缺点总结

发表于2025-05-24由麦芽爸

TCP滑动窗口详细原理、过程及优缺点总结

一、基本原理

TCP滑动窗口是一种流量控制和可靠性传输的核心机制，通过动态调整发送方与接收方的窗口大小，平衡网络吞吐量与资源限制，确保数据传输的可靠性与效率。

窗口定义
- 发送窗口（Send Window）：发送方维护的窗口，表示无需等待确认即可连续发送的数据量上限。
- 接收窗口（Receive Window）：接收方维护的窗口，表示当前可接收的缓冲区剩余空间。
- 动态调整：接收方通过ACK报文中的窗口大小字段通告发送方，发送方据此调整发送速率。
核心功能
- 流量控制：避免接收方缓冲区溢出（通过接收窗口大小限制发送速率）。
- 可靠性：通过确认机制（ACK）和重传机制（超时重传、快速重传）保障数据完整。
- 拥塞控制协同：发送窗口实际大小取接收窗口与拥塞窗口的较小值，兼顾网络拥塞状态。

二、详细工作过程

初始阶段
- 三次握手协商：建立连接时，接收方通过ACK报文告知初始接收窗口大小（如1000字节），发送方据此初始化发送窗口。
数据传输阶段
- 数据发送：发送方将窗口内的数据连续发送（如序号1-1000的数据），无需等待ACK。
- ACK处理：接收方收到数据后，更新接收窗口并向发送方返回ACK（包含已确认的序号和当前窗口大小）。
- 窗口滑动：发送方收到ACK后，滑动窗口前移（如确认序号1000后，窗口右边界扩展至2000），释放已确认数据的缓冲区，继续发送新数据。
动态调整示例
- 接收方处理慢：若接收方缓冲区剩余空间减少（如从1000降为500），发送方收到新窗口大小时立即降低发送速率。
- 网络拥塞：若检测到丢包（如超时或重复ACK），发送方缩小拥塞窗口，进而调整有效发送窗口。

三、优点

高效传输
- 允许连续发送多个数据包，减少等待ACK的时间，显著提高网络吞吐量（对比停等协议）。
动态适应性
- 接收窗口实时反映接收方处理能力，发送窗口结合拥塞窗口，动态适配网络状态（如带宽变化、缓冲区占用）。
可靠性保障
- 通过ACK确认机制和超时重传、快速重传（收到3次重复ACK立即重传）确保数据完整。
流量与拥塞协同
- 流量控制（接收窗口）与拥塞控制（拥塞窗口）共同作用，避免网络过载和接收方崩溃。

四、缺点

窗口调整复杂性
- 窗口大小的动态调整依赖精确的RTT（往返时间）估算，若算法不合理（如初始窗口过大），可能导致网络拥塞或带宽浪费。
协议开销
- 维护窗口状态、处理ACK报文和重传机制增加了协议实现的复杂度与资源消耗。
极端场景性能问题
- 接收窗口为0：发送方需定期发送探测报文，若接收方长期未恢复窗口，可能造成传输停滞。
- 乱序处理：接收方需缓存乱序到达的数据，占用额外内存资源。
与长肥管网络不兼容
- 窗口大小受16位字段限制（最大64KB），需结合窗口扩大因子（RFC 7323）扩展，否则在高带宽时延积（BDP）网络中性能受限。

五、应用场景与优化

适用场景
- 高吞吐需求：如文件传输、视频流媒体。
- 动态网络环境：无线网络、移动通信等链路质量波动大的场景。
优化机制
- SACK（选择性确认）：允许接收方明确告知已收到的非连续数据块，减少冗余重传。
- 延迟ACK：接收方延迟发送ACK，合并多个确认以降低协议开销。
- 窗口缩放因子：通过选项字段扩展窗口大小，支持高速网络（如10GbE）。

总结

TCP滑动窗口通过动态调整发送与接收窗口，在保证可靠性的前提下最大化传输效率，是TCP协议适应复杂网络的核心机制。其优点在于高效性与自适应性，但需权衡窗口调整的复杂性与极端场景的性能挑战。实际应用中常结合SACK、延迟ACK等技术进一步优化。

发表在 linux文章 | 留下评论

tcp重传机制，超时重传和快速重传区别

发表于2025-05-24由麦芽爸

TCP协议通过重传机制确保数据传输的可靠性，其中超时重传和快速重传是两种核心机制，二者的区别主要体现在触发条件、响应速度、适用场景及效率等方面。以下是详细对比：

一、触发条件

超时重传（RTO）
- 当发送方在设定的超时时间（RTO）内未收到接收方的确认报文（ACK）时触发。
- 例如：发送数据包后，若RTO计时器到期仍未收到ACK，则认为数据丢失，立即重传。
快速重传（Fast Retransmission）
- 当发送方连续收到3个重复的ACK（针对同一数据包的确认）时触发。
- 例如：接收方检测到数据包乱序（如丢失中间包），会持续发送重复ACK，发送方据此立即重传丢失包。

二、适用场景

超时重传
- 适用于网络严重拥塞或大规模丢包的情况，例如整个窗口的数据丢失或ACK报文丢失。
- 由于需等待RTO超时，适合作为其他机制失效时的兜底策略。
快速重传
- 适用于轻微丢包但网络仍通畅的场景，例如单个数据包丢失但后续数据仍能到达接收端。
- 依赖接收端的重复ACK反馈，需网络延迟较低才能快速响应。

三、响应速度与效率

等待时间
- 超时重传：需等待RTO超时，时间较长（通常为RTT的估算值，可能达数百毫秒）。
- 快速重传：立即触发，无需等待计时器，延迟极低。
重传效率
- 超时重传效率较低，因需等待超时且可能触发拥塞控制（如慢启动），导致吞吐量下降。
- 快速重传效率高，可提前检测丢包并快速恢复，结合快速恢复算法（如调整拥塞窗口）减少性能损失。

四、优缺点对比

对比项	超时重传（RTO）	快速重传（Fast Retransmission）
可靠性	高（确保所有丢失包最终重传）	可能存在误判（如ACK丢失时无法触发）
网络适应性	适应严重拥塞场景	依赖重复ACK，需网络部分通畅
对RTT的影响	RTO超时会导致RTT估算值大幅增加	不影响RTT计算，保持稳定
典型优化机制	无（依赖基础计时器）	结合SACK（选择性确认）减少冗余重传

五、协同工作机制

TCP通常结合两种机制以平衡效率与可靠性：

快速重传优先：在轻微丢包时快速响应，避免等待超时。
超时重传兜底：当快速重传无法触发（如窗口起始位置丢包或ACK丢失）时，依赖超时重传恢复。
优化扩展：
- SACK（选择性确认）：允许接收方明确告知已收到的非连续数据块，使发送方仅重传丢失部分，减少冗余。
- NewReno算法：改进快速恢复阶段，处理多个数据包丢失的情况，避免多次进入慢启动。

总结

超时重传和快速重传是TCP可靠传输的互补机制：

超时重传以高延迟换取绝对可靠性，适用于极端网络环境；
快速重传以快速响应优化效率，适合日常网络波动。
两者结合（辅以SACK等优化）使TCP能在复杂网络条件下兼顾效率与稳定性。

发表在 linux文章 | 留下评论

全网最详细的VLAN的原理和配置 – 知乎

发表于2025-05-17由麦芽爸

全网最详细的VLAN的原理和配置 – 知乎

VLAN（Virtual Local Area Network）即虚拟局域网，是将一个物理的LAN在逻辑上划分成多个广播域的通信技术。每个VLAN是一个广播域，VLAN内的主机间可以直接通信，而VLAN间则不能直接互通。这样，广播报文就被限制在一个VLAN内。

发表在 linux文章 | 留下评论

路由协议基础 – 华为

发表于2025-05-17由麦芽爸

路由协议基础 – 华为

路由协议基础

简介

路由（Routing）是数据通信网络中一个基本的概念。路由就是通过互联的网络把信息从源地址传输到目的地址的活动。路由发生在OSI网络参考模型中的第三层（即网络层）。我们将具有路由转发功能的设备称为广义上的路由器。

当路由器收到一个IP数据包，路由器会根据目的IP地址在设备上的路由表（Routing Table）中进行查找，找到“最匹配”的路由条目后，将数据包根据路由条目所指示的出接口或下一跳IP转发出去。路由表中装载着路由器通过各种途径获知的路由条目（Routes）。路由器可通过静态、动态等方式获取路由条目并维护自己的路由表。

什么是路由协议

较小的网络通常可以手动设置路由表（即静态方式），但较大且拥有复杂拓扑的网络可能常常变化，若要手动创建、维护路由表是不切实际的。因此，人们希望路由器可以动态的（即动态方式）按照某种协议来自动创建维护路由表以解决这个问题，从而使得网络能够近自主的适应变化，避免故障。这些协议被称为路由协议。

路由协议的分类

路由协议可以有多种分类方式，常见的分类方式如下：

按照路由协议使用的算法分：
- 距离矢量路由协议，例如：RIP（Routing Information Protocol）
- 链路状态路由协议，例如：OSPF（Open Shortest Path First）
按照路由协议作用的区域划分：
- 内部网关协议（Interior Gateway Protocol），在单一的自治系统中交换路由信息，例如：OSPF（Open Shortest Path First）
- 外部网关协议（Exterior Gateway Protocol），在不同的自治系统中交换路由信息，例如：BGP（Border Gateway Protocol）

常见的路由协议有哪些

目前常用的路由协议有：

OSPF（Open Shortest Path First）
RIP（Routing Information Protocol）
IS-IS（Intermediate System to Intermediate System）
BGP（Border Gateway Protocol）

其中，最多被使用到的路由协议为OSPF和BGP。

路由器及路由基本原理

在因特网中，网络连接设备用来控制网络流量和保证网络数据传输质量。常见的网络连接设备有集线器（Hub）、网桥（Bridge）、交换机（Switch）和路由器（Router）。这些设备的基本原理类似，下面就以路由器为例来介绍一下设备的基本原理。

路由器是一种典型的网络连接设备，用来进行路由选择和报文转发。路由器根据收到报文的目的地址选择一条合适的路径（包含一个或多个路由器的网络），然后将报文传送到下一个路由器，路径终端的路由器负责将报文送交目的主机。

路由就是报文从源端到目的端的路径。当报文从路由器到目的网段有多条路由可达时，路由器可以根据路由表中最佳路由进行转发。最佳路由的选取与发现此路由的路由协议的优先级、路由的度量有关。当多条路由的协议优先级与路由度量都相同时，可以实现负载分担，缓解网络压力；当多条路由的协议优先级与路由度量不同时，可以构成路由备份，提高网络的可靠性。

路由迭代

路由必须有直连的下一跳才能够指导转发，但是路由生成时下一跳可能不是直连的，因此需要计算出一个直连的下一跳和对应的出接口，这个过程就叫做路由迭代。BGP路由、静态路由和UNR路由的下一跳都有可能不是直连的，都需要进行路由迭代。

例如，BGP路由的下一跳一般是非直连的对端loopback地址，不能指导转发，需要进行迭代。即根据以BGP学习到的下一跳为目的地址在IP路由表中查找，当找到一条具有直连的下一跳、出接口信息的路由后（一般为一条IGP路由），将其下一跳、出接口信息填入这条BGP路由的IP路由表中并生成对应的FIB表项。

对于BGP私网路由，需要隧道进行转发，路由的下一跳一般是远端PE的Loopback地址，不能指导转发，也需要进行路由迭代，即在隧道列表中查找到达该Loopback地址的隧道，将该隧道信息填入路由表中并生成对应的FIB表项。

静态路由与动态路由

静态路由与动态路由的区别

路由协议是路由器之间维护路由表的规则，用于发现路由，生成路由表，并指导报文转发。依据来源的不同，路由可以分为三类：

通过链路层协议发现的路由称为直连路由。
通过网络管理员手动配置的路由称为静态路由。
通过动态路由协议发现的路由称为动态路由。

静态路由配置方便，对系统要求低，适用于拓扑结构简单并且稳定的小型网络。缺点是不能自动适应网络拓扑的变化，需要人工干预。

动态路由协议有自己的路由算法，能够自动适应网络拓扑的变化，适用于具有一定数量三层设备的网络。缺点是配置对用户要求比较高，对系统的要求高于静态路由，并将占用一定的网络资源和系统资源。

动态路由的分类

对动态路由协议的分类可以采用以下不同标准：

根据作用范围不同，路由协议可分为：

内部网关协议IGP（Interior Gateway Protocol）：在一个自治系统内部运行。常见的IGP协议包括RIP、OSPF和IS-IS。
外部网关协议EGP（Exterior Gateway Protocol）：运行于不同自治系统之间。BGP是目前最常用的EGP协议。

根据使用算法不同，路由协议可分为：

距离矢量协议（Distance-Vector Protocol）：包括RIP和BGP。其中，BGP也被称为路径矢量协议（Path-Vector Protocol）。
链路状态协议（Link-State Protocol）：包括OSPF和IS-IS。

以上两种算法的主要区别在于发现路由和计算路由的方法不同。

发表在 linux文章 | 留下评论

什么是EVPN – 华为

发表于2025-05-17由麦芽爸

什么是EVPN – 华为

什么是EVPN

EVPN基本概念

为什么会有EVPN（Ethernet VPN）呢？最初的VXLAN方案（RFC7348）中没有定义控制平面，是手工配置VXLAN隧道，然后通过流量泛洪的方式进行主机地址的学习。这种方式实现上较为简单，但是会导致网络中存在很多泛洪流量、网络扩展起来困难。

为了解决上述问题，人们在VXLAN中引入了EVPN作为VXLAN的控制平面，如图1-1所示（VXLAN是一种NVO协议）。EVPN还能作为一些其他协议的控制面，本文仅描述EVPN作为VXLAN的控制面的相关信息。

发表在 linux文章 | 留下评论

​​1. 主流 Linux 系统安装方法​​

​​CentOS/RHEL​​

​​Ubuntu/Debian​​

​​2. 源码编译安装（适用于无 root 权限或定制化需求）​​

​​3. 离线安装（无网络环境）​​

​​4. 常见安装问题解决​​

​​5. 验证安装​​

​​一、环境准备​​

​​二、示例代码：RDMA 双向通信​​

​​代码文件：rdma_demo.c​​

​​三、编译与运行​​

​​四、关键机制解析​​

​​五、常见问题解决​​

​​六、扩展应用场景​​

Crash工具详解

一、Crash工具概述

二、安装与配置

三、常用命令分类与示例

四、核心功能与实战场景

五、优缺点总结

六、注意事项

七、应用场景

一、序列号与确认应答机制

二、超时重传与快速重传机制

三、滑动窗口与流量控制

四、校验和与错误检测

五、拥塞控制算法

六、选择性确认（SACK）

总结

TCP拥塞控制机制详解

一、核心机制与阶段划分

二、算法原理与关键特性

三、优缺点分析

四、优化与改进机制

五、应用场景与总结

TCP滑动窗口详细原理、过程及优缺点总结

​​一、基本原理​​

​​二、详细工作过程​​

​​三、优点​​

​​四、缺点​​

​​五、应用场景与优化​​

​​总结​​

一、触发条件

二、适用场景

三、响应速度与效率

四、优缺点对比

五、协同工作机制

总结

路由协议基础

简介

什么是路由协议

路由协议的分类

常见的路由协议有哪些

路由器及路由基本原理

路由迭代

静态路由与动态路由

静态路由与动态路由的区别

动态路由的分类

什么是EVPN

EVPN基本概念

Recent Posts

Recent Comments

Archives

Categories

1. 主流 Linux 系统安装方法

CentOS/RHEL

Ubuntu/Debian

2. 源码编译安装（适用于无 root 权限或定制化需求）

3. 离线安装（无网络环境）

4. 常见安装问题解决

5. 验证安装

一、环境准备

二、示例代码：RDMA 双向通信

代码文件：`rdma_demo.c`

三、编译与运行

四、关键机制解析

五、常见问题解决

六、扩展应用场景

一、基本原理

二、详细工作过程

三、优点

四、缺点

五、应用场景与优化

总结