RDMA Verification¶
🧪
RDMA Verification
RDMA-TB 아키텍처 · 에러 처리 · 4대 디버깅 케이스
이 코스는 사내 RDMA IP 검증 환경(RDMA-TB)을 빠르게 이해하고, 4대 디버깅 케이스(Data Integrity, CQ Poll Timeout, C2H Tracker, Unexpected Error CQE)를 실전적으로 트리아지할 수 있도록 설계되어 있습니다.
기존 RDMA (IB & RoCEv2) 코스가 프로토콜과 IBTA 스펙을 다룬다면, 이 코스는 TB 코드와 디버깅 워크플로에 집중합니다. 모든 사실은 Confluence(Testbench Architecture, Debugging Cases)와 RDMA-TB/lib 코드에 그라운딩되어 있습니다.
🎯 학습 목표¶
이 코스를 마치면 다음을 할 수 있습니다.
- Diagram RDMA-TB 의 multi-node 환경 계층(
vrdmatb_top_env→ host/node/data/dma/network env)을 그릴 수 있다. - Identify
lib/base/component/디렉토리 11개의 역할(config / custom_phase / env / model / pool / test / util)을 식별할 수 있다. - Trace 한 테스트 시퀀스가 UVM phase(build → connect → reset → configure → post_configure → main → shutdown → check)를 따라 어떻게 실행되는지 추적할 수 있다.
- Apply Analysis Port 1:N 브로드캐스트 구조에 새 subscriber를 추가하는 패턴(
drv.issued_wqe_ap,drv.cqe_ap,cq_handler.cqe_validation_cqe_ap)을 적용할 수 있다. - Evaluate 새 컴포넌트 추가 시 4원칙(Open-Closed / Interface Stability / DRY via AP / Stateless 보존) 위반 여부를 평가할 수 있다.
- Debug 4대 디버그 케이스(Data Mismatch, CQ Poll Timeout, C2H Tracker, Unexpected Error CQE)를 에러 메시지 ID와 QID(
H2C/C2H)만 보고 트리아지할 수 있다. - Promote 의도된 에러 시나리오를
expected_error+RDMAQPDestroy(.err(1))패턴으로 정상화할 수 있다.
📋 사전 지식¶
- RDMA (InfiniBand & RoCEv2) — 특히 Module 04 (Service & QP FSM), 05 (Memory Model), 06 (Data Path), 08 (RDMA-TB 검증 환경)
- UVM — agent / sequence / sequencer / phase / TLM analysis port
- VCS / mrun / SystemVerilog 1800 기본 구문
🗺️ 개념 맵¶
개념 의존성 — 순서대로 학습 권장
각 노드 = 모듈 (클릭하여 이동) · 화살표(→) = 선수 지식 흐름 · 1부 끝(M07) → 2부 진입(M08)
📚 학습 모듈¶
1부 — 아키텍처¶
01
TB Overview & Multi-Node 구조
02
Component 계층 (lib/base/component)
03
UVM Phase & Test Flow
04
Analysis Port Topology
05
Adding New Components — 4원칙
06
Error Handling Path
07
H2C / C2H QID Reference
2부 — 디버깅 케이스¶
08
Data Integrity Error
09
CQ Poll Timeout
10
C2H Tracker Error
11
Unexpected Error CQE
★
Debug Cheatsheet
에러 ID prefix 빠른 인덱스¶
| Prefix | 컴포넌트 | 모듈 |
|---|---|---|
E-DRV-TBERR-* |
vrdma_driver |
M09 CQ Poll Timeout |
F-CQHDL-TBERR-* |
vrdma_cq_handler |
M11 Unexpected Error CQE |
E-SB-MATCH-* |
comparator (1side / 2side / imm) | M08 Data Integrity |
F-C2H-MATCH-* / E-C2H-MATCH-* |
vrdma_c2h_tracker |
M10 C2H Tracker |
📖 참조 자료¶
- Confluence —
RDMADVspace — Testbench Architecture, Debugging Cases (source of truth) RDMA-TB/lib/— RDMA IP 검증 환경 본체 (base/,ext/,external/,submodule/4-layer)RDMA-TB/lib/base/def/vrdma_defs.svh:75-88— H2C/C2H QID 단일 출처- 용어집 — 29 terms (ISO 11179 형식)
- 퀴즈 인덱스 — 챕터별 학습 점검 (Bloom 단계 라벨)