NVIDIA BlueField-2 DPU 配置为 NIC 网卡的折腾过程
前情提要
朋友搞来一块 NVIDIA BlueField-2 给我来玩玩,据说是他进 DPU 里面的 ARM 系统里面执行了一下更新命令,然后电脑设备管理器就感叹号了,里面的 ARM 跑着的系统也挂了。具体的情况他也不清楚,反正就到我手上了。
让他发了一块好的和一块坏的,两张都收到了,还带了一个 VMWare的 Edge 310 给我来研究。
实物情况
第一块
图片是后补的,不要介意。
背面标签
Model No:BF2M345A
P/N: MBF2M345A-VENOT_ES
S/N: MT219X37294
开机非常慢,设备管理器有一个模块报错误10
使用和主机通讯的串口,不知道账户和密码,只能重置了。
启动信息
固件版本
第二块
启动信息
固件版本
资源
所有的资源都是来自 NVIDIA 官网
文档
DOCA 文档
https://docs.nvidia.com/networking/dpu-doca/index.html#doca
1.5.1 LTS 文档
https://docs.nvidia.com/doca/archive/doca-v1.5.1/index.html
NVIDIA DOCA Installation Guide for Linux
DOCA
https://developer.nvidia.com/doca-downloads
这里 下载 DOCA 历史版本
网卡固件
https://linux.mellanox.com/public/repo/
具体步骤
物主要求把卡弄好,当成正常的 CX6 网卡使用,参考了下面两个教程和官网的文档。
https://www.bilibili.com/video/BV1Cm421s7sq
https://www.bilibili.com/read/cv32771337
1、安装 Ubuntu
这个就不用说了吧。
2、安装 DOCA 环境
直接装最新版的就行,不需要特意装1.5.1版本的。
如果碰到卡在 building initial module ,请关闭主板的 Secure Boot 功能。
3、启动 rshim
如果没装过的话记得 sudo apt get install minicom 一下。
5、重置 DPU 的 ARM 核
6、向 DPU 更新 DOCA 1.5.1-LTS 版本
首先必须得更新到这个版本,再更新网卡驱动,直接更新最新的 DOCA 版本的话系统会起不来,如图所示。
7、启动成功,修改默认账户和密码
ubuntu ubuntu
ubuntu Bf112233
8、备份网卡固件
在宿主机上执行
备份固件命令,这里请根据具体的PCI地址来修改。
9、启动 mst 服务,查询网卡版本
10、更新网卡固件到 24.35 版本
这个固件是包含在 DOCA 1.5.1 内的,据作者在评论区所说这是最后一个包含这个网卡 PSID 的最后一个版本系统。所以先刷 DOCA 1.5.1,再升级到 DOCA 2.7,再升级最新的网卡固件。能不能跳过这个步骤直接升级最新的网卡固件我不知道,我也不愿意试试,毕竟不便宜。
从系统内提取固件(不需要操作)
下面是提取这个固件的命令,我已经提取好了,不用再操作了
提取出来的固件解包通过 mft-scripts 可以看到是有这个 PSID 的
然后从 mlnx-fw-updater_23.10-3.2.2.0_arm64.deb 中解包找到了最新的固件 24.39.3560
11、冷重启电脑,查看网卡版本
查看到网卡版本已经更新到24.35.2000了
这个版本 UEFI BIOS 里面仍旧没有网卡模式选项,所以继续升级版本。
12、DPU 更新 DOCA 2.7 版本
更新过程中会提示更新 NIC FW 错误,不用管他
13、启动成功后修改默认账户和密码
ubuntu ubuntu
ubuntu Bf1122334455
13、更新网卡版本
传送网卡固件到 DPU 内
冷重启之后查看到更新完成
14、切换为 NIC 模式
https://docs.nvidia.com/doca/sdk/nvidia+bluefield+modes+of+operation/index.html#src-2609505413_id-.NVIDIABlueFieldModesofOperationv2.7.0-NICModeforBlueField-2
非常简单,官方提供了几种模式,其中最方便的是在 ARM 的 UEFI BIOS 里面修改。
- Select “Device Manager”.
- Select “System Configuration”.
- Select “BlueField Modes”.
- Set the “NIC Mode” field to
NicMode
to enable NIC mode.
上面的貌似不起作用,用下面这个试试。
重启之后,网卡显示未插入网线,应该是正常了?我没有条件测试,就这样了,给物主发回去了。
所有的资源都在这里,网盘链接失效了的话就从我NAS里面慢慢拖吧,另外官网里面都有下载地址,随便找找就有了。
链接:https://pan.baidu.com/s/1UV7XDu6N3P9oROhStSS8hw?pwd=2333
提取码:2333
https://alist.irec.moe/@login
用户名:bf
密码:bf12345