
灵车固态炸了整台群晖
0x0 警告
2024年1月27日早上收到了 NAS 发过来的邮件推送,那时候我还正熟睡,起来之后看到邮件后并没有觉得有什么事情,下午登录进去之后发现 SSD 掉了,那就重启一下吧。

关机等了一会,给他开机,等了很久很久很久(10min+),还没进系统,接了个 HDMI 采集卡看了一下引导成功了,然后就接到了第一张图的那封邮件。进他的 Web 界面很卡很卡,我在想这是怎么了,SSD 都这么卡吗,然后果断关机。给这块 SSD 接电脑上看了看。
0x1 硬盘爆炸
接上电脑用 CDI 看了看他的 SMART,没看到有异常。算了一下 PE 数 74986 / 256 ≈ 293 PE,还好?

然后给整盘做镜像,这时候就发现速度不对了,只有 30M/s,那行,等你慢慢做完。

然后我正好有一块同型号的灵车硬盘,在我的软路由里,拆了他取出来准备做一下克隆,顺便看了一下 SMART 情况,还好。

0x2 尝试保留数据迁移硬盘
参考了一下网上的教程,想保留数据迁移硬盘,踩坑很多很多,就不详细叙述了,简单总结一下我尝试过的方法。
使用扇区到扇区对拷硬盘 提示配置丢失,需要重装

使用系统内组 RAID 1 的方法恢复
单独插另一块做好 RAID 的盘,提示配置丢失,需要重装
两块盘一起插,提示配置丢失,需要重装
原硬盘盘位不对,提示配置丢失,需要重装
单独插原硬盘盘位插回去 提示配置丢失,需要重装
单独插原硬盘盘位插回去 拔出其他所有盘,能开机
在此期间等的时间很久很久,等他同步一次数据和克隆硬盘都要2h以上,那个没坏的硬盘也是个垃圾货。
这里测试结果不代表不能以这种方式更换系统盘,我猜是因为我那块盘变成只读状态了,导致没法这样操作。
坑
还有群晖在硬盘出现问题后会自动触发数据清理,这个时候碰上这种盘根本没法操作任何东西,IO直接爆了。

在后面系统会直接卡死什么也做不了,所以我要在他开机之后马上去停止掉他这个数据清理。

直接在存储管理器暂停计划是没有用的,必须要在计划数据清理里面把启用数据清理计划的勾去掉,才能关掉他在运行的数据清理。
0x2 放弃
在后面直接没办法了,反正所有数据都有备份,直接重装整个 DSM,顺便把引导也更新到了7.2.1,是最后一个官方支持 AME 的版本。
从群晖系统盘恢复 VMM
对于我来说,NAS 的作用更多体现在 Server 上,所以我 VMM 上跑了一些虚拟机。Docker 的话则好办,数据目录是分离的并且我也做好了备份,重新拉一下镜像部署一下就恢复了。而 VMM 则麻烦很多,看到 Reddit 的一个帖子 How can I recover synology VMs in a disaster? 。
There are no real VMM backup solutions, except by backing up all data from inside the VM.
This makes VMM virtually useless for serious business use.
看到这我瞬间寒心了,然后想了想既然是 VM 那肯定有 VHD。这篇帖子、另一篇有提到 VMM 的虚拟磁盘存放位置。
/volume#/@iSCSI/LUN/VDISK_BLUN is the directory that houses the GUIDs…that house the disk files named by UUID.
所以我用 UFS Explorer Professional Recovery
,打开备份出来的的整个硬盘镜像。

可以看到有一个 233G 的 btrfs 分区,打开之后发现根目录都是 Docker 容器生成的文件夹,打开来看亦是。

找到 @iSCSI/LUN/VDISK_BLUN 打开看发现是空的,然后发现根目录有类似 UUID 一样的文件夹,打开一看,好家伙这不就是么。

vdisk.xxxx
静静的躺在里面,导出来一看正是我 VMM 里面虚拟机之一。为什么有那么多是因为我开了快照,里面有不同版本的很多个 vdisk
,找了一下把各个虚拟机的修改日期最新的 vidsk
导出来,然后用 V2V 转成 VMDK,再导入新的 VMM 里面(此处省略步骤),完美恢复。

0x3 更换 S3610
在小黄鱼买了一块 S3710 480G ,花了 180CNY(2025年2月),使用组 RAID1 再降级的方式更换硬盘,参考教程 五步操作将群晖RAID1阵列降级为Basic模式。

很顺利,最后手动扩充一下存储池,大功告成。
剩下的就是一些套件设置和用户恢复了,还好群晖用户数据是放在存储池下的 homes 目录里面,这样迁移机器保留硬盘不会丢数据,只需要重新建立一下用户就行。
而 Docker 因为我有把单独的数据目录备份,直接 pull 最新的镜像,重新配置一下存储空间和端口映射就完事了。
0x4 后记
远离灵车硬盘!远离灵车硬盘!远离灵车硬盘!
灵车拿来玩玩或是当 Steam 硬盘可以,但是像我这样把他当成主力盘用的话,真的可能就数据火葬场了,这是我第一次碰到在用的硬盘爆炸的,把我折腾不轻(以前是玩坏的,多写几轮直接暴毙那种,坏了就垃圾桶)。
我的数据都有备份,但是重新配置是真的折磨人。我买 S3610 也是看中了他的传家宝特性,希望能活久一点,不希望再有下一次了。