Проблемы с репликацией ProxMox
Linux / Виртуализация
Ошибка вида:Replication job '5403-1' with target 'node-01' and schedule '*/4:00' failed!
Last successful sync: 2024-09-03 09:46:09
Next sync try: 2024-09-03 12:30:03
Failure count: 3
Note: The system will now reduce the frequency of error reports, as the job appears to be stuck.
Error:
command '/usr/bin/ssh -e none -o 'BatchMode=yes' -o 'HostKeyAlias=node-01' root@10.10.1.1 -- pvesr prepare-local-job 5403-1 --scan ssd-data1 ssd-data1:subvol-5403-disk-0 --last_sync 1725331569' failed: exit code 255
Данная ошибка у нас возникла когда мы вынуждено переустановили одну из нод, причем репликация на данную ноду проходила, миграция на эту ноду тоже работала, а вот с данной ноды - репликация после переезда ВМ, не проходила...
Немного погуглив было найдено решение:
На каждой ноде выполнили:
pvecm updatecerts
Затем на одной из нод:
ssh-keyscan -t rsa node-01 node-02 node-03 >> /etc/pve/priv/known_hosts
* ноды нужно указать все на которых необходимо обновить
Ответ будет такой:
root@node-01:~# ssh-keyscan -t rsa node-01 node-02 node-03 >> /etc/pve/priv/known_hosts
# node-01:22 SSH-2.0-OpenSSH_9.2p1 Debian-2+deb12u3
# node-02:22 SSH-2.0-OpenSSH_9.2p1 Debian-2+deb12u3
# node-03:22 SSH-2.0-OpenSSH_9.2p1 Debian-2+deb12u3
После чего репликация прошла успешно!