Recuperando dispositivo DRBD com o node primario no ativo
Colaboração: Roger Luft
Data de Publicação: 02 de abril de 2011
Algumas vezes em determinadas ocasiões como problemas de firewall, perda de conexão, falha na replicação, falha no dispositivo fisico, podem ocorrer erros no sistema de replicação DRBD (http://http://www.drbd.org). Após uma lida na documentação restaurei o recurso utilizando o método descrito abaixo:
Primeiro nos certificamos qual node esta com problemas, utilizamos:
# cat /proc/drbd
O node problematico deve apresentar algo do tipo:
cs:StandAlone ro:Unknown/Primary ds:DUnknown/UpToDate r-----
ou
cs:Connected ro:Secondary/Primary ds:Diskless/UpToDate C r-----
Se algum destes status for exibido, você está com problemas.
Iniciando Reparação
Suponhamos que o recurso utilizado se chama "dados"
Vá ao node que esta apresentando problemas
- Desconecte o recurso
# drbdadm disconnect dados
- Descarte os dados do recurso e reconecte novamente(SOMENTE NO SECUNDÁRIO DANIFICADO)
# drbdadm -- --discard-my-data connect dados
- Vá ao node "primario" e conecte o recurso
# drbdadm connect dados
Pronto, agora o comandocat /proc/drbd
deve estar mostrando a sincronização online com o dispositivo ainda montado e sendo utilizado no node primário.