Arrèt inopiné de mon noeud membre Ğtest

Lorsque je suis suis connecter à mon serveur il y a 30 min, quel ne fût pas ma surprise de voir que mon nœud membre s’est interrompu tout seul à 13h48, ça ne m’étais jamais arriver sous test_net, voici les log :

2017-01-24T13:45:53+01:00 - debug:  `--> to peer XeBpJwRLkF [------] (duniter.help-web-low.fr:8999)
2017-01-24T13:45:53+01:00 - debug:  `--> to peer C4orqutdb3 [------] (gtest.duniter.org:10900)
2017-01-24T13:45:53+01:00 - debug:  `--> to peer GacaywVf8A [------] (gtest.duniter.tednet.fr:8999)
2017-01-24T13:45:53+01:00 - debug:  `--> to peer J2ApoCLvZZ [------] (peer.duniter.org:8999)
2017-01-24T13:45:53+01:00 - debug:  `--> to peer 4LMye63Xv5 [------] (raspi3.cgeek.fr:8999)
2017-01-24T13:45:57+01:00 - trace: Checking if node TENGx7 is UP... (88.174.120.187:50560)
2017-01-24T13:46:07+01:00 - trace: Peer TENGx7WtzFsTXwnbrPEvb6odX2WnqYcnnrjiiLvp1mS is DOWN (ESOCKETTIMEDOUT)
2017-01-24T13:46:07+01:00 - debug: Will check that node TENGx7 (88.174.120.187:50560) is UP in 1 min...
2017-01-24T13:46:57+01:00 - trace: Checking if node BnSRjM is UP... (87.90.32.15:60527)
2017-01-24T13:46:57+01:00 - trace: Peer BnSRjMjJ7gWy13asCRz9rQ6G5Njytdf3pvR1GMkJgtu6 is DOWN (ENOTFOUND)
2017-01-24T13:46:57+01:00 - debug: Will check that node BnSRjM (87.90.32.15:60527) is UP in 1 min...
2017-01-24T13:47:17+01:00 - trace: Checking if node TENGx7 is UP... (88.174.120.187:50560)
2017-01-24T13:47:27+01:00 - trace: Peer TENGx7WtzFsTXwnbrPEvb6odX2WnqYcnnrjiiLvp1mS is DOWN (ETIMEDOUT)
2017-01-24T13:47:27+01:00 - debug: Will check that node TENGx7 (88.174.120.187:50560) is UP in 1 min...
2017-01-24T13:47:40+01:00 - info: Pulling blocks from the network...
2017-01-24T13:47:40+01:00 - trace: Try with gtest.vincentux.fr:8999 CFP3oa
2017-01-24T13:47:40+01:00 - debug: dl starts from 330
2017-01-24T13:47:40+01:00 - trace: Try with duniter.help-web-low.fr:8999 XeBpJw
2017-01-24T13:47:40+01:00 - debug: dl starts from 330
2017-01-24T13:47:40+01:00 - trace: Try with peer.duniter.org:8999 J2ApoC
2017-01-24T13:47:40+01:00 - debug: dl starts from 330
2017-01-24T13:47:40+01:00 - trace: Try with raspi3.cgeek.fr:8999 4LMye6
2017-01-24T13:47:40+01:00 - debug: dl starts from 330
2017-01-24T13:47:40+01:00 - info: Will pull blocks from the network in 3 min 59 sec
2017-01-24T13:47:59+01:00 - debug: --> new Peer to be sent to 8 peer(s)
2017-01-24T13:47:59+01:00 - info: POST Peer XeBpJwRLkF#299
2017-01-24T13:47:59+01:00 - debug:  `--> to peer HnFcSms8jz [member] (cgeek.fr:10900)
2017-01-24T13:47:59+01:00 - debug:  `--> to peer CFP3oacjwD [member] (gtest.vincentux.fr:8999)
2017-01-24T13:47:59+01:00 - debug:  `--> to peer 5ocqzyDMMW [member] (gtest.duniter.fr:10900)
2017-01-24T13:47:59+01:00 - debug:  `--> to peer bDq9H48BVE [member] (duniter.grohub.org:8999)
2017-01-24T13:47:59+01:00 - debug:  `--> to peer GacaywVf8A [------] (gtest.duniter.tednet.fr:8999)
2017-01-24T13:47:59+01:00 - debug:  `--> to peer J2ApoCLvZZ [------] (peer.duniter.org:8999)
2017-01-24T13:47:59+01:00 - debug:  `--> to peer C4orqutdb3 [------] (gtest.duniter.org:10900)
2017-01-24T13:47:59+01:00 - debug:  `--> to peer XeBpJwRLkF [------] (duniter.help-web-low.fr:8999)
2017-01-24T13:48:01+01:00 - trace: New node#13
2017-01-24T13:48:01+01:00 - trace: Link 4 -> 13
2017-01-24T13:48:01+01:00 - trace: Link 4 X> 13
2017-01-24T13:48:01+01:00 - trace: Removed node#13
2017-01-24T13:48:02+01:00 - trace: New node#13
2017-01-24T13:48:02+01:00 - trace: New node#14
2017-01-24T13:48:02+01:00 - trace: Link 4 -> 13
2017-01-24T13:48:02+01:00 - trace: Link 4 X> 13
2017-01-24T13:48:02+01:00 - trace: Removed node#14
2017-01-24T13:48:02+01:00 - trace: Link 4 -> 14
terminate called after throwing an instance of 'std::out_of_range'
  what():  vector::_M_range_check: __n (which is 14) >= this->size() (which is 14)
Aborted

Je précise que mon nœud tourne sur une machine qui me sert de serveur et que je n’éteint jamais. je n’ai pas eu de panne de courant ni aucun incident particulier.

C’est un bug qui peut être très gênant surtout que le collectif MLO se base pour mon nœud pour leur instance de cesium…

J’ai eu le même problème hier en ouvrant cesium embarqué dans duniter. J’ai testé 3 fois…

Malheureusement j’ai pas accès à mes logs…:frowning:

OK, je suppose que @mamygeek a eu le même problème. Vous avez tous les 2 un nœud membre, ça concorde.

J’ai ajouté un ticket de bug ici : https://github.com/duniter/duniter/issues/800

Merci, c’est typiquement le genre de bug qu’on cherche à débusquer. :thumbsup:

edit : en effet je suis d’accord avec elois, je n’avais pas vu ton message mamygeek : l’ouverture de Cesium est certainement un problème différent.

1 Like

je pense que ce n’ai pas du tout le même problème. Je n’ai fait aucune action, mon nœud à lacher pendant que je n’étais pas sur l’ordinateur. Je me suis rendu compte 1h15 plus tard…

@mamygeek normalement tu peut trouver tes log dans ton home : .config/duniter/duniter_default/duniter.log :wink:

Pas forcément. L’ouverture de cesium donne accès aux noeuds, je laisse donc l’hypothèse du même problème. Wait and see. :slight_smile:

Merci pour les logs mais je sais où ils sont. C’est windows qui me pose problème. Suite à une version antérieure de duniter, j’ai été brusquement privé d’accès au fichier.
Ce n’est pas trop génant pour le moment, sauf dans ce cas précis où la fermeture entraine aussi la fermeture de la fenêtre de logs.

Nouvel arrêt inopiné aujourd’hui à 16h42 ! Encore une fois, je n’étais pas connecté à ce moment là :

je vais de ce pas mettre à jours sur la 0.9.3 :wink:

2017-01-25T16:42:29+01:00 - trace: Link 8 X> 25
2017-01-25T16:42:29+01:00 - trace: Link 4 X> 25
2017-01-25T16:42:29+01:00 - trace: Link 3 X> 25
2017-01-25T16:42:29+01:00 - trace: Removed node#57
2017-01-25T16:42:29+01:00 - trace: Removed node#56
2017-01-25T16:42:29+01:00 - trace: Removed node#55
2017-01-25T16:42:29+01:00 - trace: Removed node#54
2017-01-25T16:42:29+01:00 - trace: Removed node#53
2017-01-25T16:42:29+01:00 - trace: Removed node#52
2017-01-25T16:42:29+01:00 - trace: Removed node#51
2017-01-25T16:42:29+01:00 - trace: Removed node#50
2017-01-25T16:42:29+01:00 - trace: Removed node#49
2017-01-25T16:42:29+01:00 - trace: Removed node#48
2017-01-25T16:42:29+01:00 - trace: Removed node#47
2017-01-25T16:42:29+01:00 - trace: Removed node#46
2017-01-25T16:42:29+01:00 - trace: Removed node#45
2017-01-25T16:42:29+01:00 - trace: Removed node#44
2017-01-25T16:42:29+01:00 - trace: Removed node#43
2017-01-25T16:42:29+01:00 - trace: Removed node#42
2017-01-25T16:42:29+01:00 - trace: Removed node#41
2017-01-25T16:42:29+01:00 - trace: Removed node#40
2017-01-25T16:42:29+01:00 - trace: Removed node#39
2017-01-25T16:42:29+01:00 - trace: Removed node#38
2017-01-25T16:42:29+01:00 - trace: Removed node#37
2017-01-25T16:42:29+01:00 - trace: Removed node#36
2017-01-25T16:42:29+01:00 - trace: Removed node#35
2017-01-25T16:42:29+01:00 - trace: Removed node#34
2017-01-25T16:42:29+01:00 - trace: Removed node#33
2017-01-25T16:42:29+01:00 - trace: Removed node#32
2017-01-25T16:42:29+01:00 - trace: Removed node#31
2017-01-25T16:42:29+01:00 - trace: Removed node#30
2017-01-25T16:42:29+01:00 - trace: Removed node#29
2017-01-25T16:42:29+01:00 - trace: Removed node#28
2017-01-25T16:42:29+01:00 - trace: Removed node#27
2017-01-25T16:42:29+01:00 - trace: Removed node#26
2017-01-25T16:42:29+01:00 - trace: Removed node#25
2017-01-25T16:42:29+01:00 - trace: Removed node#24
2017-01-25T16:42:29+01:00 - trace: Removed node#23
2017-01-25T16:42:29+01:00 - trace: Removed node#22
2017-01-25T16:42:29+01:00 - trace: Removed node#21
2017-01-25T16:42:29+01:00 - trace: Removed node#20
2017-01-25T16:42:29+01:00 - trace: Removed node#19
2017-01-25T16:42:29+01:00 - trace: Removed node#18
2017-01-25T16:42:29+01:00 - trace: Link 3 -> 57
terminate called after throwing an instance of 'std::out_of_range'
  what():  vector::_M_range_check: __n (which is 57) >= this->size() (which is 18)
Aborted

Malheureusement, je n’ai toujours pas investigué sur ce bug, donc tu risques de le reproduire encore …

pas de souci on est tous un peu dépassé et surtout toi c’est normal :wink:

mon noeud s’est arrété apparemment vers 16h43.
Je suis sous Debian 8, voici les logs :
https://bozon.help-web-low.fr/index.php?f=1588907acbb7da

Je me demande s’il n’y a pas un plantage au moment de faire rentrer des membres. Souvent j’ai constaté (sur une autre monnaie de test…) que les plantage ont lieues à ce moment la.

Oui @Pafzedog et moi exécutons tout deux notre nœud sur un serveur debian 8 jessie et nous avons une la panne au même moment à 1 min près (variation des l’horloges).
je pense qu’il s’agit du même bug.

Effectivement il y a eu une entrée de membre à 15h35 heure blockchain :
http://duniter.elois.ifee.fr:9001/blockchain/block/654

Il est peu probable que tout cela soit une coincidence !!

Oui, c’est bien au moment de l’ajout de membre (ou de sa tentative) que le bug se produit, c’est le module wotb qui est en cause (du C++).

Les logs de pafzedog ne montrent pas grand chose, car ils sont au niveau info. Mais s’ils étaient en trace, on aurait à coup sûr les mêmes logs que pour elois :

2017-01-25T16:42:29+01:00 - trace: Removed node#20
2017-01-25T16:42:29+01:00 - trace: Removed node#19
2017-01-25T16:42:29+01:00 - trace: Removed node#18
2017-01-25T16:42:29+01:00 - trace: Link 3 -> 57
terminate called after throwing an instance of 'std::out_of_range'
  what():  vector::_M_range_check: __n (which is 57) >= this->size() (which is 18)
Aborted

D’ailleurs juste en lisant le log on voit le problème : le module essaie d’ajouter le lien 3 -> 57 alors même que les nœuds (au sens de la toile de confiance) 18 à 57 ont été supprimés. Le message est clair :

throwing an instance of 'std::out_of_range'
what():  vector::_M_range_check: __n (which is 57) >= this->size() (which is 18)

Bref manifestement, il y a un problème d’algorithme.

1 Like

Je pense que 2 nœuds se sont arrêtés aux environs de 15h34 aujourd’hui. Vous confirmez ?

15H25 la fin de mon fichier log :confused:
comment mettre les logs en plus détaillés ? si besoin

non cette fois-ci mon nœud ne s’est pas arrêter, il semble que ça n’arrive pas a chaque fois/

mon nœud était bien arrêté lui.

Bonsoir, apparemment j’ai eu le même souci aujourd’hui, j’ai retrouvé mon node planté en rentrant du boulot ce soir. Les logs s’arrêtent vers 15h23.

Le issuer dans le block 654 c’est moi :slight_smile:
“issuer”: “bDq9H48BVEAHydtH8MHjrmdRnuq8d8GMUaPSzEn8TkC”

Dans le fichier de log j’ai ça :
2017-01-26T15:23:22+01:00 - warn: Identity with hash ‘048FA43B2348A23DAB2F0E130518D160D2E3A216E8A09944858E57EA0D80B087’ not found
2017-01-26T15:23:22+01:00 - warn: It already exists a certification written which is not chainable yet
2017-01-26T15:23:23+01:00 - warn: It already exists a certification written which is not chainable yet
2017-01-26T15:23:23+01:00 - warn: It already exists a certification written which is not chainable yet

Une idée sur le pourquoi du comment ?

La version 0.90.4 est disponible et devrait corriger le problème.

2 Likes

Pour l’instant ce n’est pas possible, c’est une chose que je pourrais rajouter par contre.

Eloïs lance probablement son noeud en direct, par une commande hors mode “daemon”.

edit : issue github ajoutée pour les logs.

2 Likes

Oui je le lance dans une session screen :wink:

1 Like