Distance

HugoTrentesaux · 2 November 2023 22:26

Ce serait pas mal d’ajouter quelques trucs par rapport à la distance :

pouvoir appeler request_distance_evaluation pour quelqu’un d’autre. Parce qu’on se fait slasher si la distance est ko, donc il vaut mieux que ce soit un ancien membre qu’un nouveau
ajouter des événements quand une évaluation de distance est demandée ou un résultat publié. Ça va grandement aider le débuggage, on pourra toujours enlever les événements s’ils sont trop bruyants (mais j’en doute).
que le binaire distance-oracle ait un mode plus verbeux par défaut pour savoir plus facilement ce qu’il a fait. Et aussi des logs dans un fichier ça me paraît une bonne idée.

Voilà. Je suis en train d’ajouter des trucs dans Ğcli pour la distance, ça va être utile.

poka · 28 November 2023 13:18

Côté client, je n’ai pas suivi au moment où vous travaillez sur la distance.
En gros, il faudrait pouvoir batcher l’extrinsic `` au moment de la dernière certification nécessaire pour devenir membre ?

Mais ce n’est pas possible pour le moment, car seul l’intéressé peut executer cet extrinsic si je comprend bien, étant qu’il ne prend aucun argument.

Si cela devient possible, alors je pourrais augmenter ce batch d’un 3ème extrisic à cet endroits.

final tx1 = 'api.tx.cert.addCert($fromIndex, $toIndex)';
final tx2 = 'api.tx.distance.requestDistanceEvaluation($toIndex)';
final tx3 = 'api.tx.identity.validateIdentity($toIndex)';

C’est l’idée ?

Sauf qu’il faudrait que j’attende le résultat de l’oracle avant de tenter de valider l’identité, donc non ça ne peut pas s’exécuter dans le même bloc …
Comment je fais pour récupérer le résultat de l’oracle ? Si le résultat arrive disons 10 secondes plus tard par exemple, je ne vois pas trop où et quand appeler identity.validateIdentity()…

HugoTrentesaux · 28 November 2023 14:06

C’est pas encore très clair de savoir comment on va gérer la validation d’identité et la règle de distance. Peut-être qu’il faudrait une autre API qui sert au calcul de la règle de distance pour savoir si on doit ou pas inclure le call requestDistanceEvaluation dans le batch de la dernière certification parce que sinon on expose le certificateur à être slashé parce que l’évaluation est négative. Par contre, c’est possible d’inclure un call schedule pour valider l’identité deux sessions plus tard (du moment que c’est appelable par un tiers).

tuxmain · 28 November 2023 20:33

Le calcul prend 2-3 sessions (heures). Le résultat est stocké dans IdentityDistanceStatus seulement s’il est positif (ou que le calcul est en cours).

Le but est que les clients (ou les indexeurs, ou autre service dédié) fassent le calcul en local avant d’appeler le call, pour réduire le risque d’échec en blockchain (qui peut coûter cher, et dans le futur activer un délai antispam). La crate distance-oracle peut être utilisée facilement dans un client ou en standalone, mais l’algo est compatible avec les logiciels de la V1 normalement donc les calculateurs de distance existants peuvent aussi être adaptés.

poka · 7 December 2023 21:45

Pourquoi est-ce que ça prend autant de temps ? Est-ce lié au mécanisme de l’oracle, ou bien est-ce vraiment le calcul en lui même qui prend ce temps (ce qui m’étonne beaucoup) ?

Il me semblais avoir compris que @cgeek avait de son côté implémenté une version “inblock” de ce calcul de distance et qu’apparemment avec la taille de la wot g1 actuelle ça pouvais totalement fonctionner dans le laps de temps de création de block (2s?) ?

Comment expliquer une telle différence ?
Si nous définissons des sessions de 3h pour la Ğ1, est-ce que cela demandera toujours 2-3 sessions ?

Je suis curieux à ce sujet

tuxmain · 8 December 2023 07:33

Le calcul en lui-même est rapide, mais pour avoir de la marge on découpe en sessions. Il y a trois phases durant une session chacune :

la pool se remplit de demandes
les calculateurs récupèrent les données et font le calcul
les calculateurs publient les résultats dès qu’ils forgent un bloc_

Au début de la session suivante, les résultats sont appliqués d’un coup.

La difficulté étant qu’aucun résultat de calcul venant d’un validateur n’est garanti, donc il faut accepter plusieurs calculs et prendre la médiane des résultats (si <50% des calculateurs mentent on aura le bon résultat).

Donc il faut synchroniser et laisser le temps de faire des blocs. On aura aussi l’assurance que quand les calculs seront plus longs, les calculateurs auront toujours au moins une session pour les faire, ce qui permet de calculer moins vite pour ne pas ralentir le serveur (laisser des cœurs libres pour Duniter par exemple).

On pourrait se synchroniser avec des numéros de blocs modulo N plutôt que des sessions, si besoin.

L’implémentation qu’utilisait cgeek occupait une bonne partie d’un bloc pour le pire des cas de la G1, mais ce pire des cas sera bien pire dans quelques années. On pourrait remplacer l’algo par le mien qui est bien plus rapide, mais en WASM ce sera plus lent, surtout avec les limitations du runtime. Il faudrait probablement un quota spécial distance…

Enfin séparer Duniter et la distance permet de ne pas obliger tous les forgerons à calculer la distance. Le jour où la distance sera trop longue pour un RPi, les RPi pourront encore faire tourner un nœud.

cgeek · 8 December 2023 20:44

Clairement : ce qui prend le plus de temps, et de loin, c’est la réplication de la toile via RPC.

Le calcul est très rapide pour l’instant.

poka · 9 December 2023 20:36

Je me sens obligé de demander/proposer cette fonctionnalité avant d’aller plus loin.

Si j’ai bien compris, nous évitons les calls automatiques dans duniter pour s’assurer de pouvoir taxer quelqu’un si ce call échoue, et ainsi éviter le spam.

Mais ne serait-il pas possible de créer un nouvel extrinsic distance.requestDistanceEvaluationThenValidate(idtyIndex), qui ferait la même chose requestDistanceEvaluation, mais qui programmerait également l’extrinsic validateIdentity grâce au call schedule en root (car appelable uniquement via root), à la condition que distance.identityDistanceStatus(idtyIndex) soit validé ?

Ou bien, que cet extrinsic validateIdentity soit appelé par l’oracle directement au moment de la publication si l’identité a le status confirmedByOwner, étant donné que cet extrinsic est appelable par n’importe qui ?

Ainsi en cas d’échec, c’est celui qui appelle requestDistanceEvaluationThenValidate qui trinque pour tout.

Je sais que techniquement c’est possible, mais les questions sont:

Est-ce idiomatique de substrate et son oracle ?
Si oui pensez-vous pouvoir implémenter ça pour le prochain runtime ?

Je préfère demander maintenant pour m’assurer de ne pas rentrer dans des mécaniques de validation d’identité côté client qui deviendraient obsolète avant même la mise en prod.

Dans l’hypothèse ou ceci n’est que fantaisie, le seul élément bloquant pour moi côté client reste que requestDistanceEvaluation ne soit pas appelable pour n’importe qui (requestDistanceEvaluation(idtyIndex)), de manière à la batcher avec la certification numéro minCertForMembership (élément qui sera probablement renommé vue que vous avez décidé de faire sauter la palette membership ^^).

cgeek · 10 December 2023 12:56

Dans le fond, c’est exactement ce que je souhaite aussi : que distance.requestDistanceEvaluation soit la seule étape qui permet de passer du statut de futur membre à membre, ou encore de décaler le moment où le statut de membre peut être perdu (sauf à perdre une certification qui ferait passer en dessous des 5 requises, bien sûr).

Au regard du code, identity.validate_identity ne fait que vérifier :

Le nombre de certifications est suffisant
La règle de distance est respectée

En termes d’écritures en cas de succès, et sous l’hypothèse du retrait des adhésions, et bah je dirais : 1 seule écriture supplémentaire pour :

le passage de l’identité au statut Validated
son champ first_eligible_ud

Je manque d’expertise sur les poids pour trancher, mais j’ai du mal à voir comment nous pourrions être contre le comportement que tu proposes.

tuxmain · 10 December 2023 18:10

C’est faisable d’autoriser d’autres comptes à demander l’évaluation, on peut enregistrer le account_id du compte demandeur plutôt que celui de l’identité candidate. En cas d’échec, le compte demandeur sera slashé.

Cette possibilité amène une question : pour la future implémentation de l’antispam, est-ce que la limite s’applique à la fréquence de demandes/échecs (demandes ou échecs, c’est encore une autre question) de la part d’un compte demandeur ? d’une identité demandeuse (seuls les membres pourraient demander, autres que les identités candidates) ? pour l’identité candidate ?

Pour la fonction deux-en-un distance+validation, je verrais ça dans duniter-wot.

Il n’y a pas d’autres hooks qui sont appelés quand on devient membre, pour mettre à jour N par exemple, le membership…? Le vrai poids serait donc plus élevé. Mais comme il y a déjà assez d’antispams pour toutes les étapes préalables à devenir membre (difficile de devenir membre tous les 10 blocs) ça ne me choque pas que le poids de cette validation (qui vient d’un inhérent, pas d’un extrinsic) soit gratuit.

cgeek · 10 December 2023 20:57

En effet j’ai loupé la mise à jour de N dans mon analyse, il faudrait compter une écriture supplémentaire.

Rien de très coûteux ceci dit, et encore moins au regard du calcul de distance qui le précède. Si quelqu’un devient membre, c’est plutôt une chose à fêter qu’à faire payer

HugoTrentesaux · 11 December 2023 10:25

Tout à fait d’accord, le fonctionnement actuel est trop lourd pour l’utilisateur, il faut le simplifier, et ça ne vaut pas la peine d’implémenter dans une UI des choses qui vont devenir obsolètes (par contre, je le fais dans Ğcli parce que ça facilite les tests).

Tu fais référence à #113 ou à autre chose ? C’est bien de décrire un scénario d’attaque avant de se lancer dans des réflexions antispam. Dans l’idée de substrate, la seule chose qui entre en jeu contre le spam c’est de la monnaie, nous on a en plus le concept d’identité. Si on limite certains appels aux identité, ça permet de voir qui spamme et de faire intervenir de la modération humaine. Si celle-ci échoue, on peut ajouter un statut “blacklisted” à l’identité problématique.

Moi aussi, je rajouterais un hook appelé après une évaluation positive de la distance qui déclencherait la validation de l’adhésion. D’abord la refacto des pending membership qui devrait clarifier la question de la “validation” d’identité, et je pourrai faire dans la foulée.

Qu’appelles-tu N ??

visiblement vous vous comprenez, mais pas moi

tuxmain · 11 December 2023 10:41

oui, le scénario étant simplement une demande de distance très fréquente de la part d’un compte membre ou non, valide ou en échec.

Le nombre de membres, pour la formule du DU.

HugoTrentesaux · 11 December 2023 10:50

On peut limiter la demande de distance aux comptes membres, ce qui n’est pas gênant puisque en pratique, elle pourra être faite par le cinquième certificateur (éventuellement sur option d’un résultat positif donné par un tiers).

Il n’y a pas besoin de le mettre à jour manuellement, c’est donné par le trait MembersCount dont voici l’implémentation :

impl<T: Config<I>, I: 'static> MembersCount for Pallet<T, I> {
    fn members_count() -> u32 {
        Membership::<T, I>::count()
    }
}

cgeek · 11 December 2023 11:31

Nous échangions sous l’hypothèse du retrait des adhésions.

HugoTrentesaux · 18 December 2023 14:35

Ce serait pas mal de ramener ce temps d’évaluation à 5 minutes comme dans Duniter v1. Par contre il faudra trouver un remplaçant pour on_new_session. Ça pourrait être un on_init avec un modulo, tout simplement.

Je réfléchis à ça (dans #159) et il y a deux cas pour lesquels on peut souhaiter une évaluation de la distance : claim_membership (qui remplace totalement validate_identity depuis !215) et renew_membership qui est l’autre moment auquel on est amené à demander une évaluation de la distance. Heureusement on peut entièrement le déduire du statut de l’identité :

Unvalidated → claim_membership → Member
Member → renew_membership → Member
NotMember → claim_membership → Member

Et si on a un autre statut (Unconfirmed, Revoked), le call ne fonctionnera juste pas.

Par contre, si on laisse la possibilité de l’appeler pour quelqu’un d’autre, ça permet de raviver le compte d’un membre inactif, ce qu’on ne souhaite pas. Et pour l’antispam sur request_distance_evaluation qui fonctionne actuellement en reserve / slash, un membre très riche pourrait demander l’évaluation de la distance pour toute la toile à chaque session sans rien perdre puisque les distances sont valides.

HugoTrentesaux · 18 December 2023 14:41

La solution pourrait être celle-ci : on ne peut appeler request_distance_evaluation que pour :

soi même
une identité qui est unconfirmed

Et après une évaluation de distance positive, la pallet wot regarde le statut de l’identité et si c’est unconfirmed, elle appelle claim_membership. Sinon elle regarde si le compte qui a demandé l’évaluation correspond à l’identité Ça devrait toujours fonctionner, mais si ça ne fonctionne pas, c’est pas grave, il suffit de le faire manuellement.

Comme ça on a un onboarding correct et une sécurité correcte.

[edit] Draft: automatically claim membership (!219) · Merge requests · nodes / rust / Duniter v2S · GitLab

cgeek · 19 December 2023 06:15

Au niveau des benchmarks, comment se passe l’étalonnage ? J’imagine que c’est la pire situation qui est retenue, n’est-ce pas ?

HugoTrentesaux · 19 December 2023 10:43

@bgallois a mis à jour la documentation pour écrire les benchmarks : docs/dev/weights-benchmarking.md · master · nodes / rust / Duniter v2S · GitLab. On y trouve ceci :

How to Write Benchmarks

Calls

Ensure that any extrinsic call is benchmarked using the most computationally intensive path, i.e., the worst-case scenario.

Hooks

Benchmark each hook to determine the weight consumed by it; hence, it is essential to benchmark all possible paths.

Handlers and Internal Functions

When designing handlers and internal functions, it is advisable to avoid having them return weight for the following reasons:

Simplified Benchmarking: Writing benchmarks for hooks or calls where handlers and internal functions are utilized becomes more straightforward.

Reduced Benchmarking Complexity: By directly measuring execution and overhead in a single pass, the number of benchmarks is minimized.

Enhanced Readability: Understanding that weight accounting occurs at the outermost level improves the overall readability of the code.

One notable exception is the internal functions called in hooks like on_idle or on_initialize that can be easier to benchmark separately when the hook contains numerous branching.

Donc dans le cas des calls c’est bien la pire situation qui est retenue et elle sert à déterminer a priori si on inclut la call ou pas, mais dans le cas des hook ou des handlers qu’on va de toute manière inclure, on peut mesurer chaque chemin. L’idée est qu’ils vont être appelés quoi qu’il en soit et dans un contexte où il reste pas mal de poids : on_initialize (le poids du bloc), ou on_idle (le poids restant connu à l’avance), et donc on peut appeler la fonction et voir ce qu’il reste comme poids après.

Elois avait ouvert des tickets d’optimisation sur des “non mandatory inherents”. Je pense que l’idée était que plutôt d’utiliser des rouages internes, utiliser à la place des inherents, donc des calls non signés, non propagés, et ajoutés optionnellement par l’auteur du bloc. Mais je pense qu’on est encore très loin de devoir se poser ces questions d’optimisation.

Il faut regarder les poids pour se faire des idées d’ordre de grandeur pour éviter de passer de l’énergie à optimiser des aspects négligeables. Il y a un boulot de visibilisation des poids à faire dans la #128 pour qu’on puisse lire ça sur une page web plutôt que d’avoir à fouiller les valeurs dans le code.

tuxmain · 19 December 2023 11:50

Si en une session il y a beaucoup d’évaluations, elles passeront toutes en un seul bloc qui peut donc être un peu lourd. On pourrait étaler les identités à traiter sur plusieurs blocs, au prix de compliquer un peu le storage.

Cependant réduire la période d’évaluation réduira d’autant le poids de l’inhérent puisqu’il y aura moins d’identités en moyenne donc autant faire ça d’abord.