:-y

11 : KrISS paol

mardi 16 avril 2024 - 16:04

11e et dernier bout de code de la série que j'avais promis pratiquement l'année passée pour les 11 ans de tontof.net. C'est promis je ne ferai plus de promesse que je ne pourrais pas tenir... Euh... Ça commence mal ? En tout cas, j'avoue que je n'avais pas imaginé que cela m'aurait pris autant de temps pour publier tous ces bouts de code.

Pour terminer la série voici donc KrISS paol un petit outil qui permet d'exploiter le système PAO pour retenir des suites de chiffres. PAO c'est pour Personne, Action et Objet et PAOL c'est avec un Lieu en plus. Des explications sont données sur la page consacrée au projet, je ne vais donc pas m'étendre sur le projet mais plutôt sur les données qui avec votre aide pourrait grandement s'améliorer.

Dans l'idée si vous devez retenir les décimales de π : 3.141592653, au lieu de les retenir directement vous apprenez la phrase : Dorothée loue une péniche à Limoux et avec la traduction du code chiffres - sons vous retrouvez les décimales ! Ça permet aussi de retenir des numéros de téléphone ou des codes pour certains accès (je m'en suis servi pour le code d'une imprimante que j'utilisais ponctuellement et après presque un an sans l'avoir utilisé, j'avais oublié le code mais pas la phrase qui m'a permis de le retrouver facilement !).

Actuellement, c'est déjà fonctionnel mais j'aimerais pouvoir améliorer les données pour avoir encore plus de choix dans les phrases proposées. Ce qu'il faut savoir c'est que la partie la plus délicate est la traduction d'un mot en phonétique pour ensuite le traduire en chiffres. Pour limiter certaines erreurs j'ai supprimé les mots qui avaient 2 prononciations différentes dans le wiktionary. Il y a donc des mots qui sont supprimés, comme par exemple le prénom Jean qui correspond à 6 mais qui peut aussi se prononcer DJean pour le vêtement et qui dans ce cas correspondrait à 16. Pour "Jean/jean", on pourrait faire la différence s'il s'agit d'une personne ou d'un objet mais à partir des données que j'ai pu extraire je n'ai pas vraiment pu gérer ce genre d'exception et "Jean/jean" ne sont donc pas proposés.

Pour la liste des personnes, j'ai utilisé les données de l'INSEE pour utiliser les prénoms français donnés entre 1900 et 2021 (les propositions sont ordonnées par fréquence d'apparition). Pour améliorer cette liste, une liste de personnalités/personnages seraient un plus, mais je n'ai pas trouvé de listes suffisamment fournie et intéressante pour pouvoir l'intégrer.
Plus de détails : https://github.com/tontof/kriss_paol/blob/main/data/person/script.bash

Pour les actions, j'ai trouvé une liste de verbes conjugués et je n'ai gardé que les temps présent et futur qui ont une prononciation différente. (Certains systèmes PAO utilisent seulement la traduction du verbe à l'infinitif, j'ai préféré prendre le son du verbe dans la phrase finale).
Plus de détails : https://github.com/tontof/kriss_paol/blob/main/data/action/script.bash

Pour les objets, c'est une donnée assez difficile à trouver et je suis donc parti d'une liste de noms assez générique. Le résultat n'est pas trop mal mais peut sûrement être amélioré.
Plus de détails : https://github.com/tontof/kriss_paol/blob/main/data/object/script.bash

Enfin pour les lieux, c'est encore sur l'INSEE que j'ai récupéré les communes de France. Mais là encore, il serait intéressant de pouvoir ajouter d'autres localités comme les villes assez connues d'autres pays (Londres, etc.), des noms de pays (Italie, etc.), des lieux précis (la tour Eiffel, etc.).
Plus de détails : https://github.com/tontof/kriss_paol/blob/main/data/location/script.bash

Tout est sur Github pour les infos un peu plus techniques mais si vous avez des pistes d'améliorations je suis preneur !
New comment







          ____  __       
|  | |  |    / /  \ |  | 
\__/ \__/  _/  |__| |  | 
   |    |    \ |  | |/\| 
\__/ \__/ ___/ |  | |  |