ajout infos des archives de proposition wiki

This commit is contained in:
Tykayn 2025-08-31 12:22:07 +02:00 committed by tykayn
parent 7665f1d99c
commit 9bd1fddd8a
9 changed files with 2517 additions and 27 deletions

View file

@ -5,7 +5,7 @@ jour ou de traductions, et publier des suggestions sur Mastodon pour encourager
## Vue d'ensemble
Le projet comprend neuf scripts principaux :
Le projet comprend dix scripts principaux :
1. **wiki_compare.py** : Récupère les 50 clés OSM les plus utilisées, compare leurs pages wiki en anglais et en
français, et identifie celles qui ont besoin de mises à jour.
@ -15,19 +15,21 @@ Le projet comprend neuf scripts principaux :
suggestion de traduction sur Mastodon.
4. **propose_translation.py** : Sélectionne une page wiki (par défaut la première) et utilise Ollama avec le modèle
"mistral:7b" pour proposer une traduction, qui est sauvegardée dans le fichier outdated_pages.json.
5. **detect_suspicious_deletions.py** : Analyse les changements récents du wiki OSM pour détecter les suppressions
5. **suggest_grammar_improvements.py** : Sélectionne une page wiki française (par défaut la première) et utilise grammalecte
pour vérifier la grammaire et proposer des améliorations, qui sont sauvegardées dans le fichier outdated_pages.json.
6. **detect_suspicious_deletions.py** : Analyse les changements récents du wiki OSM pour détecter les suppressions
suspectes (plus de 20 caractères) et les enregistre dans un fichier JSON pour affichage sur le site web.
6. **fetch_proposals.py** : Récupère les propositions de tags OSM en cours de vote et les propositions récemment modifiées,
7. **fetch_proposals.py** : Récupère les propositions de tags OSM en cours de vote et les propositions récemment modifiées,
et les enregistre dans un fichier JSON pour affichage sur le site web. Les données sont mises en cache pendant une heure
pour éviter des requêtes trop fréquentes au serveur wiki.
7. **find_untranslated_french_pages.py** : Identifie les pages wiki françaises qui n'ont pas de traduction en anglais
8. **find_untranslated_french_pages.py** : Identifie les pages wiki françaises qui n'ont pas de traduction en anglais
et les enregistre dans un fichier JSON pour affichage sur le site web. Les données sont mises en cache pendant une heure.
8. **find_pages_unavailable_in_french.py** : Scrape la catégorie des pages non disponibles en français, gère la pagination
9. **find_pages_unavailable_in_french.py** : Scrape la catégorie des pages non disponibles en français, gère la pagination
pour récupérer toutes les pages, les groupe par préfixe de langue et priorise les pages commençant par "En:". Les données
sont mises en cache pendant une heure.
9. **fetch_osm_fr_groups.py** : Récupère les informations sur les groupes de travail et les groupes locaux d'OSM-FR
depuis la section #Pages_des_groupes_locaux et les enregistre dans un fichier JSON pour affichage sur le site web.
Les données sont mises en cache pendant une heure.
10. **fetch_osm_fr_groups.py** : Récupère les informations sur les groupes de travail et les groupes locaux d'OSM-FR
depuis la section #Pages_des_groupes_locaux et les enregistre dans un fichier JSON pour affichage sur le site web.
Les données sont mises en cache pendant une heure.
## Installation
@ -53,6 +55,12 @@ Pour utiliser le script propose_translation.py, vous devez également installer
ollama pull mistral:7b
```
Pour utiliser le script suggest_grammar_improvements.py, vous devez installer grammalecte :
```bash
pip install grammalecte
```
## Configuration
### Mastodon API
@ -144,6 +152,28 @@ ollama pull mistral:7b
Le script enregistre la traduction proposée dans la propriété "proposed_translation" de l'entrée correspondante dans le fichier outdated_pages.json.
### Suggérer des améliorations grammaticales avec grammalecte
Pour sélectionner une page wiki française (par défaut la première avec une version française) et générer des suggestions d'amélioration grammaticale avec grammalecte :
```bash
./suggest_grammar_improvements.py
```
Pour vérifier une page spécifique en utilisant sa clé :
```bash
./suggest_grammar_improvements.py --page type
```
Note : Ce script nécessite que grammalecte soit installé. Pour l'installer, exécutez :
```bash
pip install grammalecte
```
Le script enregistre les suggestions grammaticales dans la propriété "grammar_suggestions" de l'entrée correspondante dans le fichier outdated_pages.json. Ces suggestions sont ensuite utilisées par Symfony dans le template pour afficher des corrections possibles sur la version française de la page dans une section dédiée.
### Détecter les suppressions suspectes
Pour analyser les changements récents du wiki OSM et détecter les suppressions suspectes :
@ -302,7 +332,28 @@ Contient des informations détaillées sur les pages qui ont besoin de mises à
"date_diff": 491,
"word_diff": 700,
"section_diff": 2,
"priority": 250.5
"priority": 250.5,
"proposed_translation": "Texte de la traduction proposée...",
"grammar_suggestions": [
{
"paragraph": 1,
"start": 45,
"end": 52,
"type": "ACCORD",
"message": "Accord avec le nom : « bâtiments » est masculin pluriel.",
"suggestions": ["grands"],
"context": "...les grandes bâtiments de la ville..."
},
{
"paragraph": 3,
"start": 120,
"end": 128,
"type": "CONJUGAISON",
"message": "Conjugaison erronée. Accord avec « ils ».",
"suggestions": ["peuvent"],
"context": "...les bâtiments peut être classés..."
}
]
},
{
"key": "amenity",