⚡ find characters script now admits aliases separated by ;

2025-06-20 01:34:43 +02:00 · 2024-10-15 19:12:23 +02:00 · 2024-10-15 19:12:23 +02:00 · 20753789c9
commit 20753789c9
parent d76e23bb65
6 changed files with 71 additions and 23 deletions
--- a/find_characters_in_book.py
+++ b/find_characters_in_book.py
@ -4,38 +4,68 @@
 # les personnages que l'on recherche dans le livre ne sont pas mentionnés dans la ligne d'entête; mais dans les lignes entre deux entêtes, dans les corps de texte
 import csv
 import re
+import argparse
+import os
+
+# Ajouter un argument pour le chemin du dossier contenant le fichier livre.org
+parser = argparse.ArgumentParser(description='Rechercher les occurrences de personnages dans un fichier Org-mode.')
+parser.add_argument('dossier', nargs='?', help='Le chemin du dossier contenant le fichier livre.org. Si aucun dossier n\'est spécifié, le dossier courant sera utilisé.', default=os.getcwd())
+args = parser.parse_args()
+
+# Concaténer le chemin du dossier et le nom du fichier livre.org
+fichier_livre = f"{args.dossier}/livre.org"

 # Remplacer par les chemins vers les fichiers Org-mode
-fichier_personnages = 'personnages.org'
-fichier_livre = 'livre.org'
+fichier_personnages = f"{args.dossier}personnages.org"

-# Expressions régulières pour extraire les noms des personnages et les titres des chapitres
+# Expressions régulières pour extraire les noms des personnages, les alias et les titres des chapitres
 regex_personnage = r"\*\* (.*)"
+regex_alias = r"\s*- alias:\s*(.*?)\s*$"
 regex_chapitre = r'\*\* (.+)'

 # Dictionnaire pour stocker les occurrences de personnages dans chaque chapitre
 occurrences_personnages = {}
+alias_separator=";"

-# Ouvrir le fichier personnages.org et extraire les noms des personnages
-with open(fichier_personnages, 'r', encoding='utf-8') as fichier_personnages:
-    personnages = [re.sub( "\*\* ","",ligne.strip()) for ligne in fichier_personnages if re.match(regex_personnage, ligne)]
+def extract_character_info(character_line):
+    match = re.search(regex_personnage, character_line)
+    if match:
+        character = match.group(1)
+        aliases = []

-print('personnages: ', personnages)
+        # Extraire les alias du caractère
+        match_alias = re.search(regex_alias, character_line)
+        if match_alias:
+            aliases = [alias.strip() for alias in match_alias.group(1).split(alias_separator)]
+
+        return character, aliases
+
+    return None, []
+
+# Ouvrir le fichier personnages.org et extraire les noms des personnages et leurs alias

 def contains_any_of_these_words(line: str, words: list[str]) -> bool:
    for word in words:
        if word in line:
            return True
    return False
+with open(fichier_personnages, 'r', encoding='utf-8') as fichier_personnages:
+    personnages = {}
+    for ligne in fichier_personnages:
+        character, aliases = extract_character_info(ligne)
+        if character:
+            personnages[character] = aliases
+
+print('personnages: ', personnages.keys())

 # Ouvrir le fichier livre.org et le fichier CSV
-with open(fichier_livre, 'r', encoding='utf-8') as livre, open('occurrences_personnages.csv', 'w', newline='', encoding='utf-8') as fichier_csv:
+with open(fichier_livre, 'r', encoding='utf-8') as livre, open(f"{args.dossier}/occurrences_personnages.csv", 'w', newline='', encoding='utf-8') as fichier_csv:
    content = livre.read()
    csv_writer = csv.writer(fichier_csv)

    # Écrire les en-têtes dans le fichier CSV
-    csv_writer.writerow(['Chapitre'] + personnages)
-    occurrences_chapitre = {personnage: 0 for personnage in personnages}
+    csv_writer.writerow(['Chapitre'] + list(personnages.keys()))
+    occurrences_chapitre = {personnage: 0 for personnage in personnages.keys()}
    chapitre = '(chapitre not found)'

    # Parcourir chaque ligne du fichier livre.org
@ -47,17 +77,17 @@ with open(fichier_livre, 'r', encoding='utf-8') as livre, open('occurrences_pers
            chapitre = re.sub( ":title:", "", chapitre)
            print(chapitre)
            # Initialiser le dictionnaire d'occurrences pour chaque chapitre
-            occurrences_chapitre = {personnage: 0 for personnage in personnages}
+            occurrences_chapitre = {personnage: 0 for personnage in personnages.keys()}

-        # Parcourir chaque personnage et rechercher son nom dans la ligne
-        for personnage in personnages:
-
-            if personnage in ligne:
-                occurrences_chapitre[personnage] += 1
-                print(chapitre,' - ',personnage,' : ', ligne)
+        # Parcourir chaque personnage et rechercher son nom ou ses alias dans la ligne
+        for personnage, aliases in personnages.items():
+                if personnage.lower() in ligne.lower() or any(alias.lower() in ligne.lower() for alias in aliases):
+                    occurrences_chapitre[personnage] += 1
+                    print(chapitre,' - ',personnage,' : ', ligne)
        # Ajouter les occurrences du chapitre au dictionnaire global
        occurrences_personnages[chapitre] = occurrences_chapitre

    # Écrire les occurrences des personnages dans le fichier CSV
    for chapitre, occurrences in occurrences_personnages.items():
-        csv_writer.writerow([chapitre] + [occurrences[personnage] for personnage in personnages])
+        csv_writer.writerow([chapitre] + [occurrences[personnage] for personnage in personnages.keys()])
+