try finding article name from content

This commit is contained in:
Tykayn 2024-11-11 00:02:50 +01:00 committed by tykayn
parent 9cd8d6d92e
commit 7e9e8f2436
31 changed files with 124 additions and 426 deletions

View file

@ -117,7 +117,7 @@ def get_files_list_of_folder(folder_path):
if not os.path.exists(folder_path):
print(f" ------------ build_indexes: Erreur : Le dossier '{dossier_md}' n'existe pas.")
return
print('source ',folder_path)
print('----------- get_files_list_of_folder: folder_path : ',folder_path)
# Liste les fichiers articles, trie par nom décroissant
try:
fichiers_md = sorted([f.replace('.'+source_files_extension, '.gmi') for f in os.listdir(folder_path) if f.endswith(source_files_extension)], reverse=True)
@ -196,25 +196,35 @@ def generer_index(dossier_source, fichier_index, titre_index):
# ne préciser la langue français que si on a des articles en Anglais
if len(files_en):
contenu_index_gmi += "\n# Articles en Français\n-------------------------\n"
contenu_index_html += "<h1>Articles en Français</h1>"
# contenu_index_html += "<h1>Articles en Français</h1>"
lang_folder="lang_fr/"
# ----------- indexer les articles en Français ------------------
for fichier in files_fr:
date_string, année, slug = find_year_and_slug(fichier)
new_folder=f"{année}/{slug}"
new_folder_path_this_article = os.path.join(dossier_parent, 'html-websites/'+args.source+'/'+new_folder+'/')
contenu_index_gmi += f"=> {fichier}\n"
link_html = fichier.replace('..gmi','.html')
chemin_fichier_this_article = chemin_dossier_source+'/lang_fr/converted/'+link_html
# contenu_index_html += f"<br><a href=/{lang_folder}/{link_html}>{link_html}</a>"
contenu_index_html += f"<br><a href=/{année}/{slug}>{année} {slug.replace('-', ' ')}</a>"
link_html = fichier.replace('.gmi','.html')
chemin_fichier_this_article = chemin_dossier_source+'/lang_fr/converted/'+link_html
article_name=trouver_nom_article(chemin_fichier_this_article)
if not article_name:
article_name=slug.replace('-', ' ')
# contenu_index_html += f"<br><a href=/{lang_folder}/{link_html}>{link_html}</a>"
contenu_index_html += f"<br><a href=/{année}/{slug}>{année} {article_name}</a>"
os.makedirs(os.path.dirname(new_folder_path_this_article), exist_ok=True)
# déplacer le fichier html dans le dossier slug, et le renommer en index.html ensuite pour ne pas modifier l'index du blog
shutil.copy(chemin_fichier_this_article, new_folder_path_this_article+'index.html')
# ---------------- pareil en anglais TODO
# contenu_index_gmi += "\n# Articles in English\n-------------------------\n"
# contenu_index_html += "<h1>Articles in English</h1>"