Voici la documentation : https://geoplateforme.pages.gpf-tech.ign.fr/documentation

Skip to content

feat(check_unicity): IGNGPF-466 Check filename unicity in an archive

Quy Thy Truong a demandé de fusionner feat/get-duplicate-files-in-archive vers main

Cette MR permet de vérifier l'unicité des noms des fichiers présents dans une archive.

Pour cela, j'ai fait deux fonctions :

  • Une fonction qui met à plat tous les fichiers dans l'arborescence d'une archive et les charge dans une liste python
  • Une fonction qui récupère les éléments qui ont plusieurs occurrence dans la liste générée et qui ne sont pas des fichier md5

Ces fonctions sont appelées dans le run(), et la cli est fonctionnelle. Pour tester :

  • Avec une archive contenant des doublons (c'est ce qu'il y a de plus intéressant parce que ça affiche les noms de fichiers dupliqués et le nombre d'occurrence) :
gpf-check-archive -w tests/fixtures/livraisons/error/ -u doublon -a doublon.zip -v
  • Avec une archive correcte :
gpf-check-archive -w tests/fixtures/livraisons/good/default/ -u upload -a upload.zip -v

Je me suis efforcée de conserver une arborescence qui ne lève pas d'erreur par rapport au cadre imposé actuellement par la toolbelt... Mais à vrai dire je ne sais pas si cette arborescence s'applique aussi à une donnée d'archive.

Modification effectuée par Quy Thy Truong

Rapports de requête de fusion

Chargement en cours