Cette MR permet de vérifier l'unicité des noms des fichiers présents dans une archive.
Pour cela, j'ai fait deux fonctions :
- Une fonction qui met à plat tous les fichiers dans l'arborescence d'une archive et les charge dans une liste python
- Une fonction qui récupère les éléments qui ont plusieurs occurrence dans la liste générée et qui ne sont pas des fichier md5
Ces fonctions sont appelées dans le run()
, et la cli est fonctionnelle. Pour tester :
- Avec une archive contenant des doublons (c'est ce qu'il y a de plus intéressant parce que ça affiche les noms de fichiers dupliqués et le nombre d'occurrence) :
gpf-check-archive -w tests/fixtures/livraisons/error/ -u doublon -a doublon.zip -v
- Avec une archive correcte :
gpf-check-archive -w tests/fixtures/livraisons/good/default/ -u upload -a upload.zip -v
Je me suis efforcée de conserver une arborescence qui ne lève pas d'erreur par rapport au cadre imposé actuellement par la toolbelt... Mais à vrai dire je ne sais pas si cette arborescence s'applique aussi à une donnée d'archive.