gpf_check_vector.core module¶
Main module logic.
- gpf_check_vector.core.filter_compliant_files(upload_dir: Path, authorized_file_extensions: Iterable) list[Path] ¶
Filtre les fichiers vecteurs à vérifier.
La fonction prépare la liste des fichiers à vérifier en filtrant selon les critères passés en paramètres.
- Paramètres:
upload_dir (Path) – répertoire contenant les données
authorized_file_extensions (Iterable) – liste des extensions de fichiers autorisées.
- Renvoie:
liste des chemins vers les données vecteurs
- Type renvoyé:
list[Path]
- gpf_check_vector.core.run(parameters: GpfOrchestratorParameters, upload_dir_paths: dict | None = None, authorized_file_extensions: Iterable = ('csv', 'dbf', 'geojson', 'gpkg', 'shp', 'sql'), number_threads: int = 5, min_files_multithread: int = 10) tuple[Status, dict | None] ¶
Main function to run the module logic.
- Paramètres:
parameters (GpfOrchestratorParameters) – Paramètres du traitement
upload_dir_paths (dict) – Map des (_id, path) où path est le chemin d’accès vers les données de l’upload d’identifiant _id
authorized_file_extensions (Iterable, optional) – liste des extensions de fichiers autorisées. Defaults to ( « csv », « dbf », « geojson », « gpkg », « shp », « sql », ).
number_threads (int, optional) – nombre de threads à utiliser pour paralléliser l’exécution (nombre de fichiers vérifiés en parallèle). Si inférieur à 2, alors le traitement de chaque fichier est exécuté dans le thread principal : utile pour faciliter le debogage. Defaults to 5.
min_files_multithread (int, optional) – nombre minimum de fichiers à vérifier pour que le multithreading soit effectivement activé
- Renvoie:
statut de la vérification dict: Extent de la donnée vérifiée
- Type renvoyé:
Status