gpf_check_vector.core module

Main module logic.

gpf_check_vector.core.filter_compliant_files(upload_dir: Path, authorized_file_extensions: Iterable) list[Path]

Filtre les fichiers vecteurs à vérifier.

La fonction prépare la liste des fichiers à vérifier en filtrant selon les critères passés en paramètres.

Paramètres:
  • upload_dir (Path) – répertoire contenant les données

  • authorized_file_extensions (Iterable) – liste des extensions de fichiers autorisées.

Renvoie:

liste des chemins vers les données vecteurs

Type renvoyé:

list[Path]

gpf_check_vector.core.run(parameters: GpfOrchestratorParameters, upload_dir_paths: dict | None = None, authorized_file_extensions: Iterable = ('csv', 'dbf', 'geojson', 'gpkg', 'shp', 'sql'), number_threads: int = 5, min_files_multithread: int = 10) tuple[Status, dict | None]

Main function to run the module logic.

Paramètres:
  • parameters (GpfOrchestratorParameters) – Paramètres du traitement

  • upload_dir_paths (dict) – Map des (_id, path) où path est le chemin d’accès vers les données de l’upload d’identifiant _id

  • authorized_file_extensions (Iterable, optional) – liste des extensions de fichiers autorisées. Defaults to ( « csv », « dbf », « geojson », « gpkg », « shp », « sql », ).

  • number_threads (int, optional) – nombre de threads à utiliser pour paralléliser l’exécution (nombre de fichiers vérifiés en parallèle). Si inférieur à 2, alors le traitement de chaque fichier est exécuté dans le thread principal : utile pour faciliter le debogage. Defaults to 5.

  • min_files_multithread (int, optional) – nombre minimum de fichiers à vérifier pour que le multithreading soit effectivement activé

Renvoie:

statut de la vérification dict: Extent de la donnée vérifiée

Type renvoyé:

Status