Accueil > > > TROUVER LES DOUBLONS DANS UNE LISTE DE FICHIERS
TROUVER LES DOUBLONS DANS UNE LISTE DE FICHIERS
Information sur la source
Description
Bonjour à tous. Je passe à cette fonction une liste de fichiers et elle me retourne un tableau des doublons trouvés.
Source
- <pre>
- <?php
-
- function compareFiles($files) {
- // On hache le fichier et on utilise cette valeur comme index d'un tableau.
- // Ainsi, les fichiers identiques sont automatiquement regroupés.
- $hash = array();
- foreach ($files as $value) {
- $hash[hash_file("md5", $value)][] = $value;
- }
- $tmp = array();
- //On ne récupère que les doublons.
- foreach ($hash as $value) {
- if (sizeof($value) > 1)
- $tmp[] = $value;
- }
- return $tmp;
- }
-
- //Test :
- $files = array("work/01.avi",
- "work/02.avi",
- "work/02_copie.avi",
- "work/03.avi",
- "work/04.wmv",
- "work/04_copie.txt", //Ca marche aussi si on change l'extension du fichier.
- "work/05.wmv",
- "work/05_copie.wmv");
- print_r(compareFiles($files));
-
- /* Voici le résultat obtenu :
- Array
- (
- [0] => Array
- (
- [0] => work/02.avi
- [1] => work/02_copie.avi
- )
- [1] => Array
- (
- [0] => work/04.wmv
- [1] => work/04_copie.txt
- )
- [2] => Array
- (
- [0] => work/05.wmv
- [1] => work/05_copie.wmv
- )
- )
- */
- ?>
<pre>
<?php
function compareFiles($files) {
// On hache le fichier et on utilise cette valeur comme index d'un tableau.
// Ainsi, les fichiers identiques sont automatiquement regroupés.
$hash = array();
foreach ($files as $value) {
$hash[hash_file("md5", $value)][] = $value;
}
$tmp = array();
//On ne récupère que les doublons.
foreach ($hash as $value) {
if (sizeof($value) > 1)
$tmp[] = $value;
}
return $tmp;
}
//Test :
$files = array("work/01.avi",
"work/02.avi",
"work/02_copie.avi",
"work/03.avi",
"work/04.wmv",
"work/04_copie.txt", //Ca marche aussi si on change l'extension du fichier.
"work/05.wmv",
"work/05_copie.wmv");
print_r(compareFiles($files));
/* Voici le résultat obtenu :
Array
(
[0] => Array
(
[0] => work/02.avi
[1] => work/02_copie.avi
)
[1] => Array
(
[0] => work/04.wmv
[1] => work/04_copie.txt
)
[2] => Array
(
[0] => work/05.wmv
[1] => work/05_copie.wmv
)
)
*/
?>
Conclusion
Voilà. C'est super gourmand en ressources avec de gros fichiers (j'ai testé avec des vidéos), mais ça a l'air de bien marcher. A utiliser avec parcimonie à mon avis, et pas tel quel.
C'est la première fois que je poste une source et comme plein de gens j'apprends sur le tas, du coup je suis preneur pour tout commentaire qui me permettrai de m'améliorer!
Historique
- 29 novembre 2010 10:38:54 :
- Mon titre n'était pas assez précis. Cette fonctions sert à trouver les doublons au sein d'une liste de fichiers.
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Supprimer les doublons [ par Nerdz ]
Bonjour,J'insère plusieurs valeur dans un tableau ( array(); ) et j'aimerais savoir comment supprimer les valeurs qui sont en double !Ya-t-il une fonc
taux de doublons [ par semouna ]
bonsoir j'aimerai calculer le taux de doublons d'une table en passant par une requète sous accessmerci
doublons [ par rafou77 ]
bonjour,j'ai une table clients (numcli, nomcli)par ex: 123 toto 456 tata 123 toto saje ne sais pas comment supprimer les doublons su
Lister une bdd sans les doublons [ par NewSky ]
Bonjour,Je suis à la recherche d'une façon pour lister une colonne d'une bdd MySQL sans les doublons.Je m'explique:j'ai une base avec 2 colo
doublons [ par krovomite ]
Bonjour, je voulais savoir si il n'exitste pas une fonction permettant pour chaque ligne d'un tableau mysql, il serait possible de retourner un bool&#
Afficher seulement les doublons [ par crislemon ]
Bonjour a tous !Contairement à la fonction DISTINCT j'aimerai afficher seulement les doublons de ma table et non les supprimer .Comment faut il f
Enlever doublons sous mysql [ par rich25200 ]
bonjour, J'aimerai enlever des doublons dans ma BDD comment faire ? merci
Doublons [ par ldevun ]
Bonjour,Je suis entrain de créé un catalogue et je voudrais savoir si à un produit on peut affectuer plusieurs catégories, plusieurs sous catégorie? C
Eviter les doublons à l'insertion [ par spyro666 ]
Bonjour tout le monde,j'ai un petit problème avec MySQL... J'ai en effet une table que j'ai créé pour qu'il n'y ait pas deux fois la même valeur pour
Sql doublons [ par EFFACEUR ]
Bonjour,ma table est membres,Je voudrais afficher tout les doublons de meme nom? Comment faire, c est pour supprimer plusieurs compte inutile, merci
|
Derniers Blogs
IMAGINE CUP 2012, MAKE A SIGN EN FINALEIMAGINE CUP 2012, MAKE A SIGN EN FINALE par junarnoalg
Voilà qui est fait, la nouvelle est officielle ! L'équipe belge "Make a Sign" va au pays des kangourous défendre son projet dans la catégorie Software Design. http://www.imaginecup.com/CompetitionsContent/Competition/WorldwideFinalists.aspx V...
Cliquez pour lire la suite de l'article par junarnoalg KINECT 1.5 IS OUT !KINECT 1.5 IS OUT ! par Vko
La version 1.5 du Kinect For Microsoft vient tout juste de sortir ! Plein de nouveautés: Tracking de squelette en Near Mode Détection en position assise Détection faciale avec un SDK dédié Documentation et des guideline (enfin) Un out...
Cliquez pour lire la suite de l'article par Vko LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) par richardc
Mise à jour des Web API du 14 Mai
Réservez dès maintenant votre journée du 20 juin pour le Windows Azure Dev Camp 2012 à Paris
Mise à jour de Team Foundation Service
MechCommander 2 sur Windows 8
Entity Framework 5 Release Candidate e...
Cliquez pour lire la suite de l'article par richardc REACTIVE EXTENSIONS : CONSOMMER DES SERVICES AVEC RX PARTIE 3, LES PIèGES à éVITERREACTIVE EXTENSIONS : CONSOMMER DES SERVICES AVEC RX PARTIE 3, LES PIèGES à éVITER par Groc
Une mauvaise utilisation de rx lors de l'écriture d'une couche d'accès à des services peut conduire à des cas embarassants avec des erreurs mal gérées, des appels qui ne partent lorsqu'ils le devraient, et même des résultats incorrects . le tout nuis...
Cliquez pour lire la suite de l'article par Groc SHAREPOINT BLOG SITE, PROBLèME D'ARCHIVESSHAREPOINT BLOG SITE, PROBLèME D'ARCHIVES par junarnoalg
Dernièrement, nous avons migré le site
myTIC
vers un nouveau serveur SharePoint 2010. Dans les contenus que nous vouloins récupérer, nous avions un certain nombre de blogs.
Nous avons utilisé les commandes Power...
Cliquez pour lire la suite de l'article par junarnoalg
Logiciels
sDEVIS-FACTURES vlPRO (8.1.0.3)SDEVIS-FACTURES VLPRO (8.1.0.3)sDEVIS-FACTURES vlPRO a été mis au point pour les particuliers, créateurs, entrepreneurs, artisa... Cliquez pour télécharger sDEVIS-FACTURES vlPRO 974 Application Server (12.2.4.6)974 APPLICATION SERVER (12.2.4.6)Développez de puissantes applications dans un environnement de 'cloud computing', clusterisé, séc... Cliquez pour télécharger 974 Application Server vPicture (1.4.2.1)VPICTURE (1.4.2.1)Avec vPicture, hébergez vos images facilement et rapidement.
vPicture est un utilitaire simple, ... Cliquez pour télécharger vPicture Easy-Planning (2.2.1.6)EASY-PLANNING (2.2.1.6)Easy-Planning permet de créer des plannings sous la représentation de diagrammes et est adapté au... Cliquez pour télécharger Easy-Planning COM-BACKUP (2.0)COM-BACKUP (2.0)
COM-BACKUP est un logiciel de sauvegarde qui permet de planifier les sauvegardes de vos dossiers ...
Cliquez pour télécharger COM-BACKUP
|