Accueil > > > CONVERTIR UNE CHAINE UTF8 CONTENANT DES CARACTÈRES FRANÇAIS EN ISO-8859-1
CONVERTIR UNE CHAINE UTF8 CONTENANT DES CARACTÈRES FRANÇAIS EN ISO-8859-1
Information sur la source
Description
mon besoin de developper ce code c'est comment convertir un string UTF-8 contenant des caractère français exemple(communauté) en iso-8859-1 exemple (communauté)
Source
- $str = "communauté et espérons";
- $str_result = convertUTF8_to_8859($str);
- echo $str_result; // affiche : communauté et espérons
- function convertUTF8_to_8859($str){
- // fonction qui test si la chaine est encodé en UTF8
- if(is_utf8($str) == 1){
- // fonction qui test si la chaine encodé en UTF8 contient des caractère français: Cette fonction ne traite que des chaines en UTF8
- if(content8859_in_UTF8($str)=="TRUE"){
- // On convertit la chaine de UTF8 en ISO8859-1
- $str = utf8_decode($str);
- // retourner la chaine converti
- return($str);
- }else{ // cas ou la chaine en UTF-8 mais ne contient pas des accents français (é,é,à,ù,û......) : exemple les caractères chinois encodé en UTF8
- // retourner la chaine non convertit
- return($str);
- }
- }else{ // cas ou la chaine n'est pas encodé en UTF8
- return($str);
- }
- }
- // Returns true if $string is valid UTF-8 and false otherwise.
- function is_utf8($string) {
-
- // From http://w3.org/International/questions/qa-forms-utf-8.html
- return preg_match('%^(?:
- [\x09\x0A\x0D\x20-\x7E] # ASCII
- | [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte
- | \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs
- | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte
- | \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates
- | \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3
- | [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15
- | \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16
- )*$%xs', $string);
- } // function is_utf8
-
-
- // fonction qui cherche s'il ya des caractres accentus franais dans une chaine en UTF8
- function content8859_in_UTF8($str){
-
- if ( strlen($str) == 0 ) { return; }
- // cette fonction ne retourne de valeur si la chaine est en UTF8
- // cette fonction retourne un tableau contenant les chaines accentuées
- preg_match_all('/.{1}|[^\x00]{1,1}$/us', $str, $ar);
- $chars = $ar[0];
- $str_fr = 0;
- foreach ( $chars as $i => $c ){
- $ud = 0;
- // Calcul les codes ASCII des chaines en UTF8
- if (ord($c{0})>=0 && ord($c{0})<=127) { continue; } // ASCII - next please
- if (ord($c{0})>=192 && ord($c{0})<=223) { $ord = (ord($c{0})-192)*64 + (ord($c{1})-128); }
- if (ord($c{0})>=224 && ord($c{0})<=239) { $ord = (ord($c{0})-224)*4096 + (ord($c{1})-128)*64 + (ord($c{2})-128); }
- if (ord($c{0})>=240 && ord($c{0})<=247) { $ord = (ord($c{0})-240)*262144 + (ord($c{1})-128)*4096 + (ord($c{2})-128)*64 + (ord($c{3})-128); }
- if (ord($c{0})>=248 && ord($c{0})<=251) { $ord = (ord($c{0})-248)*16777216 + (ord($c{1})-128)*262144 + (ord($c{2})-128)*4096 + (ord($c{3})-128)*64 + (ord($c{4})-128); }
- if (ord($c{0})>=252 && ord($c{0})<=253) { $ord = (ord($c{0})-252)*1073741824 + (ord($c{1})-128)*16777216 + (ord($c{2})-128)*262144 + (ord($c{3})-128)*4096 + (ord($c{4})-128)*64 + (ord($c{5})-128); }
- if (ord($c{0})>=254 && ord($c{0})<=255) { $chars{$i} = $unknown; continue; } //error
- //Test si les caractères contient les accents (à, é,è,ù,ç,ê,â,û,........)
- if(($ord == 224) || ($ord == 226) || ($ord == 235) || ($ord == 249) || ($ord == 250) ||
- ($ord == 252) || ($ord == 251) || ($ord == 233) || ($ord == 234) || ($ord == 232) ||
- ($ord == 231) || ($ord == 228) || ($ord == 256) || ($ord == 128) || ($ord == 156) ||
- ($ord == 230) || ($ord == 231) || ($ord == 244) || ($ord == 225) || ($ord == 236) ||
- ($ord == 227) || ($ord == 237) || ($ord == 238) || ($ord == 249) || ($ord == 239) ||
- ($ord == 257)){
- $str_fr =1;
- }
- }
- if($str_fr == 1){
- return "TRUE";
- }else{
- return "FALSE";
- }
- }
$str = "communauté et espérons";
$str_result = convertUTF8_to_8859($str);
echo $str_result; // affiche : communauté et espérons
function convertUTF8_to_8859($str){
// fonction qui test si la chaine est encodé en UTF8
if(is_utf8($str) == 1){
// fonction qui test si la chaine encodé en UTF8 contient des caractère français: Cette fonction ne traite que des chaines en UTF8
if(content8859_in_UTF8($str)=="TRUE"){
// On convertit la chaine de UTF8 en ISO8859-1
$str = utf8_decode($str);
// retourner la chaine converti
return($str);
}else{ // cas ou la chaine en UTF-8 mais ne contient pas des accents français (é,é,à,ù,û......) : exemple les caractères chinois encodé en UTF8
// retourner la chaine non convertit
return($str);
}
}else{ // cas ou la chaine n'est pas encodé en UTF8
return($str);
}
}
// Returns true if $string is valid UTF-8 and false otherwise.
function is_utf8($string) {
// From http://w3.org/International/questions/qa-forms-utf-8.html
return preg_match('%^(?:
[\x09\x0A\x0D\x20-\x7E] # ASCII
| [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte
| \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs
| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte
| \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates
| \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3
| [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15
| \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16
)*$%xs', $string);
} // function is_utf8
// fonction qui cherche s'il ya des caractres accentus franais dans une chaine en UTF8
function content8859_in_UTF8($str){
if ( strlen($str) == 0 ) { return; }
// cette fonction ne retourne de valeur si la chaine est en UTF8
// cette fonction retourne un tableau contenant les chaines accentuées
preg_match_all('/.{1}|[^\x00]{1,1}$/us', $str, $ar);
$chars = $ar[0];
$str_fr = 0;
foreach ( $chars as $i => $c ){
$ud = 0;
// Calcul les codes ASCII des chaines en UTF8
if (ord($c{0})>=0 && ord($c{0})<=127) { continue; } // ASCII - next please
if (ord($c{0})>=192 && ord($c{0})<=223) { $ord = (ord($c{0})-192)*64 + (ord($c{1})-128); }
if (ord($c{0})>=224 && ord($c{0})<=239) { $ord = (ord($c{0})-224)*4096 + (ord($c{1})-128)*64 + (ord($c{2})-128); }
if (ord($c{0})>=240 && ord($c{0})<=247) { $ord = (ord($c{0})-240)*262144 + (ord($c{1})-128)*4096 + (ord($c{2})-128)*64 + (ord($c{3})-128); }
if (ord($c{0})>=248 && ord($c{0})<=251) { $ord = (ord($c{0})-248)*16777216 + (ord($c{1})-128)*262144 + (ord($c{2})-128)*4096 + (ord($c{3})-128)*64 + (ord($c{4})-128); }
if (ord($c{0})>=252 && ord($c{0})<=253) { $ord = (ord($c{0})-252)*1073741824 + (ord($c{1})-128)*16777216 + (ord($c{2})-128)*262144 + (ord($c{3})-128)*4096 + (ord($c{4})-128)*64 + (ord($c{5})-128); }
if (ord($c{0})>=254 && ord($c{0})<=255) { $chars{$i} = $unknown; continue; } //error
//Test si les caractères contient les accents (à, é,è,ù,ç,ê,â,û,........)
if(($ord == 224) || ($ord == 226) || ($ord == 235) || ($ord == 249) || ($ord == 250) ||
($ord == 252) || ($ord == 251) || ($ord == 233) || ($ord == 234) || ($ord == 232) ||
($ord == 231) || ($ord == 228) || ($ord == 256) || ($ord == 128) || ($ord == 156) ||
($ord == 230) || ($ord == 231) || ($ord == 244) || ($ord == 225) || ($ord == 236) ||
($ord == 227) || ($ord == 237) || ($ord == 238) || ($ord == 249) || ($ord == 239) ||
($ord == 257)){
$str_fr =1;
}
}
if($str_fr == 1){
return "TRUE";
}else{
return "FALSE";
}
}
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
$GLOBALS + utf8_decode() [ par mattdelavega ]
BonjourJ'ai mon flash qui envoi par $POST des variables à mon php...petit problème ... le format c'est du utf8 !Donc mes lettres accentu
Problème d'accents dans l'url [ par d_alma ]
Bonjour, Je suis en train de programmer une 'photothèque'. Les photos sont sur un serveur FTP. Les répertoires ont souvent un nom comportan
HELP PLEASE [ par matheo2005 ]
Bonjour j'ai crée un formulaire sous flash (grace a un code source trouvé sur flashkod) j'ai change toute les variables avec le nom de mes v
utf8_encode(); [ par WhiteDwarf ]
Bonsoir, j'ai une petite question, je travaille actuellement sur un site multilangue, et je cherche à ce que le russe soit accepté par le ph
MySQL et Multilingue [ par WhiteDwarf ]
Salut, je reviens avec mes problèmes de gestion multilangue Alors voila le problème est simple, je récupère nom, prénom, mot de passe... dans un formu
Problème insertion caractère coréen dans requête SQL [ par oupsoupsoups ]
Bonjour,je dois réaliser un formulaire php en coréen cependant je n'arrive pas à insérer de caractères corréen correctement dans ma table sql. J'arriv
Reception formulaire caractères chinois [ par stesch ]
Bonjour,J'utilise un formulaire flash et envoie le contenu des champs via une page php.En francais, tout va bien.Lorsque l'on tape du Chinois, les car
Encodage ou pas [ par codefalse ]
Bonjour à tous :)J'ai codé un ptit site rapide avec bdd. J'ai indique aux headers que l'encodage serait en utf-8, mes fichiers étaient encodés en utf8
probleme avec move_uploaded_file et UTF8 [ par DJTIME ]
Voici un bout de code pris du net que j'ai utilisé pour l'upload de fichier sur mon site (qui n'est pas encore en ligne vu qu'il marche po!)Bref!! ca
utf16 vers UTF8 [ par studenttours ]
bonjour,je travaille actuellement sur une base de donnée mysql configurée au départ en codage UTF16, je voudrais la convertir en UTF8: j'ai exporté la
|
Derniers Blogs
UNE JOLIE-HORLOGE ET PAS QU'UN PEU !UNE JOLIE-HORLOGE ET PAS QU'UN PEU ! par neodante
Pour les possesseurs d'iPhone, ça y est Bijin Tokei - qui se traduit littéralement en Français par " Jolie Horloge " - est arrivé et GRATUITEMENT s'il vous plaît ! Après la version Tokyo, Hokkaido, night club, racing, Gal, "pour les mademoiselles'", . voi...
Cliquez pour lire la suite de l'article par neodante TECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICESTECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICES par ROMELARD Fabrice
Animé par: Gaetan Bouveret et Julien Chomarat Business Connectivity Services (BCS) est dans SharePoint 2010 la version 2 de Business Data Catalog (BDC dans SharePoint 2007). Il s'agit de la solution permettant de visualiser des données provenan...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice [DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE[DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE par orion
Comme de nombreux geek, je suis un grand amateur de série TV et je rate régulièrement des épisodes de mes séries préférés. Une solution s'offre à vous avec ce merveilleux site : Tv Gorge - www.tvgorge.com Moteur de recherche à l'appui, vous pouvez ...
Cliquez pour lire la suite de l'article par orion TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010 par ROMELARD Fabrice
Animé par: Vincent Bellet et Baptiste Giraudier La BI dans SharePoint 2010, Les nouveaux services d'application dans SP2010 et SQL Server Reporting services 2008 R2. La BI dans SharePoint est généralisée pour tous afin de permettre à tous les coll...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Forum
HTML VERS PDFHTML VERS PDF par spike911
Cliquez pour lire la suite par spike911
Logiciels
DB-MAIN (9.1.0)DB-MAIN (9.1.0)DB-MAIN is a data-modeling and data-architecture tool. It is designed to help developers and anal... Cliquez pour télécharger DB-MAIN Xilisoft DPG Convertisseur (5.1.37.0120)XILISOFT DPG CONVERTISSEUR (5.1.37.0120)Xilisoft DPG Convertisseur offre aux fans de Nintendo DS une bonne solution leur permettant de dé... Cliquez pour télécharger Xilisoft DPG Convertisseur GraphicsGale (2.01.01)GRAPHICSGALE (2.01.01)GraphicsGale est un logiciel de PixelArt avec de nombreuse fonctionnalités permettant de réalisé ... Cliquez pour télécharger GraphicsGale Architecte 3D (Platinum 2010)ARCHITECTE 3D (PLATINUM 2010)Architecte 3D Platinium vous permet de concevoir facilement les plans votre future maison, de l'é... Cliquez pour télécharger Architecte 3D TeamViewer 5 (TeamViewer 5)TEAMVIEWER 5 (TEAMVIEWER 5)Dépanner un ami,expliquer une manipulation devient un jeu d'enfant.
Prise en main d'un autre ord... Cliquez pour télécharger TeamViewer 5
|