Gérer les caractères spéciaux de traitement de texte comme Word
9/03/09
On à tous déjà été confronté à ce genre de problème. Pas plus tard qu’hier, j’ai du parser un flux RSS UTF8 qui contenait des caractères spéciaux provenant de Word. Le pire, étant que je devais le re-afficher sur un site en ISO (no comment plz). Dans ce cas là, voici le genre de comportement que l’on peut adopter :
$wR = array( '‚' => '‚', 'ƒ' => 'ƒ', '„' => '„', '…' => '…', '†' => '†', '‡' => '‡', 'ˆ' => 'ˆ', '‰' => '‰', 'Š' => 'Š', '‹' => '‹', 'Œ' => 'Œ', '‘' => '‘', '’' => '’', '“' => '“', '”' => '”', '•' => '•', '–' => '–', '—' => '—', '˜' => '˜', '™' => '™', 'š' => 'š', '›' => '›', 'œ' => 'œ', 'Ÿ' => 'Ÿ', '€' => '€' ); $text = str_replace(array_keys($wR),array_values($wR),$text);
PS : merci word
Article(s) sur le même sujet :


