Gérer les caractères spéciaux de traitement de texte comme Word

Posté le 09-03-2009

On à tous déjà été confronté à ce genre de problème. Pas plus tard qu’hier, j’ai du parser un flux RSS UTF8 qui contenait des caractères spéciaux provenant de Word. Le pire, étant que je devais le re-afficher sur un site en ISO (no comment plz). Dans ce cas là, voici le genre de comportement que l’on peut adopter :

$wR = array(
'‚' => '‚',
'ƒ' => 'ƒ',
'„' => '„',
'…' => '…',
'†' => '†',
'‡' => '‡',
'ˆ' => 'ˆ',
'‰' => '‰',
'Š' => 'Š',
'‹' => '‹',
'Œ' => 'Œ',
'‘' => '‘',
'’' => '’',
'“' => '“',
'”' => '”',
'•' => '•',
'–' => '–',
'—' => '—',
'˜' => '˜',
'™' => '™',
'š' => 'š',
'›' => '›',
'œ' => 'œ',
'Ÿ' => 'Ÿ',
'€' => '€'
);
$text = str_replace(array_keys($wR),array_values($wR),$text);

PS : merci word :-)

comments powered by Disqus