PHP – очистка от не-UTF cимволов

January 27, 2009 by Andrew Tch · 2 Comments 

Собственно сабж.
Гуглинг на php strip non-utf symbols привел к чему-то типа

  $data = iconv('UTF-8', 'UTF-8', $data);

после чего simplexml вывалился нахрен ругаясь на побитые теги. Решением оказалось

  $data = mb_convert_encoding($data, 'UTF-8', 'UTF-8');

причем при помощи mb_substitute_character можно указать символ, на который будут заменяться битые не-utf символы.