Я поразил эту проблему прежде, используя анализатор САКСОФОНА. Читая файл с Явой InputStream
необходимо определить кодирование потока в коде - возможно, читая первую линию файла, поскольку вы показали. Вот код для назначения кодирования;
SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
final SAXParser saxParser = saxParserFactory.newSAXParser();
// Note the encoding on the reader...
final Reader reader = new InputStreamReader(, "UTF-8");
final InputSource inputSource = new InputSource(reader);
inputSource.setEncoding("UTF-8");
saxParser.parse(inputSource, );
Надежда, которая помогает. Если не - отправляют назад с тем, как вы читаете XML-файл.