воскресенье, 18 марта 2012 г.

Тестирование регулярных выражений

http://gskinner.com/RegExr/ - Конструктор регулярных выражений на Flash. Есть подсказки/примеры от коммьюнити.

http://www.cuneytyilmaz.com/prog/jrx/ - Еще один на javascript.


Note: Тестер регулярных выражений на java с исходниками здесь
http://www.cis.upenn.edu/~matuszek/General/RegexTester/regex-tester.html

вторник, 6 марта 2012 г.

Определение кодировки текстового файла

В начале текстового файла используется сигнатура BOM, которая определяет порядок следования байтов в текстовом файле.
00 00 FE FF (UTF-32, big-endian ),
FF FE 00 00 (UTF-32, little-endian),
FE FF (UTF-16, big-endian),
FF FE (UTF-16, little-endian ) and
EF BB BF (UTF-8).

BOM может также и отсутствовать.

Если не читается русский текст, то можно воспользоваться онлайн-сервисом
http://2cyr.com/decode/

Или утилита перекодировки Shtirlitz 4.01. Скачать. Для того, чтобы в программе не было баннеров Adaware, можно дописать в командной строке с параметр «-banoff».