- RU.PERL ----------------------------------------------------------- RU.PERL -
Msg : #5564 [620]
От : Sergey Zotov 2:5057/56 26 января 05, 23:37
Кому : Anton Potekhin 12 февраля 05, 20:58
Тема : кодировка
-------------------------------------------------------------------------------
Прошёл день, а ты всё жив! Anton!
On 24 Jan 05, Anton Potekhin wrote to All:
AP> Возникла такая проблема... у меня есть куча документов в разно
AP> кодировке, а точнее DOS и windows-1251. Мне нужно чтобы скрипт заходил в
AP> них и брал определенную информацию из них. Hо такая проблема я не могу
AP> определить какая кодировка у файла. Возможно ли ее определить с помощью
AP> перла ? и если да то как ?
Первое что приходи в голову - посчитать символы. Кириллица в cp866 и в cp1251
лежит в разных диапазоных. ;) Hо для этого нужно хоть раз посмотреть на кодовые
таблицы. Мало кто об этом знает из молодняка. ;)
=== Hачало Windows Clipboard ===
my @en;
foreach (split(//,$bb)) { $en[int(ord($_)/16)]++ }
if ($en[8]+$en[9]+$en[10]+$en[14] > $en[12]+$en[13]+$en[14]+$en[15])
{ cp866 } else { cp1251 }
=== Конец Windows Clipboard ===
Естественно, что можно и еще соптимизировать, но что тогда тебе останется? =)
ZXNet: 500:8462/1 ~/ <~ http://zxnet.da.ru/
Fido: 2:5057/56 /_ _> http://webnames.ru/
--- GoldED+/W32 1.1.4.7
* Origin: ZS-Hub of ZXNet (2:5057/56)