| View previous topic :: View next topic |
| Author |
Message |
pandim
Joined: 31 Oct 2010 Posts: 5
|
Posted: Sun Oct 31, 2010 9:29 am Post subject: Перевести HTML в читаемый вид |
|
|
Уважаемые гуру! Помогите!
Как я понимаю, Akelpad это может.
Есть HTML файл со следующим фрагментом:
| Code: | <title>
Проверка
</title>
Ïðîâåðêà òåãà <head> |
Ой последняя строка вставилась не кодами
Вобщем там цепочки: амперсанд-решетка-цифра-цифра-цифра.
Помогите вернуть читаемость.
Заранее спасибо! |
|
| Back to top |
|
 |
Deim0s
Joined: 12 Feb 2010 Posts: 137
|
Posted: Sun Oct 31, 2010 10:15 am Post subject: |
|
|
pandim,
| Quote: | | Помогите вернуть читаемость. |
| Code: | <title>
Проверка
</title>
Проверка тега <head> |
Подобное этому выделить и перекодировать (Alt+R) из 1252 в 1251.
Сохранить документ как HTML в UTF-8 без BOM, а дальше:
Или сюда (вручную искать по 041F, 0440 и т.д.)
Или пройтись tidy, как-то так:
tidy.exe --input-encoding utf8 --output-encoding utf8 -config CFG.ini < test1.html > test2.html
Ваш файл-оригинал назвать test1.html, на выходе получите test2.html
CFG.ini
| Code: | indent-spaces:2
indent:auto
markup:yes
numeric-entities:yes
output-html:yes
quiet:yes
tab-size:8
tidy-mark:no
wrap-asp:yes
wrap-attributes:yes
wrap-jste:yes
wrap-php:yes
wrap:0 |
|
|
| Back to top |
|
 |
FeyFre
Joined: 07 Aug 2007 Posts: 1893 Location: Vinnitsa, Ukraine
|
Posted: Sun Oct 31, 2010 10:34 am Post subject: |
|
|
Deim0s, человек просил в AkelPad-е а не вручную или в Tidy
pandim, запускаете скрипт SearchReplace.js
В поле поиска ставим &#(x[\da-f]*);
В поле замены String.fromCharCode("0"+$1)
Снимаем галку чувствительности к регистру(первая), ставим галку Заменить функцией (последняя).
Заменить всё. |
|
| Back to top |
|
 |
Deim0s
Joined: 12 Feb 2010 Posts: 137
|
Posted: Sun Oct 31, 2010 11:01 am Post subject: |
|
|
FeyFre,
Ну, я ответил на:
| Quote: | | вернуть читаемость |
Если разные варианты, к примеру:
так
| Code: | <html>
<head>
<title>Проверка</title>
<meta http-equiv="content-language" content="ru">
<meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>
<body>
"Проверка тега;"
</body>
</html> |
Tidy по любому надёжнее , а так на каждый "чих" придётся регэксп составлять. |
|
| Back to top |
|
 |
pandim
Joined: 31 Oct 2010 Posts: 5
|
Posted: Sun Oct 31, 2010 11:01 am Post subject: Пытаюсь, но синтаксическая ошибка :( |
|
|
И пишет "Синтаксическая ошибка"  |
|
| Back to top |
|
 |
pandim
Joined: 31 Oct 2010 Posts: 5
|
Posted: Sun Oct 31, 2010 11:04 am Post subject: |
|
|
Tidy -всё поправил, но в дополнение подредактировал текст страницы и перестал работать скрипт, так что там ещё думать надо
Но за Tidy - спасибо большое - надо будет почитать мануал. |
|
| Back to top |
|
 |
Deim0s
Joined: 12 Feb 2010 Posts: 137
|
Posted: Sun Oct 31, 2010 11:12 am Post subject: |
|
|
pandim
| Quote: | | Tidy -всё поправил, но в дополнение подредактировал текст страницы и перестал работать скрипт. |
Да, за Tidy приглядывать нужно, поэтому оригинал документа лучше всегда сохранять. |
|
| Back to top |
|
 |
pandim
Joined: 31 Oct 2010 Posts: 5
|
Posted: Sun Oct 31, 2010 11:16 am Post subject: |
|
|
Ребят - простите дурака:
>> запускаете скрипт SearchReplace.js
это просто комманда "Правка-Заменить" или как-то по другому?
ЗЫ: Уже понял, что по другому  |
|
| Back to top |
|
 |
FeyFre
Joined: 07 Aug 2007 Posts: 1893 Location: Vinnitsa, Ukraine
|
Posted: Sun Oct 31, 2010 11:35 am Post subject: |
|
|
pandim
Alt+P выбираем Функцию Scripts::Main нажимаем кнопку "Выполнить"
В открывшемся окне находим скрипт и нажимаем Выполнить.
(Можно назначить горячие клавиши) |
|
| Back to top |
|
 |
pandim
Joined: 31 Oct 2010 Posts: 5
|
Posted: Sun Oct 31, 2010 11:47 am Post subject: |
|
|
Спасибо, разобрался! Всё получилось!
> В поле поиска ставим &#(x[\da-f]*);
> В поле замены String.fromCharCode("0"+$1)
> Снимаем галку чувствительности к регистру(первая), ставим галку Заменить функцией (последняя).
А где про это почитать? |
|
| Back to top |
|
 |
FeyFre
Joined: 07 Aug 2007 Posts: 1893 Location: Vinnitsa, Ukraine
|
Posted: Sun Oct 31, 2010 1:53 pm Post subject: |
|
|
| pandim, нигде. Про это нужно интуитивно понять. Хотя можете поиск по форуму по ключевому слову SearchReplace сделать, авось что-то и поймете. |
|
| Back to top |
|
 |
|