Page 1 of 1

Перевести HTML в читаемый вид

Posted: Sun Oct 31, 2010 9:29 am
by pandim
Уважаемые гуру! Помогите!
Как я понимаю, Akelpad это может.

Есть HTML файл со следующим фрагментом:

Code: Select all

<title>
Проверка
</title>

Ïðîâåðêà òåãà <head>
Ой :( последняя строка вставилась не кодами :(
Вобщем там цепочки: амперсанд-решетка-цифра-цифра-цифра.

Помогите вернуть читаемость.
Заранее спасибо!

Posted: Sun Oct 31, 2010 10:15 am
by Deim0s
pandim,
Помогите вернуть читаемость.

Code: Select all

<title>
Проверка
</title>

Проверка тега <head>
Подобное этому

Code: Select all

Ïðîâåðêà òåãà
выделить и перекодировать (Alt+R) из 1252 в 1251.
Сохранить документ как HTML в UTF-8 без BOM, а дальше:
Или сюда (вручную искать по 041F, 0440 и т.д.)
Или пройтись tidy, как-то так:
tidy.exe --input-encoding utf8 --output-encoding utf8 -config CFG.ini < test1.html > test2.html
Ваш файл-оригинал назвать test1.html, на выходе получите test2.html

Code: Select all

indent-spaces:2
indent:auto
markup:yes
numeric-entities:yes
output-html:yes
quiet:yes
tab-size:8
tidy-mark:no
wrap-asp:yes
wrap-attributes:yes
wrap-jste:yes
wrap-php:yes
wrap:0

Posted: Sun Oct 31, 2010 10:34 am
by FeyFre
Deim0s, человек просил в AkelPad-е а не вручную или в Tidy :)

pandim, запускаете скрипт SearchReplace.js

В поле поиска ставим &#(x[\da-f]*);
В поле замены String.fromCharCode("0"+$1)
Снимаем галку чувствительности к регистру(первая), ставим галку Заменить функцией (последняя).

Заменить всё.

Posted: Sun Oct 31, 2010 11:01 am
by Deim0s
FeyFre,
Ну, я ответил на:
вернуть читаемость
Если разные варианты, к примеру:

Code: Select all

<html>
 <head>
  <title>Проверка</title>
  <meta http-equiv="content-language" content="ru">
  <meta http-equiv="content-type" content="text/html; charset=utf-8">
 </head>
 <body>
"Проверка тега;"
 </body>
</html>

Tidy по любому надёжнее :), а так на каждый "чих" придётся регэксп составлять.

Пытаюсь, но синтаксическая ошибка :(

Posted: Sun Oct 31, 2010 11:01 am
by pandim
Image
И пишет "Синтаксическая ошибка" :(

Posted: Sun Oct 31, 2010 11:04 am
by pandim
Tidy -всё поправил, но в дополнение подредактировал текст страницы и перестал работать скрипт, так что там ещё думать надо :)
Но за Tidy - спасибо большое - надо будет почитать мануал.

Posted: Sun Oct 31, 2010 11:12 am
by Deim0s
pandim
Tidy -всё поправил, но в дополнение подредактировал текст страницы и перестал работать скрипт.
Да, за Tidy приглядывать нужно, поэтому оригинал документа лучше всегда сохранять.

Posted: Sun Oct 31, 2010 11:16 am
by pandim
Ребят - простите дурака:
>> запускаете скрипт SearchReplace.js
это просто комманда "Правка-Заменить" или как-то по другому?

ЗЫ: Уже понял, что по другому :)

Posted: Sun Oct 31, 2010 11:35 am
by FeyFre
pandim
Alt+P выбираем Функцию Scripts::Main нажимаем кнопку "Выполнить"
В открывшемся окне находим скрипт и нажимаем Выполнить.
(Можно назначить горячие клавиши)

Posted: Sun Oct 31, 2010 11:47 am
by pandim
Спасибо, разобрался! Всё получилось!

> В поле поиска ставим &#(x[\da-f]*);
> В поле замены String.fromCharCode("0"+$1)
> Снимаем галку чувствительности к регистру(первая), ставим галку Заменить функцией (последняя).

А где про это почитать?

Posted: Sun Oct 31, 2010 1:53 pm
by FeyFre
pandim, нигде. Про это нужно интуитивно понять. Хотя можете поиск по форуму по ключевому слову SearchReplace сделать, авось что-то и поймете.

Posted: Sun Jul 13, 2014 2:05 pm
by Skif_off
Случайно натолкнулся, кто-нибудь пользовал HTML Tidy for Windows with HTML5?