Перевести HTML в читаемый вид

Russian main discussion
Post Reply
  • Author
  • Message
Offline
Posts: 5
Joined: Sun Oct 31, 2010 9:01 am

Перевести HTML в читаемый вид

Post by pandim »

Уважаемые гуру! Помогите!
Как я понимаю, Akelpad это может.

Есть HTML файл со следующим фрагментом:

Code: Select all

<title>
Проверка
</title>

Ïðîâåðêà òåãà <head>
Ой :( последняя строка вставилась не кодами :(
Вобщем там цепочки: амперсанд-решетка-цифра-цифра-цифра.

Помогите вернуть читаемость.
Заранее спасибо!

Offline
Posts: 139
Joined: Fri Feb 12, 2010 11:33 am

Post by Deim0s »

pandim,
Помогите вернуть читаемость.

Code: Select all

<title>
Проверка
</title>

Проверка тега <head>
Подобное этому

Code: Select all

Ïðîâåðêà òåãà
выделить и перекодировать (Alt+R) из 1252 в 1251.
Сохранить документ как HTML в UTF-8 без BOM, а дальше:
Или сюда (вручную искать по 041F, 0440 и т.д.)
Или пройтись tidy, как-то так:
tidy.exe --input-encoding utf8 --output-encoding utf8 -config CFG.ini < test1.html > test2.html
Ваш файл-оригинал назвать test1.html, на выходе получите test2.html

Code: Select all

indent-spaces:2
indent:auto
markup:yes
numeric-entities:yes
output-html:yes
quiet:yes
tab-size:8
tidy-mark:no
wrap-asp:yes
wrap-attributes:yes
wrap-jste:yes
wrap-php:yes
wrap:0

Offline
Posts: 2247
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

Deim0s, человек просил в AkelPad-е а не вручную или в Tidy :)

pandim, запускаете скрипт SearchReplace.js

В поле поиска ставим &#(x[\da-f]*);
В поле замены String.fromCharCode("0"+$1)
Снимаем галку чувствительности к регистру(первая), ставим галку Заменить функцией (последняя).

Заменить всё.

Offline
Posts: 139
Joined: Fri Feb 12, 2010 11:33 am

Post by Deim0s »

FeyFre,
Ну, я ответил на:
вернуть читаемость
Если разные варианты, к примеру:

Code: Select all

<html>
 <head>
  <title>Проверка</title>
  <meta http-equiv="content-language" content="ru">
  <meta http-equiv="content-type" content="text/html; charset=utf-8">
 </head>
 <body>
"Проверка тега;"
 </body>
</html>

Tidy по любому надёжнее :), а так на каждый "чих" придётся регэксп составлять.

Offline
Posts: 5
Joined: Sun Oct 31, 2010 9:01 am

Пытаюсь, но синтаксическая ошибка :(

Post by pandim »

Image
И пишет "Синтаксическая ошибка" :(

Offline
Posts: 5
Joined: Sun Oct 31, 2010 9:01 am

Post by pandim »

Tidy -всё поправил, но в дополнение подредактировал текст страницы и перестал работать скрипт, так что там ещё думать надо :)
Но за Tidy - спасибо большое - надо будет почитать мануал.

Offline
Posts: 139
Joined: Fri Feb 12, 2010 11:33 am

Post by Deim0s »

pandim
Tidy -всё поправил, но в дополнение подредактировал текст страницы и перестал работать скрипт.
Да, за Tidy приглядывать нужно, поэтому оригинал документа лучше всегда сохранять.

Offline
Posts: 5
Joined: Sun Oct 31, 2010 9:01 am

Post by pandim »

Ребят - простите дурака:
>> запускаете скрипт SearchReplace.js
это просто комманда "Правка-Заменить" или как-то по другому?

ЗЫ: Уже понял, что по другому :)

Offline
Posts: 2247
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

pandim
Alt+P выбираем Функцию Scripts::Main нажимаем кнопку "Выполнить"
В открывшемся окне находим скрипт и нажимаем Выполнить.
(Можно назначить горячие клавиши)

Offline
Posts: 5
Joined: Sun Oct 31, 2010 9:01 am

Post by pandim »

Спасибо, разобрался! Всё получилось!

> В поле поиска ставим &#(x[\da-f]*);
> В поле замены String.fromCharCode("0"+$1)
> Снимаем галку чувствительности к регистру(первая), ставим галку Заменить функцией (последняя).

А где про это почитать?

Offline
Posts: 2247
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

pandim, нигде. Про это нужно интуитивно понять. Хотя можете поиск по форуму по ключевому слову SearchReplace сделать, авось что-то и поймете.

Offline
Posts: 1161
Joined: Sun Oct 20, 2013 11:44 am

Post by Skif_off »

Случайно натолкнулся, кто-нибудь пользовал HTML Tidy for Windows with HTML5?
Post Reply