SpellCheck plugin

Discuss and announce AkelPad plugins
Post Reply
  • Author
  • Message
Offline
Posts: 3234
Joined: Wed Nov 29, 2006 1:19 pm
Location: Киев, Русь
Contact:

Post by VladSh »

FeyFre wrote:Насчет HTML и прочего.... я выходом вижу только создание белого списка... это подзадача у меня не на первом месте...
Может быть для HTM в качестве "белого списка" использовать html.highlight?
FeyFre wrote:
а можно сделать так, чтобы при выбранном русском словаре он не проверял и не подчеркивал слова на латинице и наоборот, при английском словаре не подчеркивал кириллицу?
Merge словарям сделайте, и всё будет хорошо.
А можно будет указать сразу 2 словаря? Было бы здорово :!:
Или использовать 2-й словарь как "дополнительный белый список"?

Offline
Posts: 2248
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

Может быть для HTM в качестве "белого списка" использовать html.highlight?
Внешняя зависимость это не есть хорошо.
А можно будет указать сразу 2 словаря? Было бы здорово
Можно всё, на что у меня хватит времени.
Или использовать 2-й словарь как "дополнительный белый список"?
Вообще то ASpell сам побеспокоился о "белом списке", при чем двумя способами:
1. На уровне словарей и в лингвистических терминах - "Жаргон". Т.е русский язык с жаргоном WEB-Разработчиков(с жаргоном плотника, сапожника, шофёра и т.п)
2. У ASpell также есть такое понятие как фильтры(встроенные фильтры прекрасно пропускают и URL-ы, и Tex-форматирование, и e-mail заголвоки, и SGML-entity(в том числе так нужное вам HTML)) , но боюсь применить их не так просто как кажется.

Offline
Posts: 767
Joined: Mon Sep 28, 2009 10:03 am
Location: Minsk, Belarus

Post by se7h »

FeyFre wrote:Вообще то ASpell сам побеспокоился о "белом списке", при чем двумя способами
вот и замечательно, есть куда стремиться ;)

Offline
Posts: 876
Joined: Tue Jul 24, 2007 8:54 am

Post by Fr0sT »

Я теоретически не могу знать входит ли это слово в словарь, или не входит. Даже слова длиной в 20 символов не достаточно чтобы определить с более менее высокой вероятностью на каком языке оно.
А по кодам символов? Насколько я понимаю, Акель всё в Юникоде представляет, значит, для каждого (ну, условно для каждого) языка - свой диапазон символов.

Offline
Posts: 2248
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

Fr0sT
Только статистический анализ, например частота встреч в тексте смежных букв. Только вот одного слова не достаточно чтобы однозначно сказать к какому язык оно принадлежит.(На одной только кириллице основано 16 языков, не говоря о латыне).
А проверять во всех доступных словарях - не думаю что о таких лагах вы мечтаете :)

Offline
Posts: 767
Joined: Mon Sep 28, 2009 10:03 am
Location: Minsk, Belarus

Post by se7h »

FeyFre wrote:Fr0sT
Только статистический анализ, например частота встреч в тексте смежных букв. Только вот одного слова не достаточно чтобы однозначно сказать к какому язык оно принадлежит.(На одной только кириллице основано 16 языков, не говоря о латыне).
А проверять во всех доступных словарях - не думаю что о таких лагах вы мечтаете :)
ну латиницу-то от кириллицы отличить не проблема? сделайте хотя бы как я предлагаю, чтобы при проверке кириллических языков не проверялись/не подчёркивались языки на латинице и наоборот

Offline
Site Admin
Posts: 6403
Joined: Thu Jul 06, 2006 7:20 am

Post by Instructor »

FeyFre
Предложение: настройка для автоматического выбора словаря в соответствии с текущей раскладкой клавиатуры.

Offline
Posts: 2248
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

Долгожданное обновление 8)
Обновление к 1.0.0.13а1


Updated to 1.0.0.13a1

Offline
Posts: 767
Joined: Mon Sep 28, 2009 10:03 am
Location: Minsk, Belarus

Post by se7h »

не прошло и полгода! :lol:

расскажите о нововведениях в механизме риалтайм-проверки

Offline
Posts: 2248
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

Вы нас не ждали, а мы приперлись. Надеемся что ничего не сломал :)
Обновление к 1.0.0.14а1

Updated to 1.0.0.14a1



UPD:
Ничего не поломал, а вот построил коряво.

Offline
Posts: 2248
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

Обновление к 1.0.0.15а1

Updated to 1.0.0.15a1

Offline
Posts: 2248
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

Обновление к 1.0.0.16а1

Updated to 1.0.0.16a1
Last edited by FeyFre on Fri Jun 04, 2010 1:49 pm, edited 1 time in total.

Offline
Posts: 767
Joined: Mon Sep 28, 2009 10:03 am
Location: Minsk, Belarus

Post by se7h »

планируется ли возможность добавления слов в словарь и как создавать белый список?

небольшая ремарка в пункте настроек:
правильно "Оповещать об ошибках без известных коррекций"

Offline
Posts: 2248
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

небольшая ремарка в пункте настроек:
правильно "Оповещать об ошибках без известных коррекций"
Исправим...
планируется ли возможность добавления слов в словарь
Встроенное в ASpell? Пока нет
как создавать белый список?
Белый список создан, его можно только редактировать(и удалить).
Белый спсиок вшит в плагин в виде ресурса. Редактируется следующим образом:
  1. ResHacker.exe или подобный инструмент, открываем им плагин (SpellCheck.DLL)
  2. Ищем ресурсы типа RCData (код типа 10)
  3. Там единственный ресурс с именем 100, экспортируем его.
  4. Полученный файл - это обычный текстовый файл в кодировке UTF16 LE без BOM. Можем открыть этим же Акелом(все версии акела поддерживают эту кодировку.)
  5. Редактируем этот файл, при этом поддерживаясь простых правил:
    1. В файле может быть сколько угодно строк.
    2. Слова обрамляются вертикальным слешем(|),
    3. Каждая строка должна начинаться и заканчиваться вертикальным слешем(|). Исключением могут быть первая и последняя строки(в том числе пустые): к первой слеш будет дошит спереди, к последней - в конце.
  6. Импортируем этот файл назад в ресурс.
  7. Наслаждаемся.
Например корректный файл(первая строка - названия тегов, вторая названия атрибутов:

Code: Select all

|A|IMG|BASE|LINK|TABLE|TR|TH|TD|TFOOT|THEAD|HTML|BODY|
|SRC|HREF|COLS|ROWS|TARGET|WIDTH|HEIGHT|TYPE|NAME|VALUE|ID|
Все строки равнозначны. Только удобство для пользователя.
Например не корректный файл(первая строка - пустая, последняя строка - пустая)

Code: Select all

A|IMG|BASE|LINK|TABLE|TR|TH|TD|TFOOT|THEAD|HTML|BODY|
|SRC|HREF|COLS|ROWS|TARGET|WIDTH|HEIGHT|TYPE|NAME|VALUE|ID

В этом примере первая и последняя строки - пустые. Потому слова A и ID не попадают в белый список, остальные - попадут. Можно использовать эту возможность для написания пояснения словам(откуда? для чего?)

Не думаю что Вы долго будете пользоваться этим способом. :lol:

Offline
Posts: 2248
Joined: Tue Aug 07, 2007 2:03 pm
Location: Vinnitsa, Ukraine

Post by FeyFre »

Обновление к 1.0.0.17а1

Updated to 1.0.0.17a1


Предыдущий механизм белого списка не прожил и трех суток :)
Post Reply