| View previous topic :: View next topic |
| Author |
Message |
VladSh
Joined: 29 Nov 2006 Posts: 2510 Location: Киев, Русь
|
Posted: Wed Aug 08, 2012 2:58 pm Post subject: |
|
|
Visitor7
В английской. |
|
| Back to top |
|
 |
Visitor7
Joined: 03 Jun 2012 Posts: 88
|
Posted: Wed Aug 08, 2012 3:51 pm Post subject: |
|
|
| VladSh wrote: | | В английской. |
Осилил. Там же просто про очередность. А по факту, [а-я]* все равно не находит слово "ёжик". А [a-zA-Z] не то же самое что \w, обе конструкции вполне современные, просто разные. А \w у меня не находит ничего кроме [0-9a-zA-Z_]. Так и не понял, FeyFre, что вы хотели сказать. |
|
| Back to top |
|
 |
FeyFre
Joined: 07 Aug 2007 Posts: 1892 Location: Vinnitsa, Ukraine
|
Posted: Wed Aug 08, 2012 7:20 pm Post subject: |
|
|
Visitor7
Что это такое в двух словах.
Ваш collation утверждает "После Ь идет Э, потом Ю, потом Я"
Мой collation утверждает "После Ь идет Ю, потом Я"
Мы оба правы, ибо Ваш основан на Белорусском алфавите, мой - на Украинском алфавите.
Так вот, если вы хотите чтобы "[а-я]*" нашло "ёжик" то Вы должны как-то пнуть парсер что-бы он пользовался collation "Русский алфавит", т.е. в котором "а" < "ё" < "я". А судя по вашему примеру если "[а-яё]*" находит "ёжик" то парсер пользуется collation в котором "а" < "ё" < "я" не выполняется.
Как парсеру поменять collation - дело собственно индивидуальное.
Например в СУБД MySQL collation можно задать для каждой таблицы индивидуально - это свойство таблицы. В других алгоритмах, которые зависят от collation если задается, то как-то по другому - ищите. Один из вариантов - пнуть разработчика. Другой - написать/исправить самостоятельно, третий - выкинуть и взять другое. Подход индивидуален. |
|
| Back to top |
|
 |
eil
Joined: 15 Nov 2009 Posts: 30 Location: Alex
|
Posted: Wed Aug 08, 2012 7:54 pm Post subject: |
|
|
| Visitor7, и вновь спасибо, за решение. |
|
| Back to top |
|
 |
Visitor7
Joined: 03 Jun 2012 Posts: 88
|
Posted: Wed Aug 08, 2012 9:06 pm Post subject: |
|
|
| FeyFre wrote: | | Ваш collation утверждает "После Ь идет Э, потом Ю, потом Я". | А вы уверены что мой collation вообще существует? Мне кажется мы говорим о разных уровнях. RegExp - это функция языка разработки на которую ровняется акелпад. Может быть, поиск в акелпаде даже этой функцией и реализуется(я не знаю языков, тем более функций си). У нее есть определенные возможности и определенный формат, в котором символы означают их код в "таблице символов" и, соответственно, диапазоны символов задают диапазоны кодов в "таблице символов". А формат "таблицы символов" жестко определен.
А то о чем говорите вы - это уровень функций пользовательского интерфейса(несколько уровней вверх) программы, специально разработанной в том числе для гибкой сортировки выборки. Если копнуть на несколько уровней глубже, то эта гибкая сортировка в БД посредством "таблиц очередности символов при сортировке", наверняка реализуется теми же RegExp функиями языка разработки, которые и слыхом не слыхивали ни про какой collation.
На уровне программиста скорее всего можно лишь переиначивать диапазоны подменами ввода типа "а-я" на "а-яё", но это лишь внесет путаницу. Можно сделать спец. символ для русского диапазона, например \с который будет подменяться на [А-Яа-яЁё] или сразу на [0-9_A-Za-zА-Яа-яЁё], но так ли часто это требуется, что запаривает лишний раз написать ЁА-ё или а-ё(при нечувствительности к регистру всего на символ больше, при чувствительности на два символа)? А в 99% текстов в обоих случаях Ё-ё сканает(всего на символ больше). |
|
| Back to top |
|
 |
FeyFre
Joined: 07 Aug 2007 Posts: 1892 Location: Vinnitsa, Ukraine
|
Posted: Wed Aug 08, 2012 10:47 pm Post subject: |
|
|
| Visitor7, ну раз Вы не хотите решать свою проблему а пришли сюда потролить, то собственно разговор окончен. |
|
| Back to top |
|
 |
Visitor7
Joined: 03 Jun 2012 Posts: 88
|
Posted: Thu Aug 09, 2012 9:28 am Post subject: |
|
|
| )) Я просто заглянул человеку ответить. Если вы так часто набираете диапазоны, попросите у автора сделать настраиваемый спецсимвол, которому каждый может присвоить свой диапазон(своего языка либо вообще иной). |
|
| Back to top |
|
 |
Fr0sT
Joined: 24 Jul 2007 Posts: 850
|
|
| Back to top |
|
 |
F. Phoenix
Joined: 24 Dec 2011 Posts: 113
|
Posted: Tue Aug 14, 2012 2:21 pm Post subject: |
|
|
В стандартном комплекте .NET идет юникодный - можно попробовать оттуда код портировать (как вариант, из Mono), хотя может проще найти более совместимую с Акелом реализацию... А чего мне из тамошних возможностей тут главным образом не хватает, так это предпросмотра назад, хотя именованные ссылки и поддержка кириллицы в \w тоже бы не помешали. |
|
| Back to top |
|
 |
Serge Yolkin
Joined: 27 Jul 2010 Posts: 122
|
Posted: Tue Aug 14, 2012 6:04 pm Post subject: |
|
|
| Quote: | | поддержка кириллицы в \w | Надеюсь, изменения существующего функционала будут опциональными... |
|
| Back to top |
|
 |
biglentring
Joined: 16 Sep 2012 Posts: 2
|
Posted: Sun Sep 16, 2012 2:37 pm Post subject: Обрезка строки |
|
|
День добрый! Подскажите пожалуста!
Есть N количество строк с разным содержанием, нужно сделать обрезку всех строк на 200+- символе, чтобы в каждой строке осталисть первые 200 символов, остальное удалить.
Пробывал .{190,200}\b в Dreamweaverе отлично находит первые 190-200 символов и выделяет их, но мне нужно выделить все что после этих 190-200 символов для автозамены пустотой.
В akelpad эта конструкция работает совсем по другому, если есть знающие люди, помогите чайнику. |
|
| Back to top |
|
 |
Infocatcher
Joined: 06 Aug 2007 Posts: 1432
|
Posted: Sun Sep 16, 2012 3:33 pm Post subject: |
|
|
| biglentring wrote: | | чтобы в каждой строке осталисть первые 200 символов, остальное удалить |
Что: ^([^\n\r]{200})[^\n\r]+
Чем: \1 |
|
| Back to top |
|
 |
KDJ
Joined: 06 Mar 2010 Posts: 1068 Location: Poland
|
|
| Back to top |
|
 |
Infocatcher
Joined: 06 Aug 2007 Posts: 1432
|
Posted: Sun Sep 16, 2012 6:14 pm Post subject: |
|
|
KDJ
Oh, I forgot about this.
But seems like
([^\n\r]{14})[^\n\r]+
works fine too. |
|
| Back to top |
|
 |
qvent
Joined: 05 Oct 2012 Posts: 2
|
Posted: Fri Oct 05, 2012 12:59 pm Post subject: |
|
|
Всем добрый день. Прошу помощи, и сильно не пинать вопрос по регулярны выражениям ,я уже голову поломал, не могу найти решение.
есть маасив строчек, в каждой строчке есть ссылка, начинающаяся с http:// , перед ссылкой и после неё есть текст. Собственно вопрос, каким образом можно удалить этот текст, и оставить только ссылки? |
|
| Back to top |
|
 |
|
|
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum
|
Powered by phpBB © 2001, 2005 phpBB Group
|