OSDev
http://osdev.su/

Чистка пользователей
http://osdev.su/viewtopic.php?f=18&t=641
Страница 1 из 2

Автор:  SII [ 19 окт 2012, 06:26 ]
Заголовок сообщения:  Чистка пользователей

Почистил малость список пользователей форума: удалил тех, кто зарегистрировался год назад и больше и так ничего и не написал. В общем, мёртвых душ :)

Автор:  Yoda [ 19 окт 2012, 10:56 ]
Заголовок сообщения:  Re: Чистка пользователей

Я на своём корпоративном форуме запарился удалять мёртвые души и спамеров и написал автоматический скрипт, запускающийся раз в сутки ночью по крону. Работает уже много лет идеально. Могу посодействовать.
Там, кстати, несколько уровней фильтрации пользователей. Кстати, вместе с критерием "ничего не писал" дополнительно проверяется на "не заходил на форум" больше двух лет (на самом деле алгоритм более сложный). Бывают иногда пользователи, которые не пишут, но заходят и читают.

Автор:  SII [ 19 окт 2012, 13:21 ]
Заголовок сообщения:  Re: Чистка пользователей

Ну, у нас пока проблем с этим нет -- объёмы мизерные. Но если что -- будем иметь в виду :)

Автор:  Yoda [ 19 окт 2012, 14:59 ]
Заголовок сообщения:  Re: Чистка пользователей

Ещё, кстати, я написал непробиваемую для роботов капчу. Только спам-оператор (человек) может зарегистрироваться. Встроенные капчи довольно эффективно распознаются роботами.

Автор:  SII [ 19 окт 2012, 16:02 ]
Заголовок сообщения:  Re: Чистка пользователей

А вот это интересней: наша, похоже, иногда пробивается, хотя не уверен. Но это с Грином говорить надо -- реально ж он нольчайник, а я так -- спамеров убивать :)

Автор:  Nable [ 21 окт 2012, 01:23 ]
Заголовок сообщения:  Re: Чистка пользователей

Yoda писал(а):
Ещё, кстати, я написал непробиваемую для роботов капчу. Только спам-оператор (человек) может зарегистрироваться. Встроенные капчи довольно эффективно распознаются роботами.

И на каких теоретических предпосылках она основана (как вычислительная сложность в криптографии, например) ?
А если ни на каких, то это "неуловимый Джо", всего лишь. Потому что то что она не пробивалась на данный момент означает лишь то что она никому не нужна (т.е. мало где используется) чтобы ей заниматься. Ибо так-то для ботов и трёхмерные капчи уже не очень страшны. Но в большинстве случаев достаточно совсем древних методов (типа скрытого через css текстового поля) чтобы отвадить непрошенных гостей.
Но так - прошу ссылку посмотреть что за самоделка такая интересная.

Автор:  Yoda [ 22 окт 2012, 12:40 ]
Заголовок сообщения:  Re: Чистка пользователей

Nable писал(а):
И на каких теоретических предпосылках она основана (как вычислительная сложность в криптографии, например) ?

На трёх предпосылках.
1. Сложность формализации задачи распознавания образов.
2. Уникальность изделия (и, как следствие, никакое соотношение трудозатрат к отдаче).
3. Лёгкая вариативность изделия.

Nable писал(а):
А если ни на каких, то это "неуловимый Джо", всего лишь.

Я так понимаю, единственная твоя цель - "уесть" меня. Хочешь, - считай так.

Nable писал(а):
Потому что то что она не пробивалась на данный момент означает лишь то что она никому не нужна (т.е. мало где используется) чтобы ей заниматься.

Ну попробуй пробей. Образцы во вложении.

Nable писал(а):
Ибо так-то для ботов и трёхмерные капчи уже не очень страшны.

Не такие уж они и трёхмерные, как показывает практика. Все они элементарно формализуются для автоматизированного распознавания образов.

Вложения:
Captcha.gif
Captcha.gif [ 62.02 КБ | Просмотров: 8325 ]

Автор:  Nable [ 26 окт 2012, 18:43 ]
Заголовок сообщения:  Re: Чистка пользователей

Yoda писал(а):
1. Сложность формализации задачи распознавания образов.
Как бы и да, но яндехи всякие всё же подобное ковыряют. Да и насколько поиск по картинкам (сначала tineye, потом и гугловский) заставляют задуматься что в этой отрасли многое пройдено.

Yoda писал(а):
2. Уникальность изделия (и, как следствие, никакое соотношение трудозатрат к отдаче).
Ну т.е. то, о чём я говорил - многие боты легко накалываются уже на том что форма отличается от типичной. В смысле, что зачастую они и до капчи-то не доходят.

Yoda писал(а):
Я так понимаю, единственная твоя цель - "уесть" меня. Хочешь, - считай так.
Угу, аж спать не могу, ночами думаю как бы уесть. Фу таким быть, у меня вообще такой цели не стояло.
Не, просто говоря о стойкости капчи - я привёл пример что зачастую можно и даже без капчи отвадить непрошенных гостей (если движок сайта не очень широко распространённый, особенно). И я всего лишь проявляю искренний интерес.

Yoda писал(а):
Ну попробуй пробей. Образцы во вложении.

Erm, это всё замечательно, но сам я не из яндеха (и распознаванием образов почти не занимаюсь) + есть такой момент (на который я хотел обратить внимание) что в некоторых случаях не обязательно картинку распознавать. Например, иногда можно "зафлудить" капчу так что база ключей переполнится и вообще никто ей воспользоваться не сможет. Собственно, сам не так давно ломал голову на тему годной капчи для одного проекта и интересно как такие нюансы решены здесь.
Картинки посмотрю на досуге.

Yoda писал(а):
Не такие уж они и трёхмерные, как показывает практика. Все они элементарно формализуются для автоматизированного распознавания образов.
Вот прямо все? Бгг. Особенно грустно это выглядит на фоне первой цитаты, "Сложность формализации задачи распознавания образов.".

Автор:  Yoda [ 28 окт 2012, 02:55 ]
Заголовок сообщения:  Re: Чистка пользователей

Nable писал(а):
Как бы и да, но яндехи всякие всё же подобное ковыряют.

Не, такое не ковыряют.

Nable писал(а):
Да и насколько поиск по картинкам (сначала tineye, потом и гугловский) заставляют задуматься что в этой отрасли многое пройдено.

Поиско по картинкам основан не на их содержимом, а на содержимом атрибута "alt" и на ближайшем окружении тегов. Картинки пока никто не научился распознавать.

Nable писал(а):
Ну т.е. то, о чём я говорил - многие боты легко накалываются уже на том что форма отличается от типичной.

Многие, да не все. Хрумер постоянно совершенствуется. Изменение форм - ненадёжный способ. А я предпочитаю не терзаться в сомнениях, а быть уверенным в надёжности моего средства.

Nable писал(а):
Yoda писал(а):
Ну попробуй пробей. Образцы во вложении.

Erm, это всё замечательно, но сам я не из яндеха (и распознаванием образов почти не занимаюсь)

Мои друзья по институту работают в ABBYY (фактически, всё руководство), разрабатывают FineReader и я знаком с проблемами распознавания текста. На самом деле распознать произвольный текст, набранный произвольным шрифтом - практически нерешаемая задача. В случае PHPBB капча легко ломается по той причине, что базовые шрифты в ней предельно простые, а от всех применяемых к ним "извращений" в виде трёхмерных фигур достаточно легко избавиться.
Кроме сказанного, я же опираюсь на практический опыт. Со встроенными капчами, спам-боты нешуточно одолевают форум. После применения новой капчи поток регистраций сократился раз в пять и сразу видно, что из просочившихся работают именно операторы, а не боты.

Nable писал(а):
Yoda писал(а):
Не такие уж они и трёхмерные, как показывает практика. Все они элементарно формализуются для автоматизированного распознавания образов.
Вот прямо все? Бгг. Особенно грустно это выглядит на фоне первой цитаты, "Сложность формализации задачи распознавания образов.".

Я говорю про все, входящие в комплект PHPBB. О причинах такого сказал выше.

Автор:  Nable [ 09 ноя 2012, 02:32 ]
Заголовок сообщения:  Re: Чистка пользователей

> Не, такое не ковыряют.
Хз, просто помню что в одной из частей (подразделений или как оно правильно) там всем давали тестовое задание - написать распознавалку капчи, нарисованной в acsii графике. По крайней мере, несколько однокурсников над таким заданием билось.

> Поиско по картинкам основан не на их содержимом, а на содержимом атрибута "alt" и на ближайшем окружении тегов. Картинки пока никто не научился распознавать.
Что за феерия. На tineye заходить не пробовал, как я понимаю? Там заливаешь картинку или её url вставляешь и оно ищет. Никаких тегов (особенно при заливании с локалхоста картинки с отрезанным EXIF и именем 1.jpg) там нету. Как говорится, "where is your god now?". Как работать с гугловским поиском - я хз, оно только с новыми браузерами эту фичу выдаёт. Но, говорят, тоже есть кнопка чтобы залить картинку и оно находит похожие.

Страница 1 из 2 Часовой пояс: UTC + 3 часа
Powered by phpBB® Forum Software © phpBB Group
http://www.phpbb.com/