17:37

After silence that which comes nearest to expressing the inexpressible is music.
Снова я. Буквально в предыдущем посте я просил помощь хостинга, который удачно нашёл.Теперь Хочу Вам представить то, ради чего искал - программу для поиска по сообществам и дневникам diary.ru. Diary Search - программа, которую я сделал после того, как банально не смог найти нужный мне контент у себя же на дневнике. Ему уже почти 4 года и что-то найти вручную невозможно. Стандартный поиск ничего не выдал, а от гугла у меня он закрыт.



Подробнее можно про неё почитать и попользовать тут - http://kakou-ectb.diary.ru/p137260283.htm . Так же могу ответить на вопросы о том на чем писал, как что реализовывал и многие другие. Задавайте, если интересно.

Если администрация посчитает это неким пиаром, прошу учесть, что программа абсолютно бесплатная и создана исключительно для пользователей diary.ru :cheek:

@темы: Программы, DotNet

Комментарии
09.12.2010 в 18:02

Крайне злопамятное хамло ;)
Главное чтобы айпишники не попадали в режим рид-онли из-за этой софтины)
09.12.2010 в 18:05

After silence that which comes nearest to expressing the inexpressible is music.
Co0L Можно поподробнее?:) Хотите сказать, что есть возможность попасть в ридонли за n количество запросов в секунду?
09.12.2010 в 18:19

Крайне злопамятное хамло ;)
Kakou ECTb
Легко) Если посетитель ведет себя не как пользователь (т.е. не запрашивает куки, например и делает множество запросов), то IP с которого он заходит на сайт попадает в список IP роботов. Для них закрывается доступ в изменению любой информации на сайте)
09.12.2010 в 18:38

After silence that which comes nearest to expressing the inexpressible is music.
Co0L Ну в теории конечно легко, а вот на практике не думаю, что система на столько продумана. + Программа имитирует действия пользователя. В том числе и куки :)

+ если я в опере поставлю - обновляться каждые 5 секунд страницу, то мне ридонли поставят? Что-то я сомневаюсь :D
Если есть какие-то выдержки из правил, постов администрации - прошу предоставить :cheek:
09.12.2010 в 18:44

Крайне злопамятное хамло ;)
Kakou ECTb
Опера запрашивает куки, у нее есть корректный юзерагент)

сли есть какие-то выдержки из правил, постов администрации
diary-support.diary.ru/?query=%F0%EE%E1%EE%F2%F...

Да и сам я пока являюсь представителем администрации, хоть и не прямым администратором))
09.12.2010 в 18:49

After silence that which comes nearest to expressing the inexpressible is music.
Опера запрашивает куки, у нее есть корректный юзерагент) Как и у программы ;)

Спасибо за инфу. Пожалуй сделаю пару триксов в программе...
09.12.2010 в 18:56

Крайне злопамятное хамло ;)
Kakou ECTb
Угу) А в целом, программа мне нравится)
09.12.2010 в 19:07

alhames.ru
Kakou ECTb а можно вкратце алгоритм действий программы?
Просто мне в ближайшем времени тоже придется реализовывать подобный функционал :)
09.12.2010 в 19:10

After silence that which comes nearest to expressing the inexpressible is music.
alhames Ну если в двух словах, то вся суть программы основывается на парсинге страниц. Алгоритм примерно такой :
Post запрос для авторизации -> get запрос главной -> парсим регулярками страницу на наличие постов и страниц -> обрабатываем -> всё с начало, но уже на след странице, только без post запроса(куки сохраняются).
09.12.2010 в 19:18

Пожалуй сделаю пару триксов в программе
как сделаешь свистни ) интересно затестить будет, думаю довольно полезна штука вышла )
09.12.2010 в 19:27

Крайне злопамятное хамло ;)
Kakou ECTb
Post запрос для авторизации -> get запрос главной -> парсим регулярками страницу на наличие постов и страниц -> обрабатываем -> всё с начало, но уже на след странице, только без post запроса(куки сохраняются).
Кстати, лучше использовать API) И за бота не посчитают) Дневники поддерживают MetaWeblog API. Адрес гейта: www.diary.ru/client/mwa.php
09.12.2010 в 19:28

After silence that which comes nearest to expressing the inexpressible is music.
Nidjusan Я думаю на выходных соберу все баги, пожелания, что-то подправлю и будет новая версия. Можешь пока скачать - там есть пункт, проверка новой версии. Как только скажет, что есть новая, можешь скачать :cheek:
09.12.2010 в 19:28

alhames.ru
Kakou ECTb
после первого прохода по дневнику, больше интернет не требуется, можно искать офлайн
А в каком формате кэшируются данные?
09.12.2010 в 19:29

After silence that which comes nearest to expressing the inexpressible is music.
Кстати, лучше использовать API) Конечно лучше, но рамки, которые апи накладывает... Не совсем устраивают. Однако я гляну более детально, возможно и впрямь будет рациональнее через ваше api всё делать.

update : наврятли. Цитата из вики :
metaWeblog.newPost()
metaWeblog.getPost()
metaWeblog.editPost()
metaWeblog.getCategories()
metaWeblog.getRecentPosts()
metaWeblog.newMediaObject()

Куда тут уложить весь функционал в 6 методов ))
09.12.2010 в 19:33

Крайне злопамятное хамло ;)
Kakou ECTb
Тем не менее, этого апи достаточно для работы блог-клиентов)
09.12.2010 в 19:56

After silence that which comes nearest to expressing the inexpressible is music.
Co0L ну я не спорю ) однако не для моей программы :)alhames кешируются в бд sqlite. Формат текстовый. База запаролена. Данные не шифруются
09.12.2010 в 19:59

alhames.ru
Кстати, лучше использовать API)
Я тоже поначалу хотел предложить, но вспомнил свои прошлые опыты..
Возможности api-дневников весьма примитивны, так что так или иначе его будет недостаточно для реализации хотя бы полноценного поиска.
09.12.2010 в 20:25

 
diary-support.diary.ru/?query=%F0%EE%E1%EE%F2%F...
О черт, паранойя добралась и до @дневников)

Расширенная форма

Редактировать

Подписаться на новые комментарии
Получать уведомления о новых комментариях на E-mail