Dubrowsky
Хроники одного дупла
Блогово  →  Теги  → 

xml

05.09.2011

Вот например понадобилось мне сделать тематический поиск ну, я как бы знаю, что лучше сразу забить, дело гиблое, прошлый век и т.д - однако понадобилось, не вдаваясь в детали.

Есть куча доменов (штук 500 для начала), как-то там отобранных, где мой поиск должен что-то находить желательно, конечно, все что нужно находить входные данные такие:

  • хостов - 500 штук
  • документов - в пределах миллиона
  • держать индексатор+поиск у себя - никакого желания
  • зато легко можно обвешаться рекламой что твой московский метро до собянина
  • и хорошо бы как-то своими руками настраивать отображение серпа

Насоветуйте чего-нибудь Я пока под катом напишу, что вспомнилось.

Еще много букв →

06.03.2008

Народ в очередной раз задался вопросом, как бы так закрыть часть документа от индексации, чтоб при этом все было валидно по мотивам статьи от Ayavryk'а сделал свой вариант.

В основе лежит ровно та же идея: отдаем на клиент документ, в котором контент, не предназначенный для индексации, спрятан в комментариях, а затем при помощи XSLT достаем его оттуда.

Основная засада заключается в том, что Mozilla Firefox не знает о disable-output-escaping, поэтому исходный метод переставал работать, если в контенте, который мы прячем, встречались вложенные теги собственно, эту проблему я решил черезвычайно тупо: дополнительным XSL-преобразованием на сервере.

Еще много букв →

01.02.2008

Представим, что у нас есть система, в которой каждый модуль собирает кусок XML-дерева потом результат каким-то образом проворачивается через XSLT-процессор и отдается юзеру у нас есть желание закэшировать результат работы модуля средствами файловой системы собственно, я придумал 3 способа как это сделать и набросал небольшой тестик подробности под катом.

Еще много букв →

Крутые посты wtf??? →

20.04.2012 · 6 камментов · рейтинг 15.41
22.03.2012 · 8 камментов · рейтинг 12.6
29.01.2012 · 14 камментов · рейтинг 12.07
11.03.2012 · 8 камментов · рейтинг 11.57
11.04.2012 · 4 каммента · рейтинг 10.98

Последне камменты

16.05.2012  AlexКак ускорить индексацию нового сайта: Да, твиттер очень способствует быстрой индесации с...
01.05.2012  Николай ДубровскийПро поиски райтера: Дорогой коирайтер, а кстати, "нормальная цена" - э...
30.04.2012  Дорогой коирайтертам же: О времена, о нравы - сказал бы классик... А на сам...
25.04.2012  cleamКак программисты собеседуют программистов: После собеседования в такой форме ни за что соглаш...
25.04.2012  АлександрПереезжаем на другой сервер, часть 5 (Яндекс.ПДД и DNS-хостинг): Тоже сейчас переезжаю на Яндекс-ДНС, спасибо за ст...

Статсы

Рейтинг блогов

Поисковый спам