05 Сентября 2011 года
Вот например понадобилось мне сделать тематический поиск. Ну, я как бы знаю, что лучше сразу забить, дело гиблое, прошлый век и т.д. - однако понадобилось, не вдаваясь в детали.
Есть куча доменов (штук 500 для начала), как-то там отобранных, где мой поиск должен что-то находить. Желательно, конечно, все что нужно находить. Входные данные такие:
- хостов - 500 штук
- документов - в пределах миллиона
- держать индексатор+поиск у себя - никакого желания
- зато легко можно обвешаться рекламой что твой московский метро до собянина
- и хорошо бы как-то своими руками настраивать отображение серпа
Насоветуйте чего-нибудь. Я пока под катом напишу, что вспомнилось.
Вспомнилось вот что:
- Flexum от "Поисковых технологий" Ашманова - вроде то что надо, но выглядит как-то полудохло. Индексатор и поиск у них свой, ограничение на бесплатную версию - 200 хостов, вывод только через JavaScript, ссылка на них нужна. Умеет отдавать XML за деньги, но страничку "Тарифы" получилось найти только через Яндекс - не знаю, действуют ли они еще. Написал в суппорт, жду что скажут.
- Яндекс.XML - не очень понятно, реально ли на "голом Я.XML" сделать поиск по куче конкретных сайтов. Решение в лоб - перечислять все хосты в запросе - отпадает, длина запроса ограничена 400 символами. Можно делать кучу запросов, но это тоже какое-то шаманство и вообще медленно и ненадежно. На помощь приходит
- Яндекс.Поиск-для-сайта - он бывает "обычный" (до 200 сайтов, выдача показывается в iframe либо на их домене), или "тематический" - до 100К сайтов, созданную тематику можно использовать в XML-поиске. Но чтоб создать тему (т.е. список хостов), надо заполнить форму со всякими ФИО - сайт, где будет использоваться - организация и т.д., т.е. так вот сразу не поиграешься. Кроме того, судя по ссылке на XML-поиск с ограничением по рубрике Я.Каталога, используется такой же (если не тот же) механизм. Не удивлюсь, если модератор ответит "а у нас уже есть такая тема, просто допишите "
cat:9000632" к запросу". Список сайтов потом якобы можно обновлять автоматически, но при этом оно будет снова уходить на модерацию. Кстати, про 200 сайтов в базовом варианте написано, когда пытаешься сайт добавить, а в хелпах значится "Сервис «Поиск для сайта» позволяет добавить в поиск до 20-ти сайтов." - больше походит на правду.
- Google Custom Search - либо хаваешь чего дают (т.е. стандартный серп с адсенсом), либо платишь за XML - от 100 баксов за 20К запросов в год, до 2К баксов за 500К запросов в год (кстати, это получается 1370 в сутки - Яндекс свою тысячу дает делать бесплатно и без ограничения по списку сайтов). Чо-то как-то дорого.
Короче, пока жду ответа от Flexum, и пытаюсь выяснить, что там с модерацией темы в "тематическом поиске" Яндекса. Если будут интересные результаты - напишу еще.
|
|
Ответ на Ваше письмо был направлен вам в почту 05.09.2011 в 19:44.