yahoo pipes

Полнотекстовый фид с новостного сайта по ключевому слову через Google news

Предположим, нам нужо с сайта rfi.fr отслеживать все публикации, в которых есть слово Biélorussie.
 
Rss в таком случае будет иметь вид: http://news.google.com/news?q=site:rfi.fr+Biélorussie&output=rss.
 
Воспользуемся yahoo pipes, чтобы вытащить полнотекстовый фид из полученных анонсов.
 
fetch feed: http://news.google.com/news?q=site:rfi.fr+Biélorussie&output=rss
 


Tags:


Полнотекстовый фид с новостного сайта, на котором нет rss с помощью yahoo pipes

1. fetch page: вбиваем адрес страницы, за обновлениями на которой мы собираемся следить, вырезаем контент от и до (например, <h2>news</h2> - </ul>), используя повторяющийся тег внутри вырезанного контента для разбивки на элементы фида. в итоге должна получиться следующая структура фида: 0, 1, 2, 3, 4 и т.д.

2. rename (mappings): item.content copy as link, item.content copy as title,  item.content rename description


Tags:


Google Alerts

Google Alerts - прекрасный сервис, который позволяет мониторить индекс гугл на наличие в нем новых ссылок, содержащих те или иные ключевые слова.

Подписаться можно по email, а можно и через feed, который в свою очередь можно кинуть в yahoo pipes, получив полнотекстовую ленту.


Tags:


The Ultimate Yahoo! Pipes Creations List

Yahoo! Pipes is one of the coolest ways to mashup the RSS feeds of various sites and sources to get the data you want. Since our coverage of Yahoo! Pipes, thousands of creations are now available. However, finding the best picks can be tough. ReadWriteWeb has done the hardest part and comprised a list of some of the best Yahoo Pipes created by users. So without further ado, we give you the ultimate Yahoo! Pipes list.


Tags:


Regex в Yahoo Pipes примеры

На одном из своих Drupal-сайтов я решил использовать полнотекстовый агрегатор. Чтобы конвертировать обычный тизерный rss в полнотекстовый, я выбрал бесплатный сервис yahoo pipes. В нем есть возможность чистить содержание item.description с помощью regex-правил. Перечислю некоторые из них, которые реально работали (может быть, они и не совершенны, но зато работают).

1. вытащить из тега ссылки только содержание атрибута href, нужно для item.link

(.*)href=\"(.*?)\"(.*) заменить на  $2


Tags:


Видео со мной