Полезное
/ Теория и практика

26 ноября 2008 15:53

RSS-читалки: время собирать новости

Хорошо сделанный сайт должно быть видно невооруженным глазом. Здесь и дизайн, от которого не стает тошно, и полезное информационное наполнение. Обычно на хороших веб-ресурсах есть встроенный поиск и много других интересных вещей. И когда встречаешь такой сайт, первым делом добавляешь его в закладки.

Однако гораздо интересней не откладывать интересное на потом, а постоянно быть в курсе обновлений с понравившегося сайта. И как же бывает досадно, когда понимаешь, что нет никакой возможности прицепить такой ресурс в свой RSS-агрегатор, поскольку оный сайт просто не содержит нужных "концов". Вероятно, это происходит потому, что создание RSS-лент воспринимается иными веб-мастерами как нечто необязательное. А жаль, ведь создание новостной ленты - это один из простейших способов расширить аудиторию за счет постоянных читателей, "привязать" посетителя к своему ресурсу. Посетители, в свою очередь, экономят время за счет "дистанционного" анализа материалов, которые появляются на страницах сайта.

RSS-ленты, их стандарты и их "сборщики"

Аббревиатуру Really Simple Syndication (RSS) приблизительно можно перевести как - "по-настоящему простое объединение". Физически RSS представляет собой файл, который либо генерируется веб-сайтом на лету, либо создается статически - однако в любом случае доступен по протоколу HTTP. В зависимости от настроения переводчика очередной англоязычной статьи, RSS-ленты обзываются различными нехорошими словами, познакомиться с их списком вы можете на соответствующей страничке Википедии.

Фактически существует несколько стандартов, на основании которых и происходит обмен RSS-фидами. Вкратце, они отличаются друг от друга только названием и порядком размещения XML-тегов. Если вы вдруг захотите узнать, как выглядит тот или иной фид изнутри, рекомендую посетить все ту же "Википедию", где приведены соответствующие примеры. Я же ограничусь простым перечислением форматов, которые наиболее востребованы сейчас.

Первой официальной версией RSS-фида является изобретенный в 1997 формат RSS0.9. Однако так случилось, что многим он показался слишком сложным. Последовавшая за ним версия RSS 0.91 была простой, и как следствие, более подходящей для применения на практике. Однако Сеть не стояла на месте, и вскоре команда W3C предложила еще более усовершенствованную версию формата - RSS1.0. Тем не менее, предыдущая ветка 0.91 была популяризирована и обросла разнообразными возможностями, что вскоре привело к появлению RSS2.0. В 2006-м к уже имеющимся RSS-форматам добавился несколько отличный от них Atom, также построенный на основе XML, но имеющий несколько отличную структуру.

Итак, из всего этого безобразия понятно, что имеется несколько не совместимых между собой форматов RSS-фидов. Конечно, разработчику ПО, которое бы могло читать все типы лент, приходится не сладко. Ведь нужно учесть особенности всех этих форматов, чтобы приложение было действительно универсальным. Обеспечить такую "всеядность" достаточно непросто, однако в настоящее время в основном используются два формата - RSS2.0 и Atom, которые фактически являются де-факто стандартными, что несколько облегчает кодерам их и без того нелегкую жизнь.

Но как выбрать правильный инструмент для обращения с этими зверями? Тут уже не все так прозрачно. Есть много разных инструментов для сбора лент и несколько принципиально различных подходов к собирательству такой информации. В данной статье речь пойдет в основном о stadalone-программах, которое вы используете лично, на своей пользовательской стороне. Также в последнее время поисковые системы (и не только они) работают над онлайн-синдикаторами и агрегаторами разнообразных лент.

Агрегатор в Firefox

Множество современных браузеров предоставляют вам встроенный сервис просмотра новостных лент. Последние версии Firefox показывают ссылку на новостную ленту прямо в строке адреса (конечно, при наличии такой ссылки в заголовках страницы). Прямо с помощью иконки можно добавить фид в закладки браузера для дальнейшего просмотра. К сожалению, "Огненная лиса" просто показывает актуальное состояние фида и не хранит старых заголовков и текстов.

Это маленькое недоразумение можно легко исправить, установив соответствующее внешнее дополнение. К счастью, последние версии "Лисы" имеют встроенный поиск по базе дополнений и расширений. Итак, достаточно просто задать в форме установки расширений качестве поисковой фразы "rss", чтобы получить, как говорится, "не отходя от кассы", около десятка результатов. Впрочем, некоторые из найденных расширений делают не совсем то, чего бы нам хотелось, но некоторые вполне подходят.

Например, попавшийся под руку одним из первых, Wizz Rss News Reader позволяет сохранять сообщения указанное количество дней, выделять их цветом, группировать источники. Вы можете производить поиск по текущей странице на предмет нахождения в ней ссылок на rss-ленты. Этот агрегатор поддерживает форматы Atom, RSS2.0, а также поддерживает OPML. Последний представляет собой список разнообразных фидов, который можно импортировать или экспортировать в rss-ридеры, создавая таким образом коллекцию источников новостей.

Сборщик новостей в Opera

Один из самых функциональных сборщиков новостных лент встроен в браузер "Опера". Интерфейс выполнен в виде почтового клиента. Можно настроить периодичность проверки фида. Крайне приятно выполнена функция динамического поискового отбора - набираете поисковую фразу, и по мере ввода, в окне результатов остаются лишь нужные статьи.

Немного не понравилось то, что изображения из просмотренных уже статей не сохраняются локально, а подгружаются по мере обращения к материалам. То есть будет несколько проблематично использовать данный просмотрщик в автономном режиме, если такое чудачество кому-то понадобится.

Самая интересная особенность "Оперы" - это, вероятно, ее ненавязчивость. Дело в том, что если вы будете использовать этот браузер в качестве просмотрщика фидов, каждый раз будет загружаться именно вкладка с требуемой формой, а не сначала браузер, в котором что-то где-то надо кликнуть. Кроме того, браузер достаточно легковесный - работает он явно шустрей своих навороченных собратьев.

Правда, не обошлось и без недоработок. Не продуман планировщик, который бы автоматически запускал закачку новостных лент, когда браузер не работает. Однако это замечание уже скорее из области придирок, поскольку остальные браузеры имеют куда более скудные встроенные возможности по обработке лент.

Кроме того, разработчики "Оперы" видно совсем забыли, что кроме их программы есть и другой софт - поэтому никакой явной возможности экспортировать список новостных лент в OPML просто нет. Равно как нет возможности импорта списка RSS-источников.

IE и прочие

Начиная с 7-й версии, агрегатор RSS появился и в браузере Internet Explorer. Правда это замечательное ПО имеет довольно неприятную особенность. При попытке подключиться к ленте надо быть уверенным, что у вас накатаны нужные обновления библиотеки MSXML. Иначе вы получите сообщение про необходимость обновления оной. Впрочем, не страшно. Если Windows у вас лицензионный (я уверен, что он у большинства читателей именно такой), поставить данную библиотеку не составит никакого труда. Хотя, по мне, более проще попробовать другой браузер, больше подходящий для работы в Сети, чем копаться с библиотеками. Ведь вам хочется работать с новостями, а не настраивать Windows?

Но все же, если необходимо работать с новостями из "ослика IE", рекомендую обратить внимание на RSS Feeds Toolbar, который отлично справится с RSS-потоками и без установки разнообразных (сто лет не нужных) библиотек.

Кроме браузеров-лидеров, RSS-ридер встроен и в Maxtrone, и в Safari, и во многие другие современные браузеры. Можно сказать, что эта возможность стает одной из обязательных для современного веб-навигатора.

Thunderbird

Помимо примочек, которые производители, да и просто энтузиасты пытаются приделать к браузерам, создано некоторое количество отдельного программного обеспечения, которое призвано упростить работу с новостными фидами. Я позволю себе остановиться лишь на некоторых, самых известных и свободно доступных программах, выполняющих все тоже самое, но уже как бы профессионально - хотя бы потому, что это их основная функция (либо одна из основных).

Наверное, самым известным примером standalone-ридера является Thunderbird. Это свободно-распространяемый почтовый клиент, который разрабатывается под эгидой проекта Mozillа. В плане чтения RSS эта программа позволяет хранить и выполнять поиск по базе собранных ранее статей, разделять их на категории, следить за источниками. Поддерживаются всевозможные форматы данных.

Кроме прочих преимуществ, очевидным бонусом Thunderbird является его кроссплатформенность и малая требовательность к системным ресурсам. Кроме того, программа расширяемая. Имеется возможность подгрузить дополнительные модули, способные расширить функциональность.

Правда, как выяснилось в ходе работы с этим "гибридом почтовика и rss-ридера", в компании Mozilla не все так безоблачно. В последней версии 2.0.0.17 на одном из моих рабочих компьютеров агрегатор отказался работать, просто не захотел импортировать фиды. Конечно, можно было помахать бубном, однако в таком случае может помочь то, что существует "портабельная версия" Thunderbird, которую можно переносить, просто скопировав каталог с программой.

Поскольку такая возможность может быть очень полезной при работе с новостями на нескольких компьютерах, выбор этой программы является более рациональным и обоснованным. Например, вот здесь, можно взять последнюю версию Thunderbird, но уже в переносимом варианте (размер распакованных файлов составляет 25 Мб, в сжатом виде 6 Мб - иначе говоря, программа влезет на практически любую флешку).

FeedDemon

FeedDemon свободно доступен для скачивания. Фактически этот программный продукт является переходным между стандалоун-просмотрщиком и онлайн-сервисом. Тем не менее, если при установке этого ПО отказаться от довольно навязчивых предложений по регистрации на newsgator (ресурс, позволяющий работать с новостями и "хостящий" данный проект), то можно получить довольно таки приятную rss-читалку.

Впрочем, есть в FeedDaemon и недостатки. В первую очередь - невнятно работающий поиск. Почему вместо прохода по локальной базе он пытается порыться в одном из онлайн-поисковиков? Совершенно непонятное действие, очевидная недоработка разработчиков программы.

Rssowl

Rss-cова (именно так переводится название этой программы) - это многоплатформенное приложение, работающее со всеми форматами фидов. Внешне интерфейс программы выполнен в стиле приложений Mozilla, хоть и не имеет ничего общего с ними. И вот тут действительно становится немного жаль, что нет расширения для "лисы" от разработчиков данного ПО. Хотя приложение достаточно функциональное, позволяет отлично работать со всевозможными источниками новостей и без всяких там браузеров.

Правда, однажды скачанные изображения можно просмотреть только при повторном подключении к Сети. Хотя, если вы скачали обновления к какой-то ленте, то по умолчанию скачивается также и полная версия материала - то есть нет необходимости "проходить по все материалам".

Очередной особенностью "совы" является отсутствие инсталлятора. Просто распаковываете программу и запускаете. Само собой, при "слете" Windows или копировании программы, ваша информация никуда не денется. Эта особенность программы позволяет с лихвой перекрыть другие ее недостатки. Правда, ярлычок для запуска нужно будет делать самостоятельно.

Реквием по Abilon

Хочется упомянуть еще свободно-распространяемое приложение Abilon - это полнофункциональный агрегатор, который имеет все, что необходимо для профессионального искателя информации. Кроме того, прямо в него встроен браузер. Можно настроить, сколько сообщения будут храниться, как складываться, и многое другое. Можно экспортировать или импортировать данные непосредственно в ваш блог, который должен будет поддерживать xml-rpc интерфейс (например, можно публиковать выдержки прямо в Wordpress).

Приложение действительно очень полезное - однако несколько неустойчивое и расточительное, в плане использования памяти. К сожалению, оно также совсем не поддерживается и достаточно долгое время не развивается. Но несмотря на эти недостатки, данная программа до сих пор является одним из самых популярных агрегаторов.

Неутешительные выводы

Современный Интернет становится все больше и глубже. Даже небольшие компании, приходя в Сеть, ведут корпоративные блоги, выдают новости, анонсы, пресс-релизы. Все это создает огромное море информации. Этот процесс имеет и свои черные стороны. Речь идет о поиске специализированных данных. Поиск редких сведений стал проблематичен, а иногда и просто невозможен. Происходит это из-за того, что большие поисковые системы ранжируют информацию в зависимости от ее необходимости, и редко используемые данные откладывают в дальний угол. А иногда довольно-таки полезный ресурс может быть без суда и следствия удален из индекса поисковой системы. Конечно, никто из SEO-гуру никогда не признается, что море информации это плохо - поскольку это еще и море средств, которые дают возможность развивать свои проекты и попросту выживать.

С помощью таких вот зацепок, как RSS, вполне можно обходиться и без "помощи" поисковиков, которые последнее время все больше заботятся о своих доходах, чем о качестве индекса. Пользователь, интересующийся специализированной информацией, вынужден полагаться на свою собственную базу данных - коей может являться хорошая подборка специализированных RSS-каналов и один из вышеописанных инструментов работы с ними.

Здесь, однако, есть две проблемы. Об одной сказано в самом начале - далеко не все веб-мастера делают качественные RSS-фиды на своих сайтах. Другая проблема - это управление RSS-потоками в условиях, когда их становится слишком много. Все легко, пока ваша читалка собирает анонсы с десятка новостных сайтов. Но если их число растет, добавляются любимые блоги и другие сервисы, все это рискует превратиться в несвязную свалку. Некоторые сервисы пытаются связывать все это на Вебе, во внешних онлайновых сервисах - как делают в "Яндексе", "Гугле" и других блого-новостных агрегаторах. Но на пользовательской стороне, на стороне читателя, такое "вытягивание информационных нитей" по собственному вкусу пока что остается нерешенной проблемой. W


Другие материалы рубрики "Теория и практика"