О защите содержимого своего ресурса, а точнее о независимом сервисе подтверждения авторских прав на текстовые, визуальные или аудиоматериалы, я уже писал. Но так как тема эта настолько бесконечная, насколько незащищены сегодня авторские права рядового блоггера*, то я иногда буду к ней возвращаться. Сегодня речь пойдет о кустарной защите RSS-ленты блога.

*Если веб-мастеру свой сайт защитить достаточно просто, при условии его статичности (т.е. наполнение сайта закончено, и содержимое больше меняться не будет), то блоггеру, с его постоянно наполняемым блогом, это почти невозможно. Все потому, что статичный сайт можно заверить у нотариуса, что гарантирует удовлетворительное судебное решение, в случае обнаружения плагиата, в то время как ни у одного блоггера не хватит денег на заверение каждого своего поста (500р. за лист).

Прежде всего, необходимо заметить, что единственным гарантированным методом защиты от плагиата в Интернете, является не публикация в нем своих произведений. Любой другой вариант непременно приведет к воровству. Поэтому все изложенное ниже это не панацея, а способы приуменьшить негативное влияние на блог работы преступников.

А негативное влияние есть. Из-за того, что алгоритмы поисковиков не способны совершенно точно определить первоисточник текстового материала, санкциям зачастую подвергаются хорошие ресурсы, созданные для людей, а не для заработка на сапе или партнерских программах. Санкции включают в себя пессимизацию в выдаче, исключение из индекса поисковой базы, и как следствие, сильное сокращение количества переходов на блог.

Формат RSS был разработан, с целью предоставить пользователям Интернета возможность удобного получения информации. Разработан для того, чтобы комфортно развалившийся в своем любимом ридере пользователь, лениво просматривал заголовки RSS-лент, выбирая, на что же ему сегодня спустить рабочее время. К сожалению, контингент всемирной паутины учесть при внедрении этого формата было нельзя, и, создавая удобство читателю, RSS стал настоящим подарком для воров, в разы экономящим их время.

С помощью специальных программ, RSS-грабберов, преступники получают содержимое RSS-ленты ресурса и публикуют его на своем сайте, созданном для заработка на Sape. Чем больше украденного контента, тем больше страниц и больше денег у вора. Если поисковая система решит, что ворованный контент является дублем или нечетким дублем вашего блога (первоисточника), то заподозренные в воровстве страницы могут быть исключены из индекса, и, теоретически, должны перестать приносить прибыль мерзавцу. Но система Sape работает таким образом, что после первой проверки на проиндексированность страниц Яндексом, следующая проходит нескоро, и в течение этого времени на странице продолжают продаваться ссылки. Таким образом, вор, укравший у вас или меня материал, размещает его на своей странице, начинает продавать с нее ссылки в Sape, и продолжает, даже когда его страницу исключают из индекса. К тому времени, как страницу с ворованным содержанием исключат и из Яндекса и из Sape, преступник сможет пополнить свой сайт еще сотней страниц.

Программы RSS-грабберы, с помощью которых все это и делается, могут быть как простенькими, так и очень функциональными; они могут останавливаться на теге MORE, а могут получать полный фид даже если все ваши материалы отдаются анонсами; они могут ставить ссылку на первоисточник, а могут вычищать все HTML-теги из ленты; они могут микшировать содержимое нескольких лент для большей уникальности, и могут заменять слова синонимами, чтобы ворованные материалы не были признанны ворованными. Защитится от серьезных грабберов невозможно, разве что только отключить у себя RSS. Будем надеяться, что ваши и мои RSS-ленты воруются недалекими преступниками с помощью нехитрых программ, и что приведенные ниже методы помогут нивелировать негативное влияние воровства.

Так как предотвратить кражу через RSS нельзя, остается только: создать подтверждение своих авторских прав на материалы; использовать ворованные ресурсы в своих целях; сделать бессмысленной кражу контента за счет невозможности использовать материал.

Подтверждение прав

Есть несколько плагинов для WordPress, которые позволяют вставить в RSS-ленту свой копирайт. Так как по этому вопросу ко мне уже обратились несколько человек, то несколько таких плагинов я постараюсь рассмотреть в следующих постах, сейчас же расскажу только о том плагине, которым пользуюсь сам.

Плагин этот называется Simple Feed Copyright, и он очень прост. Все, что вам нужно сделать, это скачать плагин, открыть файл feednotice.php, и значение переменной $notice

$notice = '<p>&copy;' . date("Y") . ' <a href="' . get_bloginfo('url') . '">' . get_bloginfo('name') . '</a>. All Rights Reserved.</p>.';

заменить своим текстом. К примеру, у меня она выглядит так:

$notice = '<p><small>Copyright &#169; <a href="http://www.alexnote.ru" title="AlexNote - авторский блог о музыке, продвижении сайтов и блогосфере">www.AlexNote.ru</a> 2008. Все права на материалы принадлежат автору блога <a href="http://www.alexnote.ru" title="AlexNote - авторский блог о музыке, продвижении сайтов и блогосфере">www.AlexNote.ru</a>, и охраняются законом об авторском праве. Некоммерческое использование материалов возможно только при установке активной гиперссылки на блог автора. Коммерческое использование материалов возможно только при письменном разрешении автора.</small></p>';

С вставкой копирайта пока все, идем дальше. Предположим, что граббер преступника не умеет вырезать HTML-теги из ленты. В этом случае нужно сделать так, чтобы видимых ссылок в материале не было (на случай визуальной проверки), но явное указание на первоисточник — было. Для этого можно воспользоваться всплывающей подсказкой, которая будет появляться при наведении мышкой на слова «я», «блог», «AlexNote.ru», «автор» и тому подобные. Наведите курсор на любое из этих слов. Делается это через следующий код:

<span title="AlexNote.ru - авторский блог о музыке, продвижении сайтов и блогосфере"><span title="AlexNote.ru - авторский блог о музыке, продвижении сайтов и блогосфере">ваше слово</span></span>

Плюс этого метода в том, что вы явно указываете на себя как на автора, но всплывающая подсказка незаметна, и вполне может быть пропущена преступником.

Так как грабберы будут получать и старые посты, а не только новые, вставить всплывающую подсказку стоит в каждый пост, независимо от времени публикации. Для автоматизации процесса редактирования прошлых постов, можно воспользоваться плагином Search & Replace о котором я уже писал. В поле «Replace» введите я, обрамленную пробелами с обоих сторон, а в поле «with» введите код <span title=»AlexNote.ru»> я </span>.

А для будущих публикаций, сделайте себе заготовку кода в любом электронном блокноте, и вставляйте в пост по мере надобности.

Обратите внимание: пробелы с обоих сторон необходимы, чтобы не заменить буквы в словах. Плагин прекрасно понимает и пробелы, и запятые, так что смело используйте их, чтобы задать верные значения замены ( я — с пробелами между словами; я, — с запятой; я. — с точкой). «Я» здесь для примера, можно использовать любые нужные значения.

Но будьте аккуратны — текст для замены также ищется в артибутах title и alt к изображениям, что может испортить их отображение. Попробуйте выбрать достаточно частое слово, но не встречающееся в описании изображений. К слову говоря, это не обязательно должно быть слово — может быть символ, смайл, урл, фраза, кусок кода. Все, что угодно, лишь бы указывало на вас.

Использование в своих целях

Тут все просто — раз вор не умеет вырезать ссылки из ворованного материала, значит нужно в каждый пост вставлять как можно больше видимых или невидимых ссылок на свои страницы или свой блог. Блок ссылок, которые выводятся под постом (статьи по теме) с использованием плагинов плохо подходят, так как мои, к примеру, ленты, крадутся без такого блока. Ссылки лучше расставлять в содержимом поста.

Для автоматической расстановки можно воспользоваться авторасстановкой меток плагина Simple Tags (убей, не понял, как это работает), плагином Search & Replace, заменяя слова на ссылки на нужные страницы, или одним из плагинов для перелинковки страниц. Обзор таких плагинов будет позже опубликован, а сейчас могу сказать только, что ни один из них не умеет корректно работать с кириллицей. Если сделать слово блог ссылкой на какую-либо страницу, то заменятся и блог, и блоги, и блогосфера.

Лучше взять за привычку на регулярной основе ссылаться на свои страницы и свой блог в каждом посте в ручном режиме. Использование заготовок в электронном блокноте здорово сэкономит время и даст возможность всегда быть в курсе, на какие страницы можно сослаться.

Ссылками на блог или страницы должны быть и изображения, которые используются в постах. Зачастую к посту подбирается тематическая картинка, которая вставляется в полный размер и снабжается соответствующей подписью. Эту картинку стоит делать не статичной, как делают чаще всего, а ссылкой на сам пост. Для этого, при вставке рисунка в поле «URL ссылки» впишите урл публикуемого поста. При краже контента есть шанс, что украден будет и рисунок, ссылка с которого ведет на страницу вашего блога, что положительно повлияет на показатели вашего же блога, а кроме того, будет указанием на первоисточник.

Есть еще два небольших трюка, которые можно использовать с целью получить ссылку с ресурса вора. Так как большие изображения могут модерироваться преступниками и удалятся, можно после первого абзаца вставить не привычный рисунок стандартного размера, а прозрачный рисунок в формате .gif размером 1×1 пикселя, ссылка с которого ведет на страницу поста. Обнаружить его визуально невозможно, а ссылка с него — тоже ссылка.

Второй заключается в замене с помощью плагина Search & Replace всех смайликов на смайлики со ссылками. Если WordPress преобразовывает смайлики на вашем блоге в изображения — тем лучше, ссылку с них будет сложнее обнаружить. А если используются текстовые, то тоже не беда. Заменить нужно те смайлики, которыми вы пользуетесь, к примеру, :) на <a href=»http://www.alexnote.ru/»>:)</a> во всех постах, или в постах и в теле комментария. К плюсам такой замены относиться то, что напортачить очень сложно, так как смайлики нигде в коде не используются и ничего не пострадает.

Бессмысленность воровства

Для того, чтобы воровать было бессмысленно, нужно в RSS отдавать контент, отличающийся от контента поста. При этом, отличаться он должен незаметно для читателя. Есть два варианта сделать это.

Первый. Буквы или слова в RSS заменяются на прозрачные изображения с такой же буквой или словом. Благодаря этому, читатели видят тот же текст, который вы публикуете в блоге, но вор не сможет его использовать, так как текст на картинках поисковиками не читается, а без этого контент превращается в кашу, которая быстро вылетит из поискового индекса. А если граббер преступника удаляет HTML-теги, то даже прочитать получившийся компост будет трудно. Метод слишком трудоемкий, и плагинов для выполнения такой замены я не нашел. Не думаю, что они вообще есть.

Второй вариант прост — буквы русского алфавита заменяются на, аналогичные по виду, буквы английского алфавита. К примеру: о-o, а-a, Н-H, К-K и так далее. Сегодня поисковики без труда распознают такую подмену, и толку ворам от подобного контента нет, так как даже в индекс попасть у него мало шансов. Для выполнения этой задачи есть плагин написанный нашим соотечественником, ссылку на который не привожу, так как он платный. Я, конечно, не программист, но все же понимаю, что брать деньги за столь несложную работу, стыдно. На мой скромный взгляд (некоторые вон типографы бесплатно раздают). Так что если вы гениальный программист, то у вас есть шанс подарить блогосфере замечательный плагин. Который и не мешает читателям, и осложняет жизнь ворам.

Дополнение

При определении первоисточника материала, поисковые системы руководствуются множеством факторов, среди которых и время появления материала в индексе. Значимого веса время индексации не имеет, но даже это можно и нужно использовать в своем блоге. Кто не понял, о чем речь, поясняю. Когда вы публикуете пост, он моментально появляется в вашем блоге, а спустя несколько минут или часов отправляется по RSS в наши ридеры. Кроме нас, пост получает и вор, забирающий контент либо по крону (по своему расписанию), либо по факту появления его в RSS. Эту разницу можно использовать, так как за время, прошедшее между появлением вашего поста в вашем блоге и появлением его в RSS, поисковый робот может проиндексировать ваш блог, забрать новый материал, и впоследствии поисковой системе будет проще счесть дубликатом материал на сайт вора.

Для этого, нужно отсрочить время появления публикации в RSS. Чтобы сделать это, откройте файл functions.php находящийся в папке с темой вашего блога. У меня он вот такой:

<?php
if ( function_exists(‘register_sidebar’) )
register_sidebar(array(
‘name’ => ‘Сайдбар’,
‘before_widget’ => ‘<div><div>’,
‘after_widget’ => ‘</div></div>’,
‘before_title’ => ‘<h3>’,
‘after_title’ => ‘</h3>’,
));
//убираем лишнее в head
remove_action(‘wp_head’, ‘wlwmanifest_link’);
remove_action(‘wp_head’, ‘wp_generator’);
?>

И перед завершающим ?>, добавьте следующий код:

function pulish_later_on_feed($where) {
global $wpdb;
if ( is_feed() ) {
$now = gmdate(‘Y-m-d H:i:s’);
$wait = ‘3‘; // integer
$device = ‘HOUR‘; //MINUTE, HOUR, DAY, WEEK, MONTH, YEAR
$where .= » AND TIMESTAMPDIFF($device, $wpdb->posts.post_date_gmt, ‘$now’) > $wait «;
}
return $where;
}
add_filter(‘posts_where’, ‘pulish_later_on_feed’);

Здесь $wait = ’5′ — сколько ждать перед отправкой в RSS, а $device = ‘MINUTE’ — в чем измеряется задержка. Так как пост должен быть опубликован в RSS в тот же день, когда вы его написали (иначе потеряет актуальность, для вас или читателя), то лучше выставить задержку в несколько часов, не более.

Эта фора может оказаться полезной для вас, и не только в смысле определения первоисточника, но и просто для проверки поста. Нередко бывает, что опубликовав материал, находишь в нем несколько досадных ошибок, но в RSS он уже ушел, а значит и читатели эти ошибки увидели. Задержка отправки в RSS решает эту проблему. Техника подсмотрена здесь.

По словам Владимира, отложение публикации в RSS можно оптимизировать. В этом случае, вместо предложенного выше кода, нужно вставить в файл functions.php это:

function pulish_later_on_feed($where) {
global $wpdb;
if ( is_feed() ) {
// сколько ждать; + единицы измерения
$wait = ’3‘; // integer
$device = ‘HOUR‘; //MINUTE, HOUR, DAY, WEEK, MONTH, YEAR — минуты, часы, дни, недели, месяцы, года
$where .= » AND $wpdb->posts.post_date < DATE_SUB(NOW(), INTERVAL {$wait} {$device}) «;
}
return $where;
}

Заключение

Предотвратить воровство своих работ вы не можете. Пока нет механизмов определения первоисточника, будут страдать честные блоггеры, а воры наживаться на вашем труде. Используя хотя бы некоторые из предложенных методик, можно осложнить воровство материалов, или даже получить с этого определенные выгоды. Для этого на постоянной основе нужно:

  • Использовать всплывающие подсказки к тексту
  • В каждом посте ссылаться на блог или страницы блога
  • Делать изображения и смайлики ссылками на блог или страницы блога
  • Задерживать публикацию в RSS на пару-тройку часов
  • Придумать плагин для замены русских букв на английские

Вот все, что смог придумать я. Может и у вас есть какие-то решения?