Оптимизируем рутинную работу при помощи php.
Изучение php — это очень полезное дело не только для вебмастеров, но и для простых людей. Почему? — спросите вы. Все просто — при помощи php(да как и любого другого языка программирования) вы можете значительно упростить свою жизнь. Давайте ближе к делу. Хочу вам продемонстрировать пример упрощения своей деятельности при помощи функции file_get_contents.
Помните, когда где-то год назад ЖЖ начало продавать выпиленные аккаунты за 500 рублей, пошла мода на то, чтобы находить такие аккаунты с ненулевым ТИЦем и перекупать их. Естественно, что искать такие аккаунты вручную — это просто жуткое занятие, поэтому такую работу можно легко автоматизировать. В этой статье мы автоматизируем просо получение списка удаленных и забаненных аккаунтов из ЖЖ. Для начала давайте зайдем в сообщество, в котором есть много выпиленных блогов. Посмотрим профиль такого сообщества, точнее посмотрим на участников такого сообщества — _http://www.livejournal.com/tools/friendlist.bml?user=ru_seo&nopics=1 . Этот список выглядит просто страшно, так как там есть как живые, так и удаленные аккаунты. Что же их отличает? Заглянем в исходный код страницы — все удаленные и побаненные блоги заключены в теги <strike></strike>. От этого мы и оттолкнемся.
Чтобы миллион раз не менять код страницы, создадим форму, в которой мы сможем указывать адрес любого сообщества:
echo <<< EOT <FORM method=post> <INPUT class=inpt maxLength=100 size=100 name=url value='http://'> <INPUT type=submit name=send_request value=Определить реальную стоимость сайта><br></FORM> EOT; |
Далее нам нужно получить на этой же странице данные, введенные в форму:
$url=$_POST['url']; |
Получаем контент с введенной страницы и выбираем оттуда только то, что находится между тегами <strike></strike>:
$string = file_get_contents($url); preg_match_all("!<strike>(.*?)</strike>!si", $string, $out, PREG_PATTERN_ORDER); |
И далее выводим все полученные данные в удобный для нас список:
for ($i=0; $i< count($out[0]); $i++) { echo 'http://'.$out[1][$i]. '.livejournal.com<br>'; } |
В конечном счете получается, что вам будет выдан список адресов по 1 в каждой строке и вам останется только лишь проверить ТИЦ у всех этих блогов списком на любом удобном сервисе.
Вот такой од мы получили в конечном счете:
<? echo <<< EOT <FORM method=post> <INPUT class=inpt maxLength=100 size=100 name=url value='http://'> <INPUT type=submit name=send_request value=Определить реальную стоимость сайта><br></FORM> EOT; $url=$_POST['url']; $string = file_get_contents($url); preg_match_all("!<strike>(.*?)</strike>!si", $string, $out, PREG_PATTERN_ORDER); for ($i=0; $i< count($out[0]); $i++) { echo 'http://'.$out[1][$i]. '.livejournal.com<br>'; } ?> |
На предыдущей неделе резервы сократились на 3,7 миллиарда долларов. Телеканал ведет вещание в спутниковых и кабельных сетях. Там, в свою очередь, газете «Коммерсант» заявили, что при получении соответствующего запроса от ФСБ смогут установить подлинность пробирных клейм, чтобы отличить контрабандный товар от российского.
«Все превосходно понимают, что я никуда не уеду и не буду оказывать давление на свидетелей. Сама спортсменка заявила, что она сделает все, чтобы принять участие в Олимпиаде 2012 года. Лучший из россиян — Максим Вылегжанин — финишировал восьмым.