Генератор запросов для парсинга

Каждый дорвейщик знает, чем лучше база для спама постинга в дружественные ресурсы, тем больше в конечном итоге можно съесть бутербродов с икрой.

Наша задача попробовать собрать базу.

Для этого нам потребуются запросы для парсинга поисковых систем (в нашем случае гугла)

Для парсинга нам надо знать следующие спец. запросы, которые обрабатывает гугл

inurl - поиск указанной строки в урле документа

intitle - поиск строки в тегах <title>

intext - банальный поиск в контенте страницы

site - поиск сайтов в указаной доменной зоне

Все эти специальные макросы указываются с разделителем : (двоеточие)

Например

inurl:add_entry.php site:com intitle:"Add comment"

Что будет делать этот запрос?

Думаю всем понятно: поиск в гугле гестбуков в зоне com у которых в заголовке страницы будет текст Add comment

Конечно можно самому сидеть и составлять такие запросы, НО

Предлагаю вам воспользоваться моим маленьким скриптиком,

который облегчит жизнь и позволит автоматически генерировать запросы для парсинга (конечно по заданным параметрам)

Та-дам

 
<?
if(isset($_POST['GO']))
{
	$urls	 = array_unique(explode("n", $_POST['urls']));
	$minus	 = array_unique(explode("n", $_POST['minus']));
	$titles	 = array_unique(explode("n", $_POST['titles']));
	$domains = array_unique(explode("n", $_POST['domains']));
	$intext  = array_unique(explode("n", $_POST['text']));
	$url_count 		= count($urls);
	$minus_count 	= count($minus);
	$titles_count 	= count($titles);
	$domains_count 	= count($domains);
	$intext_count 	= count($intext);
	for ($i = 0; $i &lt; $url_count; $i++)
	{
		for ($ii = 0; $ii &lt; $minus_count; $ii++)
		{
		for ($iii = 0; $iii &lt; $titles_count; $iii++)
		{
		for ($iiii = 0; $iiii &lt; $domains_count; $iiii++)
		{
		for ($iiiii = 0; $iiiii &lt; $intext_count; $iiiii++)
		{
			echo 'inurl:'.$urls[$i].
                                         ' intitle:'.$titles[$iii].
                                         ' intext:'.$intext[$iiiii].
                                         ' site:'.$domains[$iiii].'';
		}
		}
		}
		}
	}
	die();
}
?>
 

Все это можно скачать в архиве, там уже с готовым html кодом
Скачать генератор запросов для парсинга гугла
На супер актуальность не претендую, скрипт выкладывается как есть, кто хочет модернизирует его под себя ;)
1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 5 out of 5)

Loading ... Loading ...

One Response to “Генератор запросов для парсинга”

  1.   Социалка на базе shared items Гугл ридера by ADNE Says:

    […] Генератор запросов для парсинга […]

Leave a Reply