Ну а где они могут быть? Если бы это
совсем левые страницы, я бы еще может и
подумал, что если не внутри сайта есть
ссылки на них, то конкуренты
постарались, а то же нет - на нескольких
сайтах появляются get-запросы
конкретных страниц другого сайта.
То есть например имеем на сервере 3
сайта: site1.ru, site2.ru, site3.ru
На первых двух идут get-запросы урл-ов
3-го сайта.
То есть например на сайте site3.ru имеются
страницы: site3.ru/1-stranica.html site3.ru/2-stranica.html
... site3.ru/n-stranica.html
вот именно эти страницы регулярно
запрашиваются на сайтах site2.ru и site1.ru.
То есть в логах этих хостов нахожу
запросы этих страницы, например в логе
site1.ru.access.log каждый день с завидной
регулярностью и частотностью
появляются записи типа:
... "GET /1-stranica.html..."
...
... "GET /5-stranica.html..."
...
... "GET /n-stranica.html...
а если посмотреть например в google webmastertools? гугл показывает источник ссылки, если ловит 404.