Google индексировал мои страницы escaped_fragment

Мой сайт - одностраничное веб-приложение. Я следую рекомендациям, основанным на выполнении сканирования AJAX-приложений .

My URL looks like this:

http://domain.com/#!pages/contactUs

Я понимаю:

http://domain.com/#!chair/12 goes to http://domain.com/?_escaped_fragment=chair/12

As I am not using any server-side scripting on this project, I have created HTML pages with the application states and put them in a folder like so:

http://domain.com/htmlFiles/1.html

В Apache я направил запросы, которые включают _escaped_fragment _ = на нужную страницу html:

RewriteEngine on
RewriteCond %{QUERY_STRING} ^_escaped_fragment_=chair\/([\w]*)
RewriteRule ^(.*)$ htmlFiles/%1.html? [R=302,L]

Пересылка работает правильно, и соответствующая страница отображается, если используется URL _escaped_fragment .

Карта сайта, которую я отправил в Google, выглядит следующим образом:


http://domain.com/#!pages/contactUs
2012-12-30
weekly
0.8

Теперь проблема заключается в следующем: моя целая папка htmlFiles ( http://domain.com/htmlFiles/1.html ) с файлами HTML индексируется в Google. Эти страницы есть, прежде всего, для того, чтобы показать Google, какой контент содержат мои фактические страницы.

Весь мой сайт работает с

http://domain.com/

Эти страницы не должны появляться в результатах поиска. Как они сказали, они будут индексировать довольно URL-адреса, но все же я не хочу, чтобы они удаляли эти страницы, поскольку я не знаю, будет ли это мешать другому.

Может быть, 302 не является правильным переадресацией и 301 следует использовать вместо этого?

Кроме того, что-то не так с этим вопросом переадресации в первую очередь?

2
nl ja de

1 ответы

Как указано в спецификации Google, вы можете использовать перенаправление 302 (но не 301), когда вы вызываете вас с помощью _escaped_fragment_ =, чтобы предоставить им контент. Проблема, которую я мог видеть в вашей реализации, состоит в том, что, может быть, ваши HTML-файлы содержат некоторые ссылки, относящиеся к перенаправленной странице, или которые указывают непосредственно на другие HTML-файлы. Например, если у вас есть href в вашем HTML-файле, который указывает на что-то вроде http://yourdomain.com/htmlFiles/1.html (или 1.html в относительном ключе), эта страница будет индексироваться Google.

Короче говоря, я говорю, что, начиная с вашей карты сайта, Google должен правильно индексировать ваши страницы, но когда Google использует ссылки, предоставленные вашими HTML-файлами, Google, возможно, индексирует их напрямую, не связывая их с оригинальным #! URLs.

Здесь у вас есть различные решения для решения вашей проблемы:

  1. Don't use redirection. In your case it seems unnecessary, you could directly send the HTML files to Google when they request them. Just remove the R flag in your Apache rewrite rule. Moreover, this solution will avoid unnecessary round trip between Google and your server due to the redirection mechanism. It will save you (and Google) bandwidth and CPU cycles.

  2. Verify that your HTML files have the correct links in the different href. If they all point to your #! version, it should work.

  3. Add on each of your HTML files a canonical link to your content in #! (http://support.google.com/webmasters/bin/answer.py?hl=en&answer=139394). This could help Google to know what the correct URL to index.

Примечание. Каждое из этих решений должно работать индивидуально, но вы также можете объединить их часть и даже все из них.

2
добавлено
Спасибо, из того, что вы упомянули, я думаю, что R вызывает проблему, потому что страницы не дают никаких ссылок .html. Тем не менее, я делаю полную переписывание, так что все дело доходит до index.php и на основе на escaped_fragment динамически выводит контент. Изучение трудного пути. SEO должен быть встроен в веб-приложение во время его создания, а не что-то, что попадает на сайт после его создания. Ура! :)
добавлено автор Ismael, источник
SEO chat
SEO chat
5 476 участник(ов)

Чат про SEO. Speak Russian! Др.чаты: @ppcchat @uiux_chat @devschat @smmhell Работа: @seohr Канал: @seolife Аудит: tpv.sr/1QoBSBb Стата: tpv.sr/1QoBMrK/ Запрещено: - мат и брань - команды ботам - реклама, вакансии - религия, политика, наркота, крипта