bestimmte urls vor google index sperren

  • Ersteller Ersteller gelöschter Benutzer
  • Erstellt am Erstellt am
G

gelöschter Benutzer

Guest
ich habe eine website, nennen wir sie www_xyz_de. nun habe ich etliche unterseiten wie z.b. www_xyz_de/abc/*. zu updates dieser unterseiten erstelle ich auf der startseite jeweils einen news artikel. leider werden diese news artikel von google eher aufgegriffen und in der suche angezeigt als die unterseiten selbst.

das resultiert also darin, dass bei treffern eher www_xyz_de/news/artikel angezeigt wird, anstelle von www_xyz_de/abc/artikel.

wie kann ich nun veranlassen, dass www_xyz_de/news und alles dazugehörige nicht mehr in der suche auftauchen? ich nutze übrigens joomla.
 
  • Thread Starter Thread Starter
  • #3
mal kurz nach dem ersten blick, ich habe keinen doppelten content.

www_xyz_de/news/artikel
www_xyz_de/abc/artikel

sind nicht die gleichen seiten. es sind unterschiedliche, deswegen soll ja nicht auf die news seite verlinkt werden, da dort nur eine zusammenfassung vond er startseite erscheint und nicht der gesamte artikel, den ich auf einer unterseite habe.
 
Wenn dein Content nicht doppelt wäre, hättest du dein Problem nicht. Eine Seite mit einer Zusammenfassung ist doppelter Content.
 
  • Thread Starter Thread Starter
  • #5
alles klar, dann entschuldige mein zweites nachfragen und danke für deine hilfe. :)
 
leider werden diese news artikel von google eher aufgegriffen und in der suche angezeigt als die unterseiten selbst.
Solltest Du News-anreisser-seiten meinen, hilft da canonical herzlich wenig, sondern ein meta-element mit no-index,follow auf der nicht zu indizierenden Seite.
 
Google bevorzugt die Seiten, die als canonical angegeben werden und zeig diese in den Suchergebnissen.

"Including a rel=canonical link in your webpage is a strong hint to search engines your about preferred version to index among duplicate pages on the web. "
"Make sure you’d prefer the rel=canonical URL to be displayed in search results (rather than the duplicate URL)"
"Remember that the canonical designation also implies the preferred display URL. Avoid adding a rel=canonical from a category or landing page to a featured article."


Das erste Zitat spricht genau das Problem des Threads an.
 
Das würde bedeuten, dass man für jede "featured" oder temporäre News den (meta-) canonical Link der nicht zu indizierenden Seite ändert. Das kann man mit noindex einfacher haben (sofern die Seite keine oder wenig andere "wichtige" Infos enthält)
Ich lese aus der Beschreibung nicht raus, dass Crawler bei einem als canonical gesetzten Link automagisch alle anderen Seiten mit identischem Inhalt ignorieren.

Mal zur Verdeutlichung:
[src=html4strict]Startseite
<link rel="canonical" href="http://www.example.org/" />
Link zur aktuellen News mit rel="aktuelle news 0815"
Überschrift
Newstext (oder Anreisser Newstext)[/src]

[src=html4strict]"Echte" Newsseite
<link rel="canonical" href="http://www.example.org/aktuelle news 0815" />
Überschrift
Newstext[/src]

Ich bezweifle, dass hier canonical irgendwas richtet...
 
Das ist auch falsch herum. Der canonical Link führt zu der primären Quelle, auf der primären Quelle brauchst du diesen Tag natürlich nicht.

Wenn der volle Artikel auf der Seite A: "http://www.example.org/artikel/loremipsum" zu finden ist und ich eine Seite B:"http://www.example.org/shorts/loremipsum" habe, dann schreibe ich auf die Seite B:
Code:
Expand Collapse Copy
 <link rel="canonical" href="http://www.example.org/artikel/loremipsum" />

Dann weiß die Suchmaschine, dass der Inhalt der Seite B, auf dem Inhalten basiert, die es schon auf Seite A gibt.

Man kann Seiten mit diesem Tag so aus den Ergebnissen fern halten, ohne dass man sie entwertet und aus dem Index nimmt. Ggf. linkt ja auch jemand auf die Zusammenfassung o. ä. dann kann Google diesen Link für den richtigen Artikel werten.
 
Kannst Du Dir bitte die Mühe machen, und meinen letzten Beitrag nochma intensiv lesen und auch die nicht gestellten Fragen beantworten, statt mir zum x-ten Male erklären zu wollen, was canonical ist?
 
Ich kann sehen dass wir hier vielleicht einen Missverständnis auferlegen sind, aber ich mach mir gar keine Mühe mehr wenn ich wie'n Arschloch behandelt werde.
 
  • Thread Starter Thread Starter
  • #13
robots.png

so habe ich das nun gelöst bekommen. hatte im grunde nur die option nicht gesehen, bzw. nicht gekannt. 'no index, follow' war in meinem fall das gewünschte ergebnis.
 
wenn ich wie'n Arschloch behandelt werde.

Wie meinen? Ich hab garnich gesagt, dass ich das Gefühl hab, dass Du in jedem 2. Thread irgendwelchen themenfremden substanzlosen Quatsch abkippst?

--- [2014-12-18 00:08 CET] Automatisch zusammengeführter Beitrag ---

Anhang anzeigen 28573

so habe ich das nun gelöst bekommen. hatte im grunde nur die option nicht gesehen, bzw. nicht gekannt. 'no index, follow' war in meinem fall das gewünschte ergebnis.
das machst Du hoffentlich nicht bei der Einstellung für den aktuellen Artikel, dann wird der nämlich erst recht nur auf der Startseite indiziert. Kannste da mal bisschen mehr Infos bringen?

Edit: Du kannst mir auch die Links zu den betroffenen Seiten per PN schicken, hier im Thread wird leider nicht eindeutig klar, was genau das Problem ist...
 
Zuletzt bearbeitet:
So, hab mir das Problem mal angeschaut und kann bestätigen, dass es sich NICHT um duplicate Content handelt.

Nochmal als Kurzfassung es gibt eine News mit Text A zu Gegenstand XY mit Text B, diese news wird von Google gefunden oder höher gewichtet als der Gegenstand selbst.
 
Stelle das Indexieren der Übersichtsseite /news aus, erlaube aber exkplizit dem Crawler das Folgen von Links auf der Seite follow und aktiviere das Indexieren der Unterseiten. Wie das funktioniert, findest du, wenn du nach Robots.txt suchst.
 
  • Thread Starter Thread Starter
  • #17
Doppelter Content ist übrigens bei Google gar nicht mehr so schlimm, seit dieses Social-Media-Krams mit Sharing aufgekommen ist. Auf tumblr wird auch indiziert und da ist ca. 50% doppelter Content. Trotzdem stehen viele tumblr-Blogs bei gewissen Suchanfragen relativ weit oben auf der Liste.

Erklärung, die sich ganz gut anhört, hier:
 
Zurück
Oben