Igen idag havde mine kollegaer og jeg en super dialog omkring nogle af de problemer vi har med dublicate content.
Når man som mig er statistik nørd, vil man gerne kunne tracke præcist hvad der klikkes på, ikke bare hvilken side men også hvor på siden. Det er her vi har nogle af vores udfordringer. Vi bruger Google analytics, og det er et fantastisk lille stykke værktøj, der er ikke det man ikke kan se og måle på.
Forestil jer følgende:
vi har en side der hedder http://www.computerworld.dk/art/52005/her-er-de-10-mest-betydningsfulde-danske-spil, det er den side som er vores primære side og den vi gerne vil have Google til at finde. For at finde denne side på computerworld.dk er der flere forskellige links:
1: Tophistorie
2: Seneste nyt
3: Mest læste seneste uge
4: Mest læste igår
5: Mest læste lige nu
6: Computerworld newsletter
7: link fra anden artikel
Alle disse forskellige indgangsvinkler til artikelen er jo som udgangspunkt helt fantastisk. Men…. Her har vi et problem. Vi tracker alt! For at vi kan se hvorfra man kommer ind på artiklen tilføjes et parameter, ?a=block&i=224&pos=1, lige præcis dette parameter gør at jeg kan se at det kommer fra øverste link i mest læste lige nu boksen der ligger i bunden af computerworld.dk. Det er pisse fedt at vi kan se det… Det er ikke pissefedt at det betyder at hver artikel har minimum 7 forskellige url’s. Hver eneste af de ovenstående indgange til artiklen tilføjer et nyt parameter.
Det helt store spørgsmål er så hvordan kan vi undgå dublicate content, når vi samtidig vil måle alt?
Jeg er jo ikke udvikler, så jeg har en naturlig begrænsning i forhold til hvad der kan gøres rent kodemæssigt for at undgå at indsætte disse parametre. Nu har vi sparket tankerne igang hos os alle og jeg føler mig ret overbevist om at drengene nok skal komme op med løsningen.
Skulle der læse en med der har svaret, så fyr løs !
Henrik
Tags: arbejde, dublicate content, google, SEO
Hej Henrik.
Den eneste måde jeg kender til, er ved hjælp af canonical tag. Det går kort sagt ud på, at fortælle Google, hvilket url der er det “forestrukne”. Når Google kan se det, vil du ikke blive straffet for de andre indgange der nu er, til den pågældende artikel/nyhed
Guide her:
http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html
“Carpe diem on any duplicate content worries: we now support a format that allows you to publicly specify your preferred version of a URL. If your site has identical or vastly similar content that’s accessible through multiple URLs, this format provides you with more control over the URL returned in search results. It also helps to make sure that properties such as link popularity are consolidated to your preferred version.”
Cannonical er en mulighed, men har bare oplevet at det ikke virker 100%.
Ellers tak for svaret
Henrik