Just nu i M3-nätverket
Jump to content

html-version av PDF


Astmatic
 Share

Recommended Posts

Hej, är det någon här som har koll på om google cachar om html-versionen av pdf-filer på nätet? Det är nämligen så att jag bytat ut pdf-filen (men inte ändrat namnet) eftersom det blev något problem när Diva skulle skapa en ny länk (jaja, det är en lång historia). 

 

Det handlar om nedanstående URL, och skriver man cache: framför så kommer jag inte in. Det gjorde jag för några dagar sedan (till den felaktiga versionen, men det går inte nu, vilket är bra). 

 

https://www.diva-portal.org/smash/get/diva2:1446208/FULLTEXT01.pdf

 

Men när jag söker via google sök (till exempel på namnet på uppsatsen) så kan jag komma in på cachen (html-versionen) via den lilla pilen uppe till höger och då visas den felaktiga kopian. Är detta något som google uppdaterar för även om det bara är väldigt små förändringar så stör det mig.

 

Jag äger inte sidan så jag kan inte använda search console heller. Jag har försökt att använda mig av inaktuell sida, men det nekas jag. 

Link to comment
Share on other sites

Nej, det har inte med uppsatsadministrationen att göra. Det har med google och deras cachsystem, deras crawl (googlebot). Institutionen kan inte gå in i google och cacha om sidan (få rätt html-version). De skulle möjligtvis kunna gå in i Search console men det blir bara en liten tidsvinst och det gör mig inget. Jag vill mer veta om Goggle cachar  PDF-filer, eller om deras cache på något sätt skulle vara statiskt. 

 

Tack för att du försökte hjälpa mig:)

Link to comment
Share on other sites

Ja, det stämmer att Google cachar pdf-filer. Jag tror inte cachen är statisk utan den ändras förmodligen när Google crawlar igen. Nu dröjer det nog innan detta sker för din publicering är ju ganska färsk. När jag klickade på den nedåtpekande cachepilen och därefter valde "Version med endast text" fick jag upp: "Det här är Googles cachelagrade version av http://www.diva-portal.org/smash/record.jsf?pid=diva2:1446208. Det här är en ögonblicksbild av hur sidan såg ut den 17 sep 2020 09:23:07 GMT. Den aktuella sidan kan ha ändrats sedan dess."

 

"24 juni 2020
Note
Examinator har godkänt att fulltexten byts ut på grund av en smärre justering som inte påverkar uppsatsens innehåll. Gävle 12 augusti 2020.

Available from: 2020-06-25 Created: 2020-06-24 Last updated: 2020-09-10 Bibliographically approved"

Edited by mbgtmari
Link to comment
Share on other sites

Jag klickar på https://www.diva-portal.org/smash/get/diva2:1446208/FULLTEXT01.pdf

Inga problem.

 

Om du vill ta bort information från Google Cache, se detta från Google:

https://support.google.com/webmasters/answer/633238

Mvh

 

Ps. Se också denna:

Bluetrain: How to Remove Private, Outdated, or Duplicate Content from Google

Edited by Flyfisherman
Redigerat lite
Link to comment
Share on other sites

2 minuter sedan, skrev Flyfisherman:

Ja det beror på.

Tex. Microsoft Bing är det tydligen inte så lätt men det går:

Chron: How to Remove Personal Information on Bing

Bing.com How can I get a page on my site out of the Bing index?

 

Det var en retorisk fråga. Vill uppmärksamma att det blir lite jobb om man ska få allt rätt på nätet. ?

  • Like 1
Link to comment
Share on other sites

Jo jag förstod det :)

För Yahoo Remove search results from Yahoo Search

Ännu svårare... och cache pratar man inte ens om.

 

I allt övrigt oavsett vad man anser om Google, så verkar det åtminstone vara den lättaste sökmotorn att ta bort cachen från (se mitt inlägg ovan).

Edited by Flyfisherman
Lagt till text
Link to comment
Share on other sites

 Share



×
×
  • Create New...