Just nu i M3-nätverket
Gå till innehåll

Sökmotor för PDF-filer på intranät


ivanavi

Rekommendera Poster

Hej

 

Läget: Intranät med dokumentkatalog innehållande enbart PDF-dokument.

 

Fråga: Tips på kod/script eller semifärdiga lösningar för att kunna söka (via formulär på webbsida) i ovan katalog samt presentera resultatet med klickbara länkar till dokumenten.

 

Krav: Ska kunna söka svenska ord samt söka på innehållet i PDF-dokumenten. Helst fria lösningar (freeware).

 

Har tittat på ett antal lösningar presenterade på webben, men det verkar som om ingen riktigt fixar det här med PDF.

 

Välkommen att svara.

 

Mvh

ivanavi

 

Länk till kommentar
Dela på andra webbplatser

johan pålsson

Om, man antar att du kör IIS (annars hade du väl inte skrivit i ASP-forumet ?), så kan du ladda ner ett kostnadsfritt filter från Adobe.

Det heter Adobe PDF IFilter:

 

http://www.adobe.com/support/downloads/detail.jsp?ftpID=2611

 

Vad den gör är att den integreras i index server (en funktion i windows) och den kan då indexera text inuti PDF:er vilken då blir sökbar.

(Det finns liknande filter för office-filer också)

 

För att göra sökningar anropar du sedan något som heter IXXSO, du hittar säkert massvis med kodexempel på Google.

 

 

/Johan

 

 

Länk till kommentar
Dela på andra webbplatser

Hej

Sökte på ixxso, men kunde inte få upp något vettigt. Hittade lite på Microsoft om hur man applicerar iFilter, men inte hur man gör en enkel sökning som gäst på intranätet...

 

Förresten, funkar iFilter med MS Sharepoint Teamservices?

 

Länk till kommentar
Dela på andra webbplatser

johan pålsson

Hej !

 

Här finns exempelvis en liten guide:

http://www.codeproject.com/asp/indexserver.asp

 

Men, kom ihåg att indexserver indexerar filer, dvs. htm, html, PDf osv..

Den vet ingenting om databaser, det måste du själv lägga till i den sida som presenterar sökresultatet.

 

 

Förresten, funkar iFilter med MS Sharepoint Teamservices?

 

Ja, jag skulle tro det (kör inte Sharepoint själv), kolla här exempelvis:

http://weblogs.asp.net/jan/archive/2004/05/19/135273.aspx

 

 

/Johan

 

 

Länk till kommentar
Dela på andra webbplatser

  • 2 months later...

Tack! Toppen! Nu funkar det.

Dock, jag har stött på nytt problem...

Jag vill kunna indexera inte bara innehållet i PDFdokument, utan även samma meta taggar som Indexing Server hämtar från t ex Word-dokument. Jag tänker på meta taggar som doccomments, doctitles etc. som normalt cachas av Indexing Server för M$-dokument.

Problemet verkar ligga i att iFilter (eller om det är Indexing Server) inte cachar dessa meta taggar för PDF-filer. Är det något man kan konfigurera i ifilter? Eller är det bara så att adobes ifilter inte fixar att hämta dessa metataggar från sina egna dokumenttyper? Ibland går det med t ex metataggen doctitle, men då hämtar den infot inifrån pdf-filen och inte den infon som står under egenskaper/avancerat för pdf-filen. Ujujuj, är det någon som har någon ledtråd?

 

Mvh

ivanavi

 

 

Länk till kommentar
Dela på andra webbplatser

Arkiverat

Det här ämnet är nu arkiverat och är stängt för ytterligare svar.

×
×
  • Skapa nytt...