Just nu i M3-nätverket
Gå till innehåll
ivanavi

Sökmotor för PDF-filer på intranät

Rekommendera Poster

ivanavi

Hej

 

Läget: Intranät med dokumentkatalog innehållande enbart PDF-dokument.

 

Fråga: Tips på kod/script eller semifärdiga lösningar för att kunna söka (via formulär på webbsida) i ovan katalog samt presentera resultatet med klickbara länkar till dokumenten.

 

Krav: Ska kunna söka svenska ord samt söka på innehållet i PDF-dokumenten. Helst fria lösningar (freeware).

 

Har tittat på ett antal lösningar presenterade på webben, men det verkar som om ingen riktigt fixar det här med PDF.

 

Välkommen att svara.

 

Mvh

ivanavi

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
johan pålsson

Om, man antar att du kör IIS (annars hade du väl inte skrivit i ASP-forumet ?), så kan du ladda ner ett kostnadsfritt filter från Adobe.

Det heter Adobe PDF IFilter:

 

http://www.adobe.com/support/downloads/detail.jsp?ftpID=2611

 

Vad den gör är att den integreras i index server (en funktion i windows) och den kan då indexera text inuti PDF:er vilken då blir sökbar.

(Det finns liknande filter för office-filer också)

 

För att göra sökningar anropar du sedan något som heter IXXSO, du hittar säkert massvis med kodexempel på Google.

 

 

/Johan

 

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
ivanavi

Hej

Sökte på ixxso, men kunde inte få upp något vettigt. Hittade lite på Microsoft om hur man applicerar iFilter, men inte hur man gör en enkel sökning som gäst på intranätet...

 

Förresten, funkar iFilter med MS Sharepoint Teamservices?

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
johan pålsson

Hej !

 

Här finns exempelvis en liten guide:

http://www.codeproject.com/asp/indexserver.asp

 

Men, kom ihåg att indexserver indexerar filer, dvs. htm, html, PDf osv..

Den vet ingenting om databaser, det måste du själv lägga till i den sida som presenterar sökresultatet.

 

 

Förresten, funkar iFilter med MS Sharepoint Teamservices?

 

Ja, jag skulle tro det (kör inte Sharepoint själv), kolla här exempelvis:

http://weblogs.asp.net/jan/archive/2004/05/19/135273.aspx

 

 

/Johan

 

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser
ivanavi

Tack! Toppen! Nu funkar det.

Dock, jag har stött på nytt problem...

Jag vill kunna indexera inte bara innehållet i PDFdokument, utan även samma meta taggar som Indexing Server hämtar från t ex Word-dokument. Jag tänker på meta taggar som doccomments, doctitles etc. som normalt cachas av Indexing Server för M$-dokument.

Problemet verkar ligga i att iFilter (eller om det är Indexing Server) inte cachar dessa meta taggar för PDF-filer. Är det något man kan konfigurera i ifilter? Eller är det bara så att adobes ifilter inte fixar att hämta dessa metataggar från sina egna dokumenttyper? Ibland går det med t ex metataggen doctitle, men då hämtar den infot inifrån pdf-filen och inte den infon som står under egenskaper/avancerat för pdf-filen. Ujujuj, är det någon som har någon ledtråd?

 

Mvh

ivanavi

 

 

Dela detta inlägg


Länk till inlägg
Dela på andra webbplatser

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Skapa ett nytt konto på vårt forum. Det är lätt!

Registrera ett nytt konto

Logga in

Redan medlem? Logga in här.

Logga in nu



×
×
  • Skapa nytt...