Volltextsuche in .doc, .pdf, .xls usw.

23/12/2007 - 09:59 von andi rickenbach | Report spam
Hallo,

ich arbeite mit vb.net, sowie SQL-Server 2005 und/oder MS Access.

Ich möchte Dateien wie .doc, .pdf, .xls, .txt usw. schnell nach gewissem
Text duchsuchen können ob das Suchwort in dem Dokument vorkommt oder nicht.
Dies muss möglichst schnell gehen.

Der ganze Text eines Dokumentes in die Datenbank zu lesen denke ich macht
keinen Sinn, da wenn das Dokument jemand geàndert hat, müsste man es ja
jedesmal wieder einlesen.

Wie mache ich das am besten oder wie geht so etwas? Ich habe mal etwas von
IFilter im Zusammenhang mit SQL-Server gehört! Wàre das ev. eine Möglichkeit?
Hat da jemand Erfahrung? Ginge das auch mit MS Access?

Ich habe auch in der MSDN einen Artikel (FileTextSearcher) gefunden.
http://www.microsoft.com/germany/ms...x?mfr=true
Klick auf "Nach einer Datei mit einem bestimmten Textinhalt suchen"
Dies funktioniert soweit zwar gut, ist aber recht langsam! Z.B. ein Pdf
durchsuchen welches noch bilder drin hat, geht sehr lange.

Für Tipps und Tricks wàre ich euch sehr dankbar.

Wünsche allen schöne Feiertage.
 

Lesen sie die antworten

#1 Stefan Falz [MVP]
26/12/2007 - 23:33 | Warnen spam
Hallo Andi,

"andi rickenbach" schrieb

Ich möchte Dateien wie .doc, .pdf, .xls, .txt usw. schnell nach gewissem
Text duchsuchen können ob das Suchwort in dem Dokument vorkommt oder nicht.
Dies muss möglichst schnell gehen.



Nimm den Indexserver. Der kann das zuverlàssig und vor allen Dingen meist
auch recht schnell erledigen.

Der ganze Text eines Dokumentes in die Datenbank zu lesen denke ich macht
keinen Sinn, da wenn das Dokument jemand geà¤ndert hat, mà¼sste man es ja
jedesmal wieder einlesen.



Das ist bei allen gàngigen Programmen dieser Art so. Den Volltext zu speichern
macht IMO aber auch wenig Sinn, da bspw. bei HTML Dateien der eigentliche Inhalt
oft weniger Zeichen benötigt als das "drumherum".

Wie mache ich das am besten oder wie geht so etwas? Ich habe mal etwas von
IFilter im Zusammenhang mit SQL-Server gehört!



Nö.

Aber schau dir mal: http://incubator.apache.org/lucene.net/ ff. an.

Tschau, Stefan
Microsoft MVP - Visual Developer ASP/ASP.NET
http://www.asp-solutions.de/ - Consulting, Development
http://www.aspnetzone.de/ - ASP.NET Zone, die ASP.NET Community

Ähnliche fragen