Volltextsuche in Dokumenten
Aktuelle Änderungen |
|
03.11.2023 |
Kapitel 2: Informationen zu den Elementen, die bei der Volltextsuche durchsucht werden, ergänzt. |
1 Über dieses Dokument
Hintergrund zur Volltextsuche in Dokumenten bei Einsatz von Dokumentenablage oder DATEV DMS.
2 Volltextsuche
Das Dokument wurde bereits in DATEV DMS / Dokumentenablage abgelegt und Sie wissen lediglich, welcher Text im Dokument enthalten sein soll. Die Volltextsuche durchsucht:
-
den Inhalt der Dokumente
-
das Feld Notiz in den Eigenschaften eines Dokuments
-
nur DATEV DMS: den Dateinamen der Elemente einer Dokumentstruktur / Vorgangmappe
-
nur DATEV DMS: die Haftnotizen, die auf Dokumenten angebracht sind
Die Liste der angezeigten Dokumente wird auf die Dokumente reduziert, in denen der gesuchte Begriff enthalten ist.
Wie Sie die Volltextsuche durchführen, lesen Sie in folgendem Dokument: Dokumente per Volltextsuche suchen (Dok.-Nr. 1006738)
3 Indexierung
Die Volltextrecherche benötigt eine Indexierung des Dokuments. Dabei werden sämtliche Wörter des Dokuments „erkannt“ und in die Datenbank übertragen. Beim Speichern eines Dokuments in DATEV DMS / Dokumentenablage erfolgt diese Indexierung automatisch.
Wenn Sie die Volltextsuche auch für bereits abgelegte Dokumente nutzen möchten, müssen Sie den Volltext für diese Dokumente neu ermitteln lassen. Wählen Sie dazu in DATEV DMS / Dokumentenablage im Menü Bearbeiten | Volltext ermitteln (Achtung - Administrator-Rechte erforderlich!).
4 Sinnvolle Wörter
Nach der Indexierung können Sie den erkannten Text nach „sinnvollen“ Wörtern durchsuchen.
Beispiel: In dem Dokument befindet sich das Wort „Kostenrechnung“. Eine Suche nach „Kosten“ und eine Suche nach „Rechnung“ findet das Schreiben. Eine Suche nach „Kost“ oder nach der Buchstabenkombination „enrech“ findet nichts. |
5 Stoppwörter
Vom SQL-Server werden sogenannte Stoppwörter (häufig vorkommende, für die Suche nutzlose Zeichenfolgen wie z. B. „in“, „an“, „um“ etc.) nicht berücksichtigt, um den Index nicht unnötig aufzublähen.
6 iFilter
Die Ermittlung des Volltextes wird für Office-Formate und PDF-Dokumente durch den iFilter des Herstellers Microsoft durchgeführt. Der ermittelte Volltext wird anschließend in die Volltext-Datenbank geschrieben. Office-iFilter werden durch Microsoft Office oder durch das Microsoft Office Filter Pack mitgebracht. Der PDF iFilter ist ein Windows-Bestandteil.
iFilter über Software von Drittanbietern
Sie können zwar andere Office- und / oder PDF-iFilter, z. B. durch Software von Drittanbietern verwenden. Diese iFilter von Drittanbietern können allerdings zu einer Funktionseinschränkung der DATEV Volltexterkennung bei den betroffenen Dokumenttypen führen. Es kann passieren, dass dadurch kein Volltext mehr übertragen wird. |
7 Regeln der Volltextsuche
-
Sie können Begriffe in beliebiger Reihenfolge und beliebiger Anzahl eingeben. „Paula Privat-Muster“ wird gefunden mit „privat muster“ und auch mit „muster privat“.
-
Zu suchende Begriffe müssen Sie genau in der Schreibweise, wie sie im Dokument vorkommen, eingeben.
-
Satzzeichen und Bindestrich müssen Sie nicht eingeben.
-
Sie können auf Groß-/Kleinschreibung verzichten.
-
Bei der Suche nach Zahlen muss der Wert exakt angegeben werden, z. B. 50000. Es genügt nicht, nur 500 einzugeben, um 50000 zu finden.
8 Suchparameter
Folgende Suchparameter stehen zur Verfügung:
Suchparameter |
Auswirkung |
AND oder & |
|
AND NOT oder &! |
|
OR oder | |
|
" " |
|
* (Wildcard) |
|
Sie können mehrere Suchparameter kombinieren.
Beispiel: Kombination der Suchparameter AND, " " und Wildcard: Eine Suche nach "Rechnung" "Zuständigkeit*" listet alle Dokumente, in denen der exakte Begriff Rechnung, der exakte Begriff Zuständigkeit und der Begriff Zuständigkeit mit beliebig vielen Zeichen (z. B. auch "Zuständigkeiten") enthalten sind. |
9 Einschränkungen der Volltextsuche
-
keine Suche nach Zeichen im Text, die bei einer Suche als Platzhalter verwendet werden (z. B. „*“)
-
die Suche ist nicht fehlertolerant („Wetl“ findet nicht das Wort „Welt“)
-
keine Thesaurus-/Synonym-Suche
-
keine Suche nach Kombinationen aus Zeichen und Ziffern, z. B. 145.55 oder 125,25
-
keine Suche nach Sonderzeichen (und Kombinationen oder Teil daraus), z. B. test@xyz.de, § 4, 2 %
-
keine Suche nach einzelnen Zeichen oder Ziffern, z. B. 4 oder §
-
keine Suche nach Wörtern der Microsoft Stoppwortliste (wie z. B. „in“, „an“, „um“ etc.)
-
keine Suche nach Teilen eines Wortes, die nicht im Microsoft Wörterbuch stehen, z. B. wird „Verprobung“ nicht gefunden, wenn im Dokument „Steuerverprobung“ steht. Steht im Dokument aber „Steuer-Verprobung“ handelt es sich um 2 einzelne Worte. Deshalb wird das Wort „Verprobung“ in diesem Fall gefunden.
Tipp: Wörterbuch-Prüfung in Microsoft Word
Um das zu prüfen, können Sie das Wort einfach in Microsoft Word oder Microsoft Teams erfassen. Wenn das Wort nicht im Wörterbuch steht, wird es rot unterstrichen. Voraussetzung: In Microsoft Word unter Datei | Optionen im Fenster Word-Optionen in der Kategorie Dokumentprüfung in der Gruppe Bei der Rechtschreib- und Grammatikkorrektur in Word ist das Kontrollkästchen Rechtschreibung während der Eingabe überprüfen aktiv. Achtung: Wenn Sie das Wort in Microsoft Word als einziges Wort auf eine leere Seite schreiben, wird das Wort nicht als unbekannt unterstrichen, weil Microsoft Word die Sprache nicht erkennt. Um das Wörterbuch für die Prüfung zu nutzen, schreiben Sie einen deutschsprachigen Satz. Beispiel: "Ich suche das Wort Verprobung in DMS". In diesem Fall wird Verprobung sofort als fehlerhaft erkannt: |