Word- und PDF-Dokumente können im Internet nicht direkt dargestellt werden. Da diese Dateiformate spezielle Eigenschaften haben, ist die Verwendung von Browser-externen Programmen bzw. Plug-Ins wie Microsoft Word oder Adobe Acrobat Reader notwendig. Diese technische Abgrenzung bedeutet gleichzeitig, dass die Inhalte dieser Dateien nicht für eine Web-Suche verwendet werden können.
VIO.Matrix ermöglicht es nun, auf Grundlage einiger freier Tools eben solche Dokumente durchsuchbar zu machen. Mit Hilfe von antiword können die textlichen Inhalte von Word-, mit xlhtml Excel- und mit ps2ascii PDF-Dokumenten ausgelesen werden. Nach der einmalige Speicherung dieser Informationen in einer Datenbank kann eine Web-Suche nun sehr effizient in diesen Texten suchen.
Voraussetzung für die Nutzung dieser Suche ist ein Webserver, auf dem die o.g. Programme installiert sind, eine VIO.Matrix-Lizenz ab Content Creator Business und eine Datenbank. Wie eine solche Suche durch einen Programmierer zu einem VIO.Matrix-Projekt ergänzt werden kann wird im Fachbeitrag Word-, Excel- und PDF-Dokumente mit VIO.Matrix durchsuchen erläutert.
Fachbeitrag: Hilfreiche Tools zur Webentwicklung