Die SmartSearch bündelt Anforderungen, die Kunden an die Suchfunktion einer Online-Präsenz stellen: Eine intuitiv bedienbare, hochperformante Suchlösung, die auf umfangreichen Webseiten einsetzbar ist und relevante Ergebnisse liefert. Sie bietet sowohl eine hohe Trefferqualität als auch einen optimalen Suchkomfort und bindet Kunden somit auf der Webseite.
Gleichzeitig stellt sie Redakteuren durch das integrierte SmartSearch-Cockpit eine Web-Oberfläche bereit, die ohne IT-Kenntnisse verwendbar ist. Redakteure aus Fach- und Marketingabteilungen werden so in die Lage versetzt, Suchergebnisse auf der Webpräsenz zu steuern und zu überwachen. Das Cockpit stellt dafür Statistiken, Filter sowie Analysefunktionen bereit und erlaubt die Indizierung verschiedenster Datentypen (zum Beispiel XML, Audio, Video, Medien) aus unterschiedlichen Datenquellen. Mithilfe individualisierter Trefferlisten können Redakteure im Backend Suchergebnisse priorisieren und gewichten sowie ausgewählte Inhalte zu vordefinierten Suchanfragen ausgeben lassen.
Die Funktionalitäten der SmartSearch werden über eine Architektur verschiedener Komponenten realisiert (vgl. Abbildung Architektur).
Bei diesen Komponenten handelt es sich um:
Das Zusammenspiel der Komponenten erfolgt immer nach dem folgenden Schema:
Die Kommunikation nach außen ist durch HTTPS geschützt, zwischen den Komponenten erfolgt sie per HTTP.
Der Einsatz der SmartSearch besitzt die folgenden technischen Voraussetzungen:
Das SmartSearch-Cockpit ist ein Bestandteil der SmartSearch.
Es dient der Backend-seitigen Verwaltung der durch die SmartSearch erfassten Daten und bietet dafür eine einfache, webbasierte Oberfläche an.
Diese gliedert sich in die Bereiche Konfiguration
, Analyse
, Daten
und System
, die über das Menü zu erreichen sind.
Der Button mit dem Weltkugel-Icon stellt darüber hinaus einen Sprachumschalter zwischen Deutsch und Englisch bereit.
Das SmartSearch-Cockpit ist standardmäßig unter der folgenden URL erreichbar:
Der erste Aufruf des Cockpits muss mit dem Master-Admin erfolgen.
Er wird beim initialen Start des SmartSearch-Servers automatisch mit den Daten aus der application.yml
erzeugt.
Ist die Benutzer- und Gruppenverwaltung über einen LDAP-Server realisiert, können die Zugangsdaten abweichen. |
Nach der validen Eingabe wird der Benutzer automatisch auf das Dashboard des Cockpits weitergeleitet. Eine erneute Authentifizierung ist erst nach einer expliziten Abmeldung oder nach dem Ablauf einer Sitzung erforderlich.
Der Bereich Konfiguration
gliedert sich in die Untermenüs Prepared Search
, Stoppwörter
und Synonyme
.
Diese ermöglichen die Konfiguration der Ausgabe der von der SmartSearch erfassten Daten.
Die nachfolgenden Unterkapitel beschreiben die Untermenüs und die durch sie zur Verfügung gestellten Funktionen.
Die kundenseitige Erfassung der benötigten Daten erfolgt über die sogenannten Datengeneratoren, die ein Bestandteil des Bereichs Daten
sind.
Für ihre Verwaltung stellt die SmartSearch die Prepared Searches zur Verfügung.
Diese ermöglichen die Optimierung der Suchergebnisse durch die Priorisierung einzelner Daten.
Die Erstellung und Verwaltung der Prepared Searches erfolgt in der gleichnamige Oberfläche, die über den Menübereich →
aufrufbar ist.
Der Bereich zeigt eine Liste aller bereits existierenden Prepared Searches und ist initial leer.
Im Cloud-Modus wird in der Liste außerdem die Erreichbarkeit jeder Prepared Search angezeigt. |
Neue Prepared Search
Für die Erstellung einer neuen Prepared Search existiert eine eigene Ansicht, die per Klick auf den Button Allgemein
, Facetten
und Vorschau
gliedert.
Innerhalb des Tabs Allgemein
ist zunächst ein Name für die neu zu erstellende Prepared Search anzugeben.
Im Cloud-Modus befindet sich neben dem Eingabefeld für den Namen die zusätzliche Checkbox öffentlich Erreichbar
.
Mit ihr ist die Erreichbarkeit einer Prepared Search definierbar.
Die Aktivierung der Checkbox ermöglicht die Abfrage der Prepared Search über das Internet (API Gateway).
Ansonsten ist die Prepared Search nur so erreichbar, wie es das Cockpit auch ist.
Die anschließende Selektion beliebig vieler Datengeneratoren in der gleichnamigen Auswahlliste zeigt deren verfügbare Felder.
Die initial aktivierte Checkbox Verbose
blendet dabei alle technischen Felder ein bzw. aus.
Die zusammen mit der Checkbox bereitgestellte Schaltfläche ermöglicht die Gewichtung der ausgewählten Felder.
Die Liste der Feldnamen pro Datengenerator ist gecached. Beim neu Anlegen eines Datengenerators und dessen ersten Durchlauf, kann es einige Minuten dauern, bis die Felder in der Liste auftauchen. |
Die ausgewählten Felder lassen sich per Button in die Liste der für eine Suche relevanten Felder übernehmen, die standardmäßig die Felder content
,link
und title
enthält.
Eine zuvor definierte Gewichtung wird dabei automatisch jedem dieser Felder zugeordnet.
Die Liste stellt pro Feld die folgenden Konfigurationsmöglichkeiten bereit:
Durchsuchen: Damit das zugehörige Feld von der Suche berücksichtigt wird, ist diese Checkbox zu aktivieren.
Die Deaktivierung der Option |
Strom
beispielsweise auch den Treffer Ökostromanbieter
.
Das Suchwort muss dabei eine Länge von drei bis zwanzig Zeichen besitzen.
Gewichtung: Die Gewichtung bietet die Möglichkeit, für Treffer der ausgewählten Felder eine Priorisierung festzulegen und damit das Suchergebnis zu beeinflussen.
Der Button mit dem Symbol eines Mülleimers, der für jedes Feld verfügbar ist, erlaubt die Löschung des entsprechenden Felds aus der Liste.
Der Tab enthält darüber hinaus die folgenden allgemeinen Konfigurationsmöglichkeiten:
page
lässt sich außerdem eine Aufteilung der Suchergebnisse auf mehrere Seiten realisieren.
ASC
für eine aufsteigende oder DESC
für eine absteigende Sortierung zu ergänzen.
Must Match: Für die Suche nach mehreren Begriffen legt die Eingabe dieses Texteingabefelds fest, wie diese zu verknüpfen sind:
0
entspricht einer Oder-Beziehung zwischen den verwendeten Suchbegriffen.
100%
entspricht einer Und-Beziehung zwischen den verwendeten Suchbegriffen.
absoluter Wert
definiert die Anzahl der Begriffe, die in einem Suchtreffer enthalten sein müssen.
Der Wert 2
bei fünf Suchbegriffen besagt beispielsweise, dass zwei der fünf Ausdrücke innerhalb eines Suchergebnisses enthalten sein müssen.
Die Werte 2
und 50%
sind bei vier Suchbegriffen äquivalent zueinander.
Facetten bieten die Möglichkeit, Trefferlisten nach Feldern, die in einem Dokument vorhanden sind, einzuschränken.
Da sich Facetten immer auf die im Tab Allgemein
selektierten Datengeneratoren beziehen, ist der Tab Facetten
initial leer.