IPS ist Zweck und Funktionen von Information-Retrieval-Systemen

Inhaltsverzeichnis:

IPS ist Zweck und Funktionen von Information-Retrieval-Systemen
IPS ist Zweck und Funktionen von Information-Retrieval-Systemen

Video: IPS ist Zweck und Funktionen von Information-Retrieval-Systemen

Video: IPS ist Zweck und Funktionen von Information-Retrieval-Systemen
Video: Wertvolle Museumsloks -- ein Raub der Flammen 2024, April
Anonim

Für einen modernen Menschen ist es schwierig, sich ein Leben ohne das Internet und den fast sofortigen Zugriff auf Informationsquellen vorzustellen. Der Benutzer denkt selten darüber nach, wie die Suche nach den gewünschten Inh alten im Netzwerk durchgeführt wird. Aber das ist sehr interessant.

Ein Information Retrieval System (IPS) ist ein komplexes Software- und Hardwaresystem, das Informationen auf Anforderung des Benutzers auswählt. Informationen werden in digitaler Form auf Servern gespeichert, so wie früher Bücher in den Regalen der Bibliotheken standen. Das System besteht aus vielen Subsystemen. Jede erfüllt dabei ihre Aufgabe, die Anfrage des Nutzers zu bearbeiten und ihm Informationen in Text- oder Tonform zur Verfügung zu stellen. Die Vielf alt der zu lösenden Aufgaben bestimmt die Komplexität der Architektur moderner Information-Retrieval-Systeme (eine Abkürzung für Information Retrieval System). Eine Art "Black Box": am Eingang - der Text der Anfrage, was drin ist - ist unbekannt, am Ausgang - umfassende Informationen.

Kartei im wirklichen Leben
Kartei im wirklichen Leben

Eingangsströme

Anfragen zu Informationen, die eine Person in Textform auf dem Bildschirm ihres Gadgets bildet,machen einen kleinen Teil der von der Suchmaschine verarbeiteten Anfragen aus. Die wichtigsten Arrays von Suchanfragen werden von Robotern gebildet, die eine menschliche Anfrage annehmen und eine mehrstufige Suche und Rückmeldung mit dem Benutzer durchführen. Zu den Informationsabrufsystemen gehören bekannte Google, Yandex und andere, die täglich Millionen von Anfragen verarbeiten.

Quelle Suchobjekte

Die Gruppe der anfänglich interessanten Objekte für die Suche sind Dokumente, Aufzeichnungen, Videos, Bilder und mehr. Sie werden außerhalb des IPS erstellt. Das allgemeine System zum Speichern und Abrufen von Informationen sollte ein eingebautes bibliografisches System haben – eine Art Katalog, der es Ihnen ermöglicht, nach jeder Art von Objekten zu suchen.

Objekte bzw. deren digitale Transformationen werden zu einer „Einstiegsressource“in das IPS. Unter ihnen werden die Informationen ausgewählt, die der Benutzer benötigt.

Suche nach Informationen
Suche nach Informationen

Externe Quellen

Informationsauswahlansicht nutzt externe Wissensquellen. Dies sind die Informationen, nach denen der Benutzer sucht. Der Titel des Films, ein Zitat aus dem Buch und mehr. Für eine Computersuche müssen diese Informationen in eine Abfrage in einer algorithmischen Sprache übersetzt werden. Im IPS erfolgt dies über den Block zum Erstellen, Indizieren und Entwickeln von Queries.

Idealerweise sollten sich diese drei Prozesse – Repräsentation, Indexierung und Abfrageentwicklung – auf identische Wissensquellen stützen, aber in der Praxis ist dies nicht erreichbar.

Wissensquellen sollten ständig überprüft und aktualisiert werden, und die Aktualisierung sollte identisch sein undsynchronisiert. Und eine externe Wissensquelle geht ihrer Nutzung in Suchmaschinen für eine Suchanfrage immer chronologisch voraus, manchmal um mehrere Jahre.

Informationsabrufsystem
Informationsabrufsystem

Auftritte

Repräsentationen der Originalobjekte bestehen aus Eingabedaten in irgendeiner Kombination oder transformiert in Übereinstimmung mit den Regeln und Algorithmen eines bestimmten Informationswiedergewinnungssystems.

Ansichten sind mehr oder weniger transformierte Kopien des ursprünglichen Suchobjekts. In der Sammlung der unveröffentlichten Volltexte ist jeder Text eine eigene Repräsentation. In der Objektsammlung von Museumsexponaten und Artefakten kann die Repräsentation eine transformierte Beschreibung des Objekts mit seinem Bild sein. In einigen Fällen kann die Repräsentation teilweise vom Originalobjekt und teilweise von der Beschreibung abgeleitet werden: In bibliografischen Suchmaschinen werden Repräsentationen vom Objekt abgeleitet – zum Beispiel werden Titel, Name des Autors mit der Anmerkung des Werks kombiniert.

Finden, was Sie brauchen
Finden, was Sie brauchen

Durchsuchbarer Index

Da Informationen in Information-Retrieval-Systemen in Form einer Repräsentation gespeichert werden, ist es logisch anzunehmen, dass die Suche entsprechend der Repräsentation durchgeführt und nach Auswahl an den Benutzer ausgegeben wird. In der Praxis ist dies nicht der Fall. Beispielsweise beschränken die aktuellen Online-Bibliothekskataloge die Suche normalerweise auf wenige Felder: Autor, Titel und Untertitel innerhalb einer Ansicht, die andere Felder enthält, die nicht durchsucht werden. Dies ist Grund genug, um zu unterscheideneine Ansicht und einen durchsuchbaren Index, der der Suchteil der Ansicht ist. Es definiert alles, was durchsuchbar sein soll. Ein durchsuchbarer Index kann wie das Ansichts- und das Quellobjekt in separate Unterindizes aufgeteilt werden, um präzisere, gezieltere Suchen zu ermöglichen

Suchmaschinen haben normalerweise intern eine synthetische Struktur, um gültige Suchergebnisse abzugleichen. Diese Struktur ist die zweite Komponente des durchsuchbaren Index.

Prozedural kann der Indexierungsprozess auf verschiedene Arten implementiert werden: Ein durchsuchbarer Index kann erh alten werden durch:

  • wörtliches Kopieren einer durchsuchbaren Darstellung;
  • durch Kopieren der Ansichtsdetails. Dabei kann es sich um einen Teil oder alle Ansichten handeln, die physisch nur als Fragmente existieren, verteilt gemäß den Regeln zur Erstellung eines Suchindex, die bei Bedarf gesammelt werden.
Suchmanagement
Suchmanagement

Designregeln und formelle Anfragen anfordern

Query Engineering ist eine Funktion, die zwischen einer Benutzerabfrage und einer formalen Abfrage vermittelt. Es transformiert die Abfrage des Benutzers und vergleicht sie vor dem Abrufen mit den Abrufbefehlswörterbüchern, der Indexspezifikation und dem Index. Zu Beginn der Entwicklung von IPS wurde diese Rolle traditionell qualifizierten IT-Spezialisten zugewiesen.

Die Entwicklung von Computerabfragen, die Wörterbuchabfragen mit einem durchsuchbaren Indexsystem abgleichen können, wird allgemein als "Wörterbucheingabe"-Modul bezeichnet. Die Automatisierung dieser Funktion ist vielversprechend und bietet Möglichkeiten für Experten- und probabilistische Suchmethoden.

Eine formelle Anfrage wird zu einer formellen Anfrage, nachdem die Anfrage des Benutzers konvertiert wurde. Beispiele für solche formalen Transformationen sind das Abschneiden, Ersetzen, Normalisieren, Vektorisieren und andere Transformationen der "externen" Darstellung in die "internen" Darstellungen des Computer-IPS (Decryption - Information Retrieval System).

Extrahierte Dokument-Link-Sets

Die resultierende Gruppe von Informationsquellen ist logisch eine Teilmenge der Ansichten, die durch die Matching-Regeln erstellt wurden, die von einem durchsuchbaren Index auf die formale Abfrage angewendet wurden.

Normalerweise, aber nicht notwendigerweise, gibt es einen separaten Sortierprozess für die wiederhergestellten Informationen. Online-Bibliothekskataloge ordnen empfangene Sets normalerweise alphabetisch nach Autor neu, bevor sie angezeigt werden. In Informationsabrufsystemen, die strenge Rangfolgen erstellen, geht die Rangfolge jeder Neuordnung voraus.

Datenanalyse
Datenanalyse

Ausgabestreams

Die Ausgabe der Suchergebnisse erfolgt traditionell auf dem Display, häufiger in Form eines Stroms von Objekten, die an anderer Stelle oder für andere Zwecke verwendet werden, schließt die Hauptsuchschleife ab. Solche Ströme können an Visualisierungsgeräte gesendet werden, Speicherung zur weiteren Verarbeitung oder Verwendung als Eingabeströme für andere Auswahldienste.

Informationsabrufsysteme ermöglichen Feedback vondas Ergebnis eines jeden Auswahlprozesses. Die Ausgabe eines beliebigen Prozesses kann eine Rückkopplung zu anderen Prozessen sein. Feedback kann in jeder Phase die Grundlage für Expertenurteile bilden.

Empfohlen: