Schlussbericht mtrade - ISS - Umwelt-Campus Birkenfeld
Schlussbericht mtrade - ISS - Umwelt-Campus Birkenfeld
Schlussbericht mtrade - ISS - Umwelt-Campus Birkenfeld
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
4.2 Qualität des Datenbestandes<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Je besser die Daten im Datenbestand gepflegt sind, desto genauer können die Anfragen der<br />
unscharfen Suche ausgewertet werden und die Daten für den automatisierten Import und Ex-<br />
port zur Verfügung gestellt werden. Dabei wird die Datenqualität durch folgende Punkte be-<br />
einflusst:<br />
Pflegegrad einzelner Produkte<br />
Der Pflegegrad einer Maschine entspricht der Anzahl der tatsächlich gefüllten Merkmale der<br />
Maschinen, d. h. bei geringem Pflegegrad wurden viele Merkmale beim Einstellen der Ma-<br />
schinen nicht gefüllt. Dies kann darauf hindeuten, dass diese Merkmale für den Käufer oder<br />
Verkäufer nicht relevant sind.<br />
Anzahl der Merkmale<br />
In den verschiedenen Handelsbörsen lassen sich Produktgruppen finden, die nur mit wenigen<br />
Merkmalen beschrieben sind. Ein Produkt lässt sich aber besser finden, wenn es durch eine<br />
bestimmte Anzahl von Merkmalen ausreichend beschrieben werden kann und diese Merkmale<br />
auch korrekt gepflegt sind. Deshalb sollen diese Produktgruppen mit zu wenigen Merkmalen<br />
um Merkmale erweitert werden können, um eine bessere Beschreibung zu gewährleisten.<br />
Unstrukturierte Produktbeschreibung<br />
In einigen Fällen fassen Anwender – aus Zeitgründen oder mangels geeigneter Merkmale – in<br />
einem Merkmal „Sonstige Informationen“ die wesentlichen Teile der Produktbeschreibung<br />
zusammen. Diese unstrukturierte Information, die oftmals viele (ggf. neue) Merkmale um-<br />
fasst, kann derzeit durch unsere Suchverfahren nicht erfasst werden. Hier ist eine natürlich-<br />
sprachliche Verarbeitung erforderlich sowie ggf. die Erweiterung des Klassifikationssystems<br />
um neue Merkmale.<br />
Die Tabelle 6 zeigt unter dem Merkmal "Sonstige Informationen" Einträge, die als einzel-<br />
ne Merkmale aufgeschlüsselt werden müssten.<br />
Unzulässige Merkmalswerte<br />
Die Qualität des Datenbestandes wird ebenfalls durch unzulässige Merkmalswerte verfälscht,<br />
wenn z. B. als Merkmalswerte Ausprägungen verschiedener Merkmale in ein Feld eingetra-<br />
gen werden. So ist ein häufiger Fehler die Preisangabe einer Maschine. Als Merkmale werden<br />
Preis und Währung angegeben, d. h. im Merkmal Preis soll der Betrag und in Währung die<br />
gültige Währung eingetragen werden. In der Regel wird der Betrag mit dem Währungszeichen<br />
eingetragen (z. B. Preis: 20.000 , Währung: ) und das Merkmal Währung bleibt unausgefüllt<br />
(richtig wäre: Preis: 20.000 , Währung: ). Bei der Suche würden beide Merkmale unbe-<br />
55