Projektgruppe Business Intelligence Applications and Evaluation ...

Weitere Magazine

Empfehlungen

Info

Projektgruppe Cuberunner Jinengo - DV Konzept Umschreibung des Anwender-Fremdschlüssels (UserHistoric) Tabelle 3.4: Beschreibung der Schritte des ETL-Prozess 3.3.3 Aggregation von Daten im Data Warehouse Zusätzlich zu den historisierten Tabellen verfügt das Data Warehouse auch über drei aggregierte Tabellen, die den Zugriff auf eine verdichtete Sicht der Reisedaten vereinfachen. Die Verdichtung erfolgt dabei gemäß der in Tabelle 3.2 dargestellten Ebenen. Der Prozess zur Aktualisierung der drei Tabellen erfolgt durch die folgenden Schritte: 1. Bestimmung der Jahr-Monat-Konstellationen, bei denen Routen noch nicht in die Aggregation einbezogen wurden (Attribut isAggregatedInDW), da sie seit der letzten Verdichtung hinzugekommen sind. Für diese Konstellationen müssen die aggregierten Daten neu berechnet werden. 2. Löschung der veralteten Jahr-Monat-Konstellationen in den drei Aggregationstabellen. 3. Erneute Datenaggregation und Einfügung der entsprechenden Datensätze in die drei Aggregationstabellen. Die Verdichtung erfolgt dabei für jede Tabelle spezifisch entsprechend ihrer Aggregationsebene. 4. Kennzeichnung der aggregierten Routen mithilfe des Attributs isAggregatedInDW. Der Prozess wird zunächst manuell nach Abschluss des ETL-Prozesses angestoßen. Auf längere Sicht ist jedoch analog zum ETL-Prozess eine regelmäßig automatische Einplanung des Prozesses denkbar. 3.4 Data Mining Ziel des Data Mining ist es, aus den Daten des Data Warehouse neue Erkenntnisse zu ziehen und Zusammenhänge in den Daten zu entdecken. Um diese Aufgabe bewerkstelligen zu können wird es zwischen der operativen Datenbank und dem Data Warehouse eingeordnet (siehe Abbildung 3.1). Das Data Mining wird im Projekt mit dem SPSS Modeler 15 umgesetzt. Das Tool bietet umfangreiche Modellierungsmöglichkeiten. Daten lassen sich sowohl aus dem SQL Server als auch, falls notwendig, aus CSV-Dateien auslesen. Im Modeler können die Daten so vorbereitet werden, wie sie für das Data Mining benötigt werden. Die alternative Lösung mit den Data-Mining-Tools von SSAS bietet nicht denselben Umfang und Komfort. Der SPSS Modeler ist sowohl in der Datenintegration, -extraktion und Data-Mining-Fähigkeit umfangreicher und komfortabler als SSAS. Der in den einzelnen Methoden angewandte Algorithmus hat sich während der Tests als am stabilsten herausgestellt. Es ist allerdings nicht aus zu schließen, dass sich dieser mit einer realen Datenbasis ändern könnte. 68
Projektgruppe Cuberunner Jinengo – DV Konzept In der Tabelle 3.5 werden die in dem Fachkonzept formulierten Anwendungsfälle und die für die Lösung verwendeten Methoden miteinander in Beziehung gebracht. Anwendungsfall aus Fachkonzept verwendete Data-Mining-Methode Eigenschaften raten Klassifizierung Newsletter & Reporting Clustering Ökologische Alternativen vorschlagen Assoziation Warnung vor ungewöhnlichem Verhalten eigene Logik auf Basis der Data-Mining-Ergebnisse Tabelle 3.5: Zuordnung der Data-Mining-Methoden zu den Anwendungsfällen 3.4.1 Klassifizierung Ziel der Klassifizierung ist es, Eigenschaften von Endanwendern – z.B. Besitz eines Elektroautos (ownsPEV) – zu ermitteln, die mit einer gewissen Konfidenz (z.B. >98%) vorliegen, aber bislang vom Benutzer nicht angegeben wurden (Besitz Elektroauto bislang NULL). Der Schwellenwert für die Konfidenz-Akzeptanz sollte von Fall zu Fall angepasst werden. Einen Richtwert liefert der im SPSS Modeler ausgegebene Wert „always correct above“. Input: Anzahl der gefahrenen Strecken pro Verkehrsmittel Persönliche Attribute (Geschlecht, etc.) Besitz von Verkehrsmittel (ownsPEV, ownsEbike, etc.) Endanwenderpräferenzen Algorithmus: CHAID Der Algorithmus muss mit sich ändernden Daten überprüft und angepasst werden, da verschiedene Algorithmen mit fehlenden Datensätzen besser / schlechter umgehen können. Output: Die Ergebnisse werden in das Data Warehouse geschrieben (jinengoData- Warehouse.dbo.ClassificationPrediction). Spalten der Tabelle: jinengoUserID, userHistoricID, attribute, attributeValue, attributePrediction, predictionConfidence, predictionDate und predictionAcception. Die Attribut-Spalte speichert den Namen des Attributs (Bspw.: ownsPEV, ownsEbike, etc), in der Spalte attributeValue wird der angegebene Wert abgespeichert. Vergleichend dazu wird in der Spalte attributePrediction der durch DataMining ermittelte Konfidenzwert festgehalten. 69
Seite 1 und 2:
Projektgruppe Business Intelligence
Seite 3 und 4:
Projektgruppe Cuberunner Einleitung
Seite 5 und 6:
Seite 7 und 8:
Seite 9 und 10:
Projektgruppe Cuberunner Jinengo -
Seite 11 und 12:
Seite 13 und 14:
Seite 15 und 16:
Seite 17 und 18: Projektgruppe Cuberunner Jinengo -
Seite 67: Projektgruppe Cuberunner Jinengo -
Seite 119 und 120:
Seite 121 und 122:
Seite 123 und 124:
Seite 125 und 126:
Seite 127 und 128:
Seite 129 und 130:
Seite 131 und 132:
Seite 133 und 134:
Seite 135 und 136:
Seite 137 und 138:
Seite 139 und 140:
Seite 141 und 142:
Seite 143 und 144:
Seite 145 und 146:
Seite 147 und 148:
Seite 149 und 150:
Seite 151 und 152:
Seite 153 und 154:
Seite 155 und 156:
Seite 157 und 158:
Seite 159 und 160:
Seite 161 und 162:
Seite 163 und 164:
Seite 165 und 166:
Seite 167 und 168:
Seite 169 und 170:
Seite 171 und 172:
Seite 173 und 174:
Seite 175 und 176:
Seite 177 und 178:
Seite 179 und 180:
Seite 181 und 182:
Seite 183 und 184:
Seite 185 und 186:
Seite 187 und 188:
Projektbericht Cuberunner CEWE „g
Seite 189 und 190:
Seite 191 und 192:
Seite 193 und 194:
Seite 195 und 196:
Seite 197 und 198:
Seite 199 und 200:
Seite 201 und 202:
Seite 203 und 204:
Seite 205 und 206:
Seite 207 und 208:
Seite 209 und 210:
Seite 211 und 212:
Seite 213 und 214:
Seite 215 und 216:
Seite 217 und 218:
Seite 219 und 220:
Seite 221 und 222:
Seite 223 und 224:
Seite 225 und 226:
Seite 227 und 228:
Seite 229 und 230:
Seite 231 und 232:
Seite 233 und 234:
Seite 235 und 236:
Seite 237 und 238:
Seite 239 und 240:
Seite 241 und 242:
Seite 243 und 244:
Seite 245 und 246:
Seite 247 und 248:
Seite 249 und 250:
Seite 251 und 252:
Seite 253 und 254:
Seite 255 und 256:
Seite 257 und 258:
Seite 259 und 260:
Seite 261 und 262:
Seite 263 und 264:
Seite 265 und 266:
Seite 267 und 268:
Seite 269 und 270:
Seite 271 und 272:
Seite 273 und 274:
Seite 275 und 276:
Seite 277 und 278:
Seite 279 und 280:
Seite 281 und 282:
Seite 283 und 284:
Seite 285 und 286:
Seite 287 und 288:
Seite 289 und 290:
Seite 291 und 292:
Seite 293 und 294:
Seite 295 und 296:
Seite 297 und 298:
Seite 299 und 300:
Seite 301 und 302:
Seite 303 und 304:
Seite 305 und 306:
Seite 307 und 308:
Seite 309 und 310:
Seite 311 und 312:
Seite 313 und 314:
Seite 315 und 316:
Seite 317 und 318:
Seite 319 und 320:
Seite 321 und 322:
Seite 323 und 324:
Seite 325 und 326:
Seite 327 und 328:
Seite 329 und 330:
Seite 331 und 332:
Seite 333 und 334:
Seite 335 und 336:
Seite 337 und 338:
Seite 339 und 340:
Seite 341 und 342:
Seite 343 und 344:
Seite 345 und 346:
Seite 347 und 348:
Seite 349 und 350:
Seite 351 und 352:
Seite 353 und 354:
Seite 355 und 356:
Seite 357 und 358:
Seite 359 und 360:
Seite 361 und 362:
Seite 363 und 364:
Seite 366 und 367:
Seite 368 und 369:
Seite 370 und 371:
Seite 372 und 373:
Projektbericht Cuberunner Smart Win
Seite 374 und 375:
Seite 376 und 377:
Seite 378 und 379:
Seite 380 und 381:
Seite 382 und 383:
Seite 384 und 385:
Seite 386 und 387:
Seite 388 und 389:
Seite 390 und 391:
Seite 392 und 393:
Seite 394 und 395:
Seite 396 und 397:
Seite 398 und 399:
Seite 400 und 401:
Seite 402 und 403:
Seite 404 und 405:
Seite 406 und 407:
Seite 408 und 409:
Seite 410 und 411:
Seite 412 und 413:
Seite 414 und 415:
Seite 416 und 417:
Seite 418 und 419:
Seite 420 und 421:
Seite 422 und 423:
Seite 424 und 425:
Seite 426 und 427:
Seite 428 und 429:
Seite 430 und 431:
Seite 432 und 433:
Seite 434 und 435:
Seite 436 und 437:
Seite 438 und 439:
Seite 440 und 441:
Seite 442 und 443:
Seite 444 und 445:
Seite 446 und 447:
Seite 448 und 449:
Seite 450 und 451:
Seite 452 und 453:
Seite 454 und 455:
Seite 456 und 457:
Seite 458 und 459:
Seite 460 und 461:
Seite 462 und 463:
Seite 464 und 465:
Seite 466 und 467:
Seite 468 und 469:
Seite 470 und 471:
Seite 472 und 473:
Seite 474 und 475:
Seite 476 und 477:
Seite 478 und 479:
Seite 480 und 481:
Seite 482 und 483:
Seite 484 und 485:
Seite 486 und 487:
Seite 488 und 489:
Seite 490 und 491:
Seite 492 und 493:
Seite 494 und 495:
Seite 496 und 497:
Seite 498 und 499:
Seite 500 und 501:
Seite 502 und 503:
Seite 504 und 505:
Seite 506 und 507:
Seite 508 und 509:
Seite 510 und 511:
Seite 512 und 513:
Seite 514 und 515:
Seite 516 und 517:
Seite 518 und 519:
Seite 520 und 521:
Seite 522 und 523:
Seite 524 und 525:
Seite 526 und 527:
Seite 528 und 529:
Seite 530 und 531:
Seite 532 und 533:
Seite 534 und 535:
Seite 536 und 537:
Seite 538 und 539:
Seite 540 und 541:
Seite 542 und 543:
Seite 544 und 545:
Seite 546 und 547:
Seite 548 und 549:
Seite 550 und 551:
Seite 552 und 553:
Seite 554 und 555:
Seite 556 und 557:
Seite 558 und 559:
Seite 560 und 561:
Seite 562 und 563:
Seite 564 und 565:
Seite 566 und 567:
Seite 568 und 569:
Seite 570 und 571:
Seite 572 und 573:
Seite 574 und 575:
Seite 576 und 577:
Seite 578 und 579:
Seite 580 und 581:
Seite 582 und 583:
Seite 584 und 585:
Seite 586 und 587:
Seite 588 und 589:
Seite 590 und 591:
Seite 592 und 593:
Seite 594 und 595:
Seite 596 und 597:
Seite 598 und 599:
Seite 600 und 601:
Seite 602 und 603:
Seite 604 und 605:
Seite 606 und 607:
Seite 608 und 609:
Seite 610 und 611:
Seite 612 und 613:
Seite 614 und 615:
Seite 616 und 617:
Seite 618 und 619:
Seite 620 und 621:
Seite 622 und 623:
Seite 624 und 625:
Seite 626 und 627:
Seite 628 und 629:
Seite 630 und 631:
Seite 632 und 633:
Seite 634 und 635:
Seite 636 und 637:
Seite 638 und 639:
Projektbericht Cuberunner Technisch
Seite 640 und 641:
Seite 642 und 643:
Seite 644 und 645:
Seite 646 und 647:
Seite 648 und 649:
Seite 650 und 651:
Seite 652 und 653:
Seite 654 und 655:
Seite 656 und 657:
Seite 658 und 659:
Seite 660 und 661:
Seite 662 und 663:
Seite 664 und 665:
Seite 666 und 667:
Seite 668 und 669:
Seite 670 und 671:
Seite 672 und 673:
Seite 674 und 675:
Projektgruppe Cuberunner Fazit Proj
Alle anzeigen

Projektgruppe Business Intelligence Applications and Evaluation ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?