Zusammenfassung Business Intelligence (Winter 2019/2020)
Business Intelligence (Modul 32711) wird seit dem Sommersemester 2018 vom Lehrstuhl für Betriebswirtschaftslehre, insbesondere Betriebliche Anwendungssysteme an der FernUniversität in Hagen angeboten. Zuvor wurde das Modul jahrelang von Prof. Dr. Ulrike Baumöl betreut, welche die Universität jedoch am 1. Oktober 2019 verließ.
Das 10 ECTS Modul beinhaltet vier deutschsprachige Kapitel:
- Kurseinheit 1: Grundlagen und Herausforderungen der Business Intelligence
- Kurseinheit 2: Methoden und Instrumente der Business Intelligence
- Kurseinheit 3: Intelligente Datenhaltung und Datenbereitstellung im Rahmen der Business Intelligence
- Kurseinheit 4: Neuere Entwicklungen und Anwendungsbeispiele der Business Intelligence
Während des Semesters werden zwei Einsendearbeiten bereitgestellt. Mindestens eine der beiden Arbeiten muss für die Zulassung zur schriftlichen Abschlussprüfung bestanden werden.
Erfahrungsbericht
Business Intelligence wurde von mir im Wintersemester 2019/2020 belegt.
Das ursprüngliche Skript wurde vom Baumöl Lehrstuhl verfasst und wird seit dem Sommersemester 2019 komplett überarbeitet. Insbesondere die zweite Kurseinheit wirkt inhaltlich zu überladen, wodurch relevante Informationen teilweise unverständlich sind.
Einige Musterlösungen zu Übungsaufgaben enthielten außerdem gravierende Fehler, woraus zusätzliche Verunsicherung resultierte.
Ähnlich wie bei Knowledge Management (Modul 31831), welches ebenfalls vom Smolnik Lehrstuhl betreut wird, war die Betreuung durch den Lehrstuhl dennoch sehr gut: Fragen wurden umgehend im Moodle Forum beantwortet. Vor der Klausur wurden sämtliche (offene) Fragen während einer Videokonferenz geklärt.
Die Klausur bestand aus fünf Aufgaben: MC, True/False, Praxis-/Transfer-/Freitext-Aufgaben.
Klausurvorbereitung
Die Abschlussprüfung kombiniert praktisches und theoretisches Wissen und setzt sich aus insgesamt fünf Aufgaben zusammen, welche sämtliche Kapitel inhaltlich abdecken.
Neben Altklausuren sollten vor allem alte Übungsaufgaben (von Baumöl und Smolnik) zur Vorbereitung verwendet werden, um ein weitreichendes Verständnis für die einzelnen Aufgabentypen zu entwickeln.
Es empfiehlt sich der Austausch mit anderen Studenten. Mein Jahrgang hatte beispielsweise eine entsprechende Business Intelligence WhatsApp Gruppe, die wirklich super zusammengearbeitet hat!
Downloads
Nachfolgend kannst Du meine Zusammenfassungen für das Modul Business Intelligence (32711) an der FernUniversität in Hagen herunterladen.
Bitte überprüfe die bereitgestellten Unterlagen selbstständig auf ihre Richtigkeit!
Inhalt der Zusammenfassung
- Kurseinheit 1: Grundlagen
- 2.1 Entwicklung des Konzepts „Business Intelligence“
- Definiere Business Intelligence (BI). Welche Rolle spielen Business Intelligence Systeme?
- Business Intelligence beschreibt…
- Business Intelligence (BI) dient der Entscheidungsunterstützung. Es unterscheidet sich durch die folgenden Charakteristika von einer standardmäßigen Datenauswertung:...
- Skizziere das Modell von Informationsbedarf und Informationsstand nach Picot (2003). Erläutere außerdem kurz, welche Entscheidungsprobleme bei den folgenden Modellelementen auftreten können: objektiver Informationsbedarf; subjektiver Informationsbedarf; Informationsangebot; Informationsnachfrage, Informationsstand
- Definiere Intelligenz im BI Kontext
- BI bezeichnet längst nicht mehr nur die Analyse von unternehmensinternen Daten. Auch Daten, insbesondere über Kunden, die extern oder direkt am Point-of-Sale anfallen (z.B. durch Teilnahme in sozialen Netzwerken oder an Rabattprogrammen) finden wachsende Betrachtung der Unternehmen. Nenne Vor-/Nachteile, die sich aus dieser Entwicklung für Unternehmen ergeben.
- 2.2 BI als Entscheidungsunterstützung (Formale/Semi-Formale Modellierung)
- Nach welchen beiden grundlegenden Ansätze lassen sich Entscheidungsprozess modellieren? Nach welchen
Prinzipien erfolgt die Modellierung des jeweiligen Ansatzes? Welche Aussagen sind jeweils (nicht) machbar?
- Ein Unternehmen möchte am Standort x eine neue Niederlassung eröffnen und prüft hierzu die
Wirtschaftlichkeit. Insbesondere berücksichtigt werden sollen hierbei die lokalen Unternehmenssteuersätze,
das Lohnniveau und die logistische Anbindung an Autobahnen. Im Falle einer positiven Entscheidung soll
anschließend in Abhängigkeit von Lohnniveau und vorhandener Infrastruktur eine Zielgröße des Standorts
(ausgedrückt in Mitarbeiterzahlen) festgelegt werden.
- Skizziere das Phasenmodell nach Simon, einschließlich der Erweiterung um eine vierte Phase. Gib zu jeder
Phase Stichpunkte an, welche die jeweilige Phase charakterisieren.
- Skizziere das SECI-Modell nach Nonaka und Takeuchi. Gib zu jeder Phase Stichpunkte an, welche die
jeweilige Phase charakterisieren.
- Skizziere den OODA-Loop nach Boyd. Gib zu jeder Phase Stichpunkte an, welche die jeweilige Phase
charakterisieren.
- Skizziere den PDCA-Kreislauf nach Deming. Gib zu jeder Phase Stichpunkte an, welche die jeweilige Phase
charakterisieren.
- Stelle das Observe-Orient-Decide-Act Modell nach Boyd dem Plan-Do-Check-Act Modell nach Deming
gegenüber. Zeige Gemeinsamkeiten bzw. Unterschiede zwischen den einzelnen Phasen beider Modelle auf.
- Nimm Stellung zu folgender These: „Die verschiedenen Ansätze handlungsorientierter Modellierung von
Entscheidungsprozessen legen ihren Schwerpunkt unterschiedlich, weisen jedoch keine erheblichen
Widersprüche zueinander auf“. Ist der These zuzustimmen? Worin zeigen sich ggf. Übereinstimmungen bzw. Widersprüche? Unterstützen alle Ansätze das Ziel der lernenden Unternehmung?
- Welche Komponenten umfasst die technische BI und nach welchen Prinzipien ist eine BI-Architektur aufgebaut?
- 2.3 Einordnung in ein übergreifendes Begriffskonzept
- Wie unterscheiden sich operative und dispositive Daten?
- 2.4 Analyserahmen für den Einsatz von Business Intelligence
- Welche Ziele werden mit dem CDM (= Comprehensive Decision Model) verfolgt und weshalb sind die drei
Dimensionen für die Entscheidungsunterstützung relevant? Welche Beziehung besteht zwischen den
Dimensionen (KE 1, S.36 ff.)?
- Das Comprehensive Decision Model (CDM) ist ein Modell für die Systematisierung der
Informationsbedarfsanalyse und besteht aus drei verschiedenen Dimensionen. Was ist keine Aufgabe
innerhalb der Dimension Organisation?
- 3.1 Unternehmensmodell als Abstraktion der Organisation
- Welche Informationen lassen sich mit dem B*IMA Modell erzeugen und wo liegen die Grenzen des Modells?
Welche Ziele verfolgt das Modell?
- 3.2 Geschäftsmodelle als Abstraktion der Wertschöpfung
- Was ist ein Geschäftsmodell?
- Beschreibe und erläutere das Business Model Ontology nach Osterwalder (2014).
- 3.3 Kritische Reflexion von Modellen im Rahmen der Business Intelligence
- Erläutere die vier Dimensionen der Modellkonstruktion (KE 1, S. 53 ff.).
- Nenne und erläutere Prüfkriterien, um die Qualität eines Modells zu hinterfragen (KE 1, S. 55 f.).
- Kurseinheit 2: Methoden und Instrumente der Business Intelligence
- 2.1 Entwicklung des Konzepts „Business Intelligence“
- Definiere Business Intelligence (BI). Welche Rolle spielen Business Intelligence Systeme?
- Business Intelligence beschreibt…
- Phase I: Vorbereitende Schritte KDD-Prozess (KE 2, S. 20 - 44)
- Zur Erstellung einer Prognose mittels Data Mining ist es erforderlich, zunächst die vorbereitenden Schritte im Rahmen des Knowledge Discovery in Databases (KDD)-Prozesses durchzuführen. Nenne und erläutere kurz die einzelnen Schritte und gib jeweils zwei Beispiele an, was in diesen Schritten konkret gemacht werden kann.
- Welche Datenqualitätsprobleme lassen sich in der nachfolgenden Tabelle finden?
- Identifiziere mögliche Datenqualitätsprobleme der folgenden Tabelle (5 P.)?
- Phase II: Data Mining (KE 2, S. 56 - 57)
- Nenne und charakterisiere die vier möglichen Zielsetzungen beim Data Mining (DM). Ordne das
Entscheidungsbaumverfahren einer der Zielsetzungen zu und beschreibe dessen grundsätzliche Idee
- Entscheidungsbaumverfahren (KE 2, S. 76 - 89)
- Benenne die vier grundsätzlichen Schritte des Entscheidungsbaumverfahrens und beschreibe jeden der vier
Schritte in wenigen Sätzen.
- Ein Finanzdienstleister möchte Werbung für seine Rechtschutzversicherung machen. Im Vorfeld hat er daher eine Kundenbefragung durchgeführt (siehe Tabelle). Auf Grundlage der Daten soll ein Entscheidungsbaum erstellt werden, um zu entscheiden, ob einem gegebenen Kunden eine Werbemail für eine Rechtsschutzversicherung gesendet werden soll.
- Fertige einen Entscheidungsbaum hinsichtlich des Attributs „Produktinteresse“ für die nachfolgenden Daten an. Nimm an, dass das Alter nur am Durchschnittsalter aufgespalten wird. Als Maß für die Impurity eines Knotens wird die Klasse zugerechnet, die an dem Knoten häufiger vertreten ist (= Mehrheitsklasse). Bei unreinen Knoten ergibt sich ein bestimmter Anteil von Falschklassifikationen.
- Vergleiche und beurteile die beiden vorgeschlagenen Entscheidungsbäume. Welcher Vorschlag bildet die angegebene Daten besser ab? Welcher Vorschlag bildet die Realität mutmaßlich besser ab? Lässt sich das gefundene Modell plausibel erklären?
- Erläutere Vor-/Nachteile von Entscheidungsbäumen im praktischen Einsatz.
- Regressionsanalyse (KE 2, S. 89 - 93)
- Erläutere das Prinzip der Regressionsanalyse. Skizziere eine lineare Einfachregression anhand des nachfolgenden Beispiels. Wähle außerdem zwei Dimensionen aus und erkläre die lineare Regressionsanalyse (Hinweis: Die exakte Regressionsgerade muss nicht berechnet werden)
- Welche Vor-/Nachteile hat die Verwendung der Regressionsanalyse zur Erstellung von Prognosen?
- Clusteranalyse (KE 2, S. 93 - 106)
- Hierarchisch-agglomerative Clusteringalgorithmen basieren darauf, aus einer Distanzmatrix von Instanzen sukzessive Distanzmatrizen zu berechnen. Beschreiben mit je zwei Sätzen die fünf Schritte, die bei einem hierarchisch-agglomerativen Clustering durchgeführt werden
- Beschreibe fünf Grenzen bzw. Nachteile von hierarchischem Clustering.
- Führe ein hierarchisch-agglomeratives Clustering mit Single-Linkage-Verfahren durch. .Erstelle für die Daten der nachfolgenden Tabelle die Distanzmatrix D. Verwende hierfür die Manhattan-Distanz
- Führe ein hierarchisch-agglomeratives Clustering durch. Verwende die euklidische Distanzmetrik, gerundet auf zwei Nachkommastellen und das single-linkage Verfahren. Gib zu jedem Schritt die vollständige Distanzmatrix an
- Diskutiere mögliche Probleme von Clusterverfahren. Betrachte insbesondere, welchen Einfluss die Struktur der Daten oder das gewählte Distanzmaß auf die Ergebnisse haben können
- Welche grundsätzlichen Folgen hätte es für das Clustering, wenn statt als Einheit statt "Tsd. Euro“ die Einheit „Euro“ verwendet worden wäre? Gib ein entsprechendes Beispiel an. Sind die Daten, so wie sie angegeben sind, frei von diesen Problemen? Wie lässt sich das Problem grundsätzlich lösen?
- Apriori-Algorithmus (KE 2, S. 107 - 112)
- Beschreibe das Vorgehen und Voraussetzungen beim Apriori-Algorithmus
- Erläutere die Begriffe „Support“ und „Konfidenz“ im Zusammenhang mit dem Apriori Algorithmus. Verwende das Beispiel „Wer eine Zahnbürste kauft, kauft auch Zahncreme“. Drücke die Berechnungsvorschriften für Support und Konfidenz einer generischen Regel A → B formal aus
- Berechne die Itemsets L1 und L2 (Items von L1 erfüllen den Mindestsupport, Items von L2 erfüllen die Mindestkonfidenz) mit Hilfe des Apriori-Algorithmus. Mindestsupport: 40%; Mindestkonfidenz 60%
- Interpretiere die vorhergegangen Ergebnisse und diskutiere drei mögliche Handlungsvorschläge...
- Führe den Apriori-Algorithmus mit wachsendem Itemset durch, solange der Support mindestens 30% beträgt. Extrahiere und nenne alle Regeln mit einer Mindestkonfidenz von 70%. Achte auf die Nachvollziehbarkeit der Berechnungen und gib Support und Konfidenzwerte explizit an
- Kurseinheit 3: Intelligente Datenhaltung und -bereitstellung (Wintersemester 2019/2020)
- 2.1 Business Rules
- Was sind Business Rules und in welche Kategorien lassen sich einordnen (KE 3, S. 4 f.)?
- Was ist das Business Motivation Model?
- 2.2 Metadatenmanagement
- Erläutere den Begriff Metadaten entlang der zwei wesentlichen Eigenschaften, die Metadaten zugeordnet werden. Nenne die beiden Eigenschaften und erläutere deren Bedeutung (KE3, S. 11)!
- Es kann zwischen Einsatz und Management von Metadaten unterschieden werden. Erkläre die einzelnen Prozesse des Metadatenmanagements nach Auth (2003) und erläutere die aufgezeigten Prozesse und eventuelle Abhängigkeiten (KE3, S. 15)!
- 2.3.1 Qualitätskriterien
- Nenne die vier Kategorien von Datenqualitätskriterien nach Wang und Strong und beschreibe diese in wenigen Sätzen.
- Wie können Datenqualitätskriterien im Prozess des Datenqualitätsmanagements eingesetzt werden?
- 3.1 Gesamtarchitektur eines Data Warehouse-Systems
- Ein Data Warehouse-Systeme bestehen aus verschiedenen Architekturebenen. Jeder Ebene können eine oder mehrere Komponenten eines DWH-Systems zugeordnet werden. Nenne und erläutere die jeweiligen Ebenen, inklusive der dazugehörigen Komponenten.
- 3.2 Definition und Ziele eines Data Warehouse
- Was sind die Eigenschaften von einem Data Warehouse System?
- Was sind die Ziele eines Data Warehouse Systems?
- Erkläre die Rolle des ETL-Prozesses im gesamten BI-Prozess und gehe dabei auf die drei Phasen von ETL ein.
- Welche Herausforderungen sind grundsätzlich mit der Einbindung externer Datenquellen in den ETL-Prozess verbunden?
- Erläutere zwei mögliche Probleme, die während des Transformationsschrittes auftreten können und unter Umständen ein manuelles Eingreifen nötig machen.
- Ein Unternehmen möchte zukünftig auch Daten aus sozialen Netzwerken im Rahmen des ETL-Prozesses mit in das Data Warehouse einspeisen. Diskutiere zwei Möglichkeiten und Schwierigkeiten, die mit einem solchen Vorgehen verbunden sind.
- MS Excel ist ein wichtiges Tool für Business-Intelligence-Tätigkeiten. Warum kann es trotzdem notwendig sein, in eine BI-Lösung mit Data-Warehousing-Fähigkeiten zu investieren? Diskutiere Vorteile einer echten BI Lösung.
- 3.4 Data Marts
- Was sind Data Marts?
- Grenze die Begriffe Data Warehouse und Data Marts voneinander ab.
- Vergleiche anhand sechs ausgewählter Kriterien die Vor-/Nachteile von Data Marta gegenüber einem DWH.
- Die Einsatzmöglichkeiten von Business Intelligence Lösungen sind sehr vielseitig. Diskutiere beispielhaft, welche Chancen sich durch den Einsatz von Business Intelligence Lösungen in der Konsumgüterherstellung und welche sich in der Energiebranche ergeben.
- 4 Online Analytical Processing (OLAP)
- Was ist ein OLAP (= Online Analytical Processing)?
- Wofür stehen die Abkürzungen: OLAP, MOLAP, ROLAP, HOLAP und OLTP?
- Benenne die vier OLAP-Operationen und erkläre diese kurz anhand eines OLAP Würfels.
- Erkläre den Unterschied zwischen OLAP und OLTP.
- Nachfolgend werden mehrere Abbildungen von OLAP-Würfeln dargestellt. Der linke Teil stellt jeweils eine Ausgangssituation dar, die angegebene Operation ist auf dem linken Würfel anzuwenden und auf dem rechten Würfel einzuzeichnen. Die Lösung soll die Veränderung, zu der die Operation führt, nachvollziehbar machen (z.B. durch Änderung der Achsenbeschriftung etc.).
- Erkläre den Unterschied zwischen ROLAP und MOLAP.
- OLAP kann durch die sogenannte FASMI-Regel charakterisiert werden. Erläutere die Regel.
- Lernzusammenfassung Kurseinheit 4: Neuere Entwicklungen und Anwendungsbeispiele (Wintersemester 2019/2020)
- 2 Wirkung von BI auf Unternehmen
- Was ist BI 2.0 und welche Begriffe beinhaltet das Konzept (KE 4, S.4)?
- Erläutere die Grundidee des Business Intelligence Maturity Models (biMM) nach Charmoni und Gluchowski (2004) (KE 4, S.8).
- In welchem Verhältnis stehen BI-Systeme und (strategische/operative) Prozesse?
- Inwiefern beeinflusst der Reifegrad eines BI-Systems die Informationsqualität (KE 4, S.10)?
- 2.1 Echtzeit Business Intelligence
- Was ist Datenlatenz (KE 4, S.13)?
- Was ist Analyselatenz (KE 4, S.13)?
- Was ist Entscheidungslatenz (KE 4, S.13)?
- Was ist Right/Real-Time Business Intelligence (RTBI) (KE 4, S.14)?
- 2.2 Business Activity Monitoring
- Was ist Self-Service Business Intelligence (SSBI) (KE 4, S.18)?
- Was ist Corporate Performance Management (CPM) und welche Elemente des Controllingkonzepts müssen vorab festgelegt werden (KE 4, S.20)?
- Was ist das Business Activity Monitoring (BAM)? Aus welchen Komponenten bestehen BAM-Systeme?
Nützliche Links