Integration von R in Tableau ist eine Serie von Blogeinträgen, die sich mit den Thema R im Kontext der Software-Lösung Tableau auseinandersetzt. Im Grunde wird in der Serie geklärt, was R überhaupt ist, was mit R in Tableau alles möglich ist und die häufigsten Fragen, zum Thema R in Tableau, werden vorgestellt und beantwortet. In diesem Blogeintrag geht es um die Beantwortung der Frage, was überhaupt R ist? Kurz und knapp gesagt, ist R eine freie Programmiersprach, die für statische Berechnungen und Grafiken eingesetzt wird. Entwickelt wurde R von Statistikern, um die Anwender mit statistischen Aufgaben zu unterstützen. Wie können diese statistischen Aufgaben aussehen? Es können Aufgaben sein, um systematische Verbindungen zwischen Erfahrung (Empirie) und Theorie herzustellen. Statistik wird einerseits als eigenständige mathematische Diziplin über das Sammeln, die Analyse, die Interpretation oder Präsentation von quantitativen Daten (Informationen) betrachtet. Quantitative Informationen sind nummerische Daten, Zahlen oder Fakten, die dazu dienen Verhalten in Form von Modellen, Zusammenhänge und zahlenmäßige Ausprägungen möglichst genau zu beschreiben und vorhersagbar zu machen

Hauptsächlich besteht der Bereich Statistik aus den folgenden Teilbereichen: Die deskriptive (beschreibende Statistik), induktive (mathematische Statistik) und explorative (hypothesen-generierende) Statistik. Die Syntax der Programmiersprache R orientiert sich an der Programmiersprache S und ist mit dieser weitgehend kompatibel. R ist ein Teil des GNU-Projekts und auf vielen Plattformen verfügbar. R gilt zunehmend als die Standardsprache, sowohl im kommerziellen als auch im wissenschaftlichen Bereich. Der Funktionsumfang von R kann durch eine Vielzahl von Pakten erweitert und an spezifische statische Problemstellungen angepasst werden. Viele Pakete können dabei direkt aus einer über die R-Console abrufbare Liste ausgewählt und automatisiert installiert werden. Beispielsweise erlaubt das Paket foreing, Datensätze aus anderen Statistikprogrammen wie SPSS oder Stat einzulesen und zu analysieren. Zwei der bekanntesten Grafikerweiterungen für R sind die Pakte lattice und ggplot2, die durch größere Abstraktion schneller komplexe Grafiken erstellen lassen. Die Benutzeroberfläche in R ist meist sehr simpel aufgebaut und besteht somit aus einer Kommandozeilenumgebung. Darüber hinaus gibt eine ganze Reihe grafischer Benutzeroberflächen. Eine der besseren GUI Lösungen wird mit dem RStudio dargestellt.

Als einfaches Beispiel soll der  Korrelationskoeffizient zweier Datenreihen berechnet werden. Der Korrelationskoeffizient ist ein dimensionsloses Maß für den Grad des linearen Zusammenhangs zwischen zwei mindestens intervallskalierten Merkmalen. Er kann Werte zwischen −1 und +1 annehmen. Bei einem Wert von +1 (bzw. −1) besteht ein vollständig positiver (bzw. negativer) linearer Zusammenhang zwischen den betrachteten Merkmalen. Wenn der Korrelationskoeffizient den Wert 0 aufweist, hängen die beiden Merkmale überhaupt nicht linear voneinander ab.

# Groesse wird als numerischer Vektor #
# durch den Zuweisungsoperator “<-” definiert:#
Groesse <- c(176, 166, 172, 184, 179, 170, 176)
# Gewicht wird als numerischer Vektor definiert:#
Gewicht <- c(65, 55, 67, 82, 75, 65, 75)
# Berechnung des Korrelationskoeffizienten nach Pearson:#
cor(Gewicht, Groesse, method = “pearson”)

Als Ergebnis erhält man 0.9295038. Text nach dem Doppelkreuz „#“ wird vom R-Interpreter als Kommentar behandelt. Als weitergehende Analyse kann man eine lineare Regression durchführen. Dies kann in R durch den lm-Befehl ausgeführt werden, wobei die abhängige Variable von den unabhängigen Variablen durch eine Tilde „~“ getrennt wird. Der summary-Befehl gibt dann die Koeffizienten der Regression und weitere Statistiken hierzu aus:

 R-Demo

Visualisierung mit RStudio

Dies sollte als erster Einblick in den Themenbereich R genügen. Bestimmte Methoden und Verfahrensweisen mit R und Tableau, werden in den folgenden Blogeiträgen dieser Serie näher erläutert. Dies erfolgt anhand von Beispielen, um die Verknüpfung und die Funktionsweise von R und Tableau besser zu verstehen.

Zum nächsten Artikel (Wie wird R mit Tableau verbunden?)