Screencasts



Ein Screencast ist eine Anleitung in Videoform, die einen Bildschirm aufzeichnet und Ihnen dadurch die Verwendung einer Software näherbringt. Während der Screencast Vorgänge mit gemächlicher Geschwindigkeit demonstriert, helfen Ihnen schriftliche Kommentare, den Prozess noch besser nachvollziehen zu können.

Die Screencasts konzentrieren sich dabei immer auf einen individuellen Bereich. Falls Sie sich noch nicht für einen bestimmten Bereich interessieren, hilft es, die Screencasts in chronologischer Reihenfolge anzusehen. Es existiert zu jeder Operation ein Screencast. Im Inhaltsverzeichnis finden Sie eine Auflistung der einzelnen Screencasts. Die Liste ist gruppiert nach Modulen (Dashboard, Preprocessing und Visualisierung) und nach der Reihenfolge der Operationen. Indem Sie auf einen Punkt des Inhaltsverzeichnisses klicken, gelangen Sie zu dem gewünschten Screencast. Wenn Sie gerade erst mit MAX begonnen haben und sich unschlüssig sind, welche Operation Ihnen helfen könnte, empfiehlt es sich, eines der Anwendungsbeispiele zu konsultieren.

Dashboard

Museum laden

Bevor Sie mit den Bereichen Preprocessing und Visualisierung beginnen können, müssen Sie zunächst entweder ein „Museum laden“ oder ein „Museum importieren“. Wenn Sie ein Museum laden, greifen Sie auf den Bestand von MAX zurück, der mehrere Dutzend Museen umfasst. Im linken unteren Bereich von „Museum laden“ finden Sie ein Textfeld, das Ihnen die Suche nach bestimmten Museen ermöglicht.

Museum importieren

Alternativ zum gegebenen Datenbestand können Sie auch Ihre eigenen Daten verwenden. „Museum importieren“ unterstützt CSV- und RDS-Dateien. Bei CSV-Dateien ist es notwendig zu definieren, ob Spaltennamen vorliegen und welcher Tabulator bzw. welche Anführungszeichen verwendet wurden.

Bugreport

Falls eine Fehlermeldung erscheint oder das Verhalten von MAX nicht mit Ihren Erwartungen übereinstimmt, können Sie einen Bugreport erstellen. Wir freuen uns über jeden Bugreport, da MAX dadurch weiter optimiert werden kann. Bitte beschreiben Sie den Fehler und Ihre letzten Arbeitsschritte vor dem Fehler äußerst detailliert.

Preprocessing

Zeilenoperationen

Filter übernehmen

Filter ermöglichen es Ihnen, die Daten zu reduzieren. Es gibt spaltenspezifische und einen globalen Filter. Spaltenspezifische Filter befinden sich über der jeweiligen Spalte, der globale Filter am linken unteren Rand der Tabelle. Es sind Filterparameter wie Begriffe, Zahlen oder Reguläre Ausdrücke möglich. Eingegebene Parameter sind über die Zeilenoperation „Filter übernehmen“ zu setzen, andernfalls verfallen die Eingaben mit der nächsten Aktion.

Filter löschen

Nachdem Sie einen oder mehrere Filterparameter mit „Filter übernehmen“ gespeichert haben, können Sie in chronologischer Reihenfolge den jeweils letzten Filter mit der Operation „Letzten Filter löschen“ entfernen. Mit der Operation „Alle Filter löschen“ können Sie hingegen alle Filter in einem Schritt entfernen.

Doppelte Zeilen entfernen

„Doppelte Zeilen entfernen“ ist eine intelligente Operation, die doppelte Einträge entfernen kann. Sie definieren, welche Spalte als Kriterium gelten soll. Wählen Sie zum Beispiel die Spalte Künstler, wird die erste Nennung eines Künstlers behalten, alle folgenden Nennungen werden entfernt. Dadurch erhalten Sie einen Datensatz, der jeden Künstler genau einmal beinhaltet. Wählen Sie wiederum zwei Spalten, bspw. Künstler und Kunstwerk, behält die Operation jede individuelle Kombination aus Künstler und Kunstwerk genau einmal.

Spaltenoperationen

Spaltentyp ändern

Jede Spalte hat einen Spaltentyp. Insgesamt gibt es vier Spaltentypen: numeric, character, factor und logical. Standardmäßig haben alle Spalten den Typ character. Der Spaltentyp ist entscheidend für die durchführbaren Operationen. Mathematische Operationen können Sie bspw. nur an einer Spalte mit Typ numeric anwenden. Die Operation „Spaltentyp ändern“ ermöglicht es Ihnen, den Typ nach Bedarf anzupassen; hierbei sind jedoch die Spalteninhalte zu beachten. Eine Spalte mit Typ numeric kann nur Zahlenwerte beinhalten – bei der Änderung des Typs werden alle anderen Inhalte entfernt.

Spaltennamen ändern

„Spaltennamen ändern“ ermöglicht es Ihnen, einen oder mehrere Spaltennamen anzupassen. Langfristig kann dies die Übersichtlichkeit Ihrer Daten erhöhen. Für den Vorgang sind die zu ändernden Spalten auszuwählen und die neuen Namen in der identischen Reihenfolge anzugeben. Der Vorgang wird Ihnen im Screencast demonstriert.

Spalten vereinen, trennen und löschen

Sie können zwei oder mehrere Spalten mit „Spalten vereinen“ zusammenführen. Für diese Operation kann ein Trennzeichen (Leerzeichen, Bindestrich etc.) angegeben werden. Dieses Zeichen trennt die Inhalte der vereinten Spalten. Die vereinten Inhalte werden in einer neuen Spalte angelegt. Ebenfalls ist es Ihnen möglich, Inhalte einer Spalte zu trennen. Die Operation kann auf eine oder mehrere Spalten gleichzeitig angewendet werden. Die Spalten werden vor und nach dem definierten Trennzeichen getrennt. Falls Sie bestimmte Spalten nicht benötigen, können Sie diese mit „Spalten löschen“ entfernen.

Zellenoperationen

Änderungen übernehmen

Durch einen Doppelklick auf eine individuelle Zelle können Sie diese editieren. Innerhalb einer Tabellenseite und innerhalb des gleichen Arbeitsschrittes können beliebig viele Zellen bearbeitet werden. Vor der Ausführung weiterer Operation oder einem Wechsel innerhalb der Paginierung sind Änderungen mit „Änderungen übernehmen“ zu sichern. Die Operation sichert somit die andernfalls temporären Änderungen.

Zeichenfolgen ersetzen

„Zeichenfolgen ersetzen“ ermöglicht es Ihnen, in beliebig vielen Spalten innerhalb eines Arbeitsschrittes mehrere Zeichenfolgen zu ersetzen. Die zu ersetzende und die neue Zeichenfolge sind mit „ = “ einander zuzuweisen (z. B. „Kirschbaumholz = Holz“). Die einzelnen Zuweisungen sind im Eingabefeld durch Zeilenumbrüche zu separieren. Bei dieser Operation können Sie Reguläre Ausdrücke für die Angabe der ursprünglichen Zeichenfolgen verwenden.

Sonstiges

R-Code anwenden

R ist die Programmiersprache, auf der MAX basiert. Entsprechend können sie auch R-Code anwenden. Die Operation „R-Code anwenden“ öffnet Ihnen ein Feld für die Eingabe von R-Code. Das ausgewählte Museum kann über das Objekt „data“ angesprochen werden. Mehrere Operationen sind durch einen Zeilenumbruch oder ein Semikolon zu trennen. Funktionen mit Output erzeugen einen Overlay über das restliche Interface.

Regulären Ausdruck anwenden

Mit einem Regulären Ausdruck können Sie ein Schema erstellen, das eine bestimmte Abfolge von Zeichen definiert. Die Operation ermöglicht es Ihnen, eine oder mehrere Spalten nach einem festgelegten Schema zu durchsuchen. Liegen passende Zeichenfolgen in einer Spalte vor, werden diese extrahiert und in einer neuen Spalte abgelegt. Existieren in einer Zelle mehrere Treffer, werden diese in der Reihenfolge ihres Auftretens in separaten Spalten angelegt; dabei werden so viele Spalten wie nötig generiert.

Funktion über Gruppen anwenden

Mit „Funktion über Gruppen anwenden“ können Sie Werte zählen, mitteln oder summieren. Hierfür wählen Sie zwei Spalten: Auf die erste wird die Funktion angewendet, die zweite dient der Gruppenbildung. Um bspw. eine Liste zu erhalten, die die Anzahl der Kunstwerke je Künstler beinhaltet, würden Sie in der Reihenfolge Ihrer Nennung die Spalte Kunstwerk und Künstler auswählen und die Funktion „Werte zählen“ verwenden.

Museum exportieren

„Museum exportieren“ ermöglicht es Ihnen, den Datensatz des ausgewählten Museums mit den bereits durchgeführten Modifizierungen herunterzuladen. Hierbei können Sie zwischen den Dateiformaten CSV und RDS wählen, wobei das CSV-Format Inhalte mit Tabulatoren und Anführungsstrichen voneinander separiert. Der Datensatz umfasst nur den letzten Stand der Daten und beinhaltet keine Historie.

Historie

Im Preprocessing steht Ihnen eine Historie zur Verfügung. Die Funktion ermöglicht einen Überblick der durchgeführten Operationen, das Vor- und Zurückspringen zwischen Bearbeitungsständen und Details zu den Operationen. Die Details sind als Hover-Effekt zu sehen. Dieser Effekt wird durch das Auflegen des Mauszeigers auf den Arbeitsschritt eingeblendet. Das Speichern einer Historie ermöglicht es Ihnen, eine Abfolge von Operationen für den verwendeten Datensatz später wiederzuverwenden. Durch das Speichern wird eine RDS-Datei heruntergeladen. Mit dem Laden einer Historie wenden Sie die zuvor exportierten Arbeitsschritte erneut an. Sie können „Speichern“ und „Laden“ mit einem Klick auf das Ordnersymbol im rechten oberen Eck der Historie ausführen.

Visualisierung

Diagrammarten

Welche Diagrammart für die Darstellung der Daten verwendet wird, entscheidet MAX basierend auf dem Spaltentyp automatisch. Um aussagekräftige Diagramme zu erhalten, ist es indes notwenig, vor der Visualisierung die Spaltentypen zu ändern. Der Zusammenhang zwischen den Diagrammarten und Spaltentypen wird Ihnen im Screencast erklärt.

Zoom, Beschriftung und Export

Die Visualisierung ermöglicht es Ihnen, Ihre Daten visuell zu explorieren. Um bei der Exploration Details erkennen zu können, bietet Ihnen die Visualisierung einen Zoom. Halten Sie für den Zoom die Maustaste gedrückt und ziehen Sie ein Fenster über den gewünschten Bereich. Nachdem Sie das optimale Diagramm erstellt haben, können Sie Ihre Darstellung beschriften und als JPEG- oder PNG-Datei exportieren. Den Export finden Sie im rechten oberen Eck in Form von drei horizontalen Strichen.