Incom ist die Kommunikations-Plattform der Fachhochschule Potsdam

In seiner Funktionalität auf die Lehre in gestalterischen Studiengängen zugeschnitten... Schnittstelle für die moderne Lehre

Incom ist die Kommunikations-Plattform der Fachhochschule Potsdam mehr erfahren

DATAVIZ AS ASSISTANCE SENSEMAKER ENHANCER SPECULATION

DATAVIZ AS ASSISTANCE SENSEMAKER ENHANCER SPECULATION

visualizing open access summer school – der outcome aus zwei wochen interdiziplinärer projektarbeit

concept: humanistic interpretation as emotional access to data

ausgehend vom heidelberger appell 2009, proklamiert von einer autorengruppe des institutes für textkritik heidelberg um prof. dr. roland reuss, uwe jochum, et al. (corpus reuss) wird mittels einer visualisierung der sentimente eine kontextualisierung des begriffes open access in deutschland vorgenommen. ausgangspunkt ist der bundesländer-atlas open access des open-access-büros berlin, ein weiterer textcorpus als überblick der deutschen medienlandschaft wird dem gegenübergestellt. das verständis von 'data as capta, taken not given' spielt dabei eine zentrale rolle.

SUMMERSCHOOL VISOA

What if the results from publicly funded research were freely available to everyone?

Open Access represents this vision of unrestricted access and use of scholarly publications and further research materials freely available worldwide without any legal, technical or financial barriers. Germany supports this idea at both the federal and state levels. Numerous research and higher education institutions have already issued open access policies and guidelines. Together with their libraries, they engage in open access advocacy activities and offer consultancy on issues related to open access to students and researchers. They build open access repositories and manage publication funds to cover open access publication costs. The project open-access.network collects data on individual institutions at federal state level as well as strategic political activities to showcase best practices and provide an overview of the open access activities.

CHALLENGE

horror vacui der dataviz: wo fängt man an, einen abstrakten datensatz ohne quantitative werte zu visualisieren? der vorliegende datensatz beschreibt die implementierung eines prozesses. welche story läßt sich daraus ableiten? welche grafische aussagen lassen sich zu zeit und zeitlichkeit machen? welche zu ausdruck von negativ und positiv?

HERANGEHENSWEISE

about: methodology

auf dem wege einer sentiment-analyse wird versucht, ein atmosphärisches stimmungsbild des prozess der implementierung der open access strategie und des digitalen publizierens in der deutschen hochschullandschaft zu zeichnen. hierbei sei ausdrücklich darauf hingewiesen, dass im verwendeten textcorpus bei einigen autoren eine deutliche begriffsunschärfe festzustellen ist zwischen den begriffen open access, digitales publizieren und fragen der urheberschaft.

desweiteren sei der allgemeine charakter des methode betont, die die textanalyse aus dem deutschsprachigen raum mit einem deutschen wörterbuch koppelt, um das sentiment einer textquelle auszuwerten und abbilden zu können. dabei wird der gesamte kontext eines textes nach einem keywort count auf sein sentiment mittels der werte score und magnitude beschrieben. siehe auch nächster abschnitt technical aspects.

nach aufbau dieses dataset erfolgt die codierung dieser informationen in visuelle artefakte, die sich zu einem eindruck verdichten, innerhalb welchem sentiment open access in deutschland rezipiert und diskutiert wurde und wird. die visuelle metapher des sternennebels bezieht sich auf das prometheus-motiv: ein titan, der den göttern das feuer (der erkenntnis) stahl, um es den menschen zu bringen.

beabsichtigt ist die herstellung einer visuellen korrelation zwischen dem intellektuellen diskurs einerseits und der implementierung auf hochschulpolitischer ebene mit den instrumenten der berlin declaration 2003/OA2020.

technical aspects: parameters of coding

die grundlegende idee der technischen umsetzung besteht aus der implementierung einer kleinen website. das zugrundeliegende datenset bestehend aus 30 artikeln wurde händisch zusammengestellt und im json-format gespeichert. die daten wurden durch ein python-script verarbeitet, dass mithilfe der nlp library SpaCy (https://spacy.io/universe/project/spacy-sentiws)) und dem deutschen wortschatz dictionary SentiWS (https://wortschatz.uni-leipzig.de/en/download)) für jeden text einen sentiment-score berechnet. die darstellung der resultierenden daten erfolgt über eine html-seite, in der die grafik mithilfe des datavis-frameworks d3.js (https://d3js.org/)) erstellt wird.

die zeitliche komponente der artikel (publikationsdatum) wird auf der x-achse darstellt, während die position auf der y-dimension den sentiment-score widerspiegelt. die einzelnen datenpunkte sind farblich nach veröffentlichungsmedium codiert, die größe und transparenz der punkte spiegeln die magnitude der gemessenen sentiments wieder. je größer und kräftiger der datenpunkt, desto stärker ist die emotionalität des artikels.

reference: humanistic approach

gemäß johanna drucker (UCLA) lässt sich feststellen, dass es sich bei der zugrundeliegenden annahme des begrenzt-selektiven ausschnittes des deutschen medienspiegels im zeitraum 2009-2021 um ein subjektives vorgehen handelt. die verwendeten data sind als capta zu verstehen, die erhoben worden sind im hinblick auf eine definierte fragestellung und einer damit verbundenen spekulative absicht. eine ambiguität und unschärfe wurde bewusst angestrebt, um den subjektiven charakter der methodik auch visuell zu kommunizieren.

dazu auszugsweise drucker, 2011:

recognizing that knowledge is constructed, taken, not simply given as a natural representation of pre-existing facts.

recognition of the interpretative nature of knowledge, that the display itself is conceived to embody qualitative expressions, that the information is understood as graphically constituted.

the concept of data as given has to be rethought through a humanistic lens and characterized as capta, taken and constructed.

ambiguity and complexity including uncertainity, co-dependent relation between observer and experience.

Screen Shot 2021-09-17 at 12.40.22.pngScreen Shot 2021-09-17 at 12.40.22.png

STRUGGLES

dataviz and storytelling: well, looks easy – but it's not. die eigentlich herausforderung ist der umgang und das verständis des datensatzes, welche aussagen sich ableiten lassen und welchen aussagen getroffen werden möchten.

nach anfänglichen hindernissen wurde vorliegender ansatz gewählt, über einen weiteren, selbst erzeugten datensatz einer sentiment-analyse zu gehen, der im wesentlichen eine kontextualisierung des open access prozesses aufzeigt: wissenschaftliche und mediale rezeption und diskussion um einen hochschulpolitischen prozess, der uns aber in gesamtgesellschaftlichen fragen von veröffentlichung und öffentlichen wissensgütern betrifft.

auf dem weg dorthin gab es noch einige sackgassen wie die sperrige und zeitraubende anmeldung zu einem developer-account bei twitter, um über eine datenschnittstelle sentimente dort abrufen zu können. auch war der zugang zu den archiven großer kommerzieller medien kostenpflichtig und schied wegen der angestrebten bandbreite somit auch aus.

PROTOTYPING

Screen Shot 2021-09-18 at 09.32.11.pngScreen Shot 2021-09-18 at 09.32.11.png
Screen Shot 2021-09-17 at 12.42.36.pngScreen Shot 2021-09-17 at 12.42.36.png
Screen Shot 2021-09-17 at 13.06.44.pngScreen Shot 2021-09-17 at 13.06.44.png

auf grundlage des zweiten datensatzes wurde anschließend der grafische prototyp mittels figma erstellt, der einige einfache interaktionen wie scrollen und hover effekte beinhaltet, die in einer weiteren informationsebene details bereitstellen und auf den zugrundeliegenden textcorpus verweisen.

wegen des engen zeitlichen rahmens von zwei wochen wurde parallel die programmierung begonnen, was im rückblick erst wirklich sinn macht, wenn die designphase abgeschlossen und inhaltliche fragen geklärt sind.

CONCLUSIO

potential: speculation as ressource

gingen wir von weiteren ressourcen an zeit, data, (wo)manpower aus, ergäbe sich ein differenzierteres bild der deutschen medienlandschaft zum keyword open access. in einem weiteren schritt könnten weitere keywords wie #urheberrecht #opendata #openscience untersucht werden und vergleichend dargestellt werden und der visualiserung eine multidimensionelle tiefe geben. dieser spekulative ansatz bedient sich einer fiktion von potentiell unendlich erweiterbarer datensätze und ihrer visuellen interpretationen, an denen die grenzen der gestaltung zwischen infografik, code und interface unscharf werden und die einzelnen aussagen, sentimente, haltungen sich zu einem atmosphärischen bild verdichten.

conclusio: surplus of speculation

der mehrwert dieser humamanistischen annäherung an datenvisualisierung ist im eröffnen weiterer interpretationsräume des verständnis sowie kreativer sichtbarmachung abstrakter datensätze zu verorten. auch nimmt es solchen datasets den apodiktischen charakter des vermeintlich objektiv gegebenen und lässt eine deutungsoffenere und mehrdeutigere sichtweise auf selektive ausschnitte der betrachtung komplexer prozesse zu.

dataviz as assistance sensemaker enhancer speculation

LITERATUR

johanna drucker: data as capta_ from information vizualisation to graphical expression of interpretations, in: DHQ, vol.5 no.1, 2011.