Erstellen, Nutzen und Analysieren von Forschungsdaten
Nachnutzung bereits vorhandener Forschungsdaten
Vor Beginn einer Forschungsarbeit lohnt es sich, nach bereits vorhandenen Forschungsdaten zu suchen, die möglicherweise nachgenutzt werden können. Auf der Seite „Suche nach Forschungsdaten“ sind Informationen zur Suche nach romanistischen Daten zusammengestellt.
Digitale Methoden, Tools und virtuelle Forschungsumgebungen
Die Art der Nutzung bzw. der Analyse von Forschungsdaten unterscheidet sich je nach Disziplin und Forschungsfrage und muss jeweils am eigenen Forschungsvorhaben ausgerichtet werden. Da Forschungsdaten in der Regel digital vorliegen, bieten sie, über traditionelle (beispielsweise hermeneutische) Arbeitstechniken hinaus, die Möglichkeit zur Untersuchung mit Hilfe computergestützter Methoden, wie sie unter anderem in den Digital Humanities zum Einsatz kommen.
Zu den dabei eingesetzten Methoden stellt der FID nach und nach einführende Materialien, romanistische Anwendungsbeispiele und einschlägige Tools zusammen:
- Datenvisualisierung: Tools
- Digitale Korpusanalyse: Tools
- Stilometrie: Tutorials, Anwendungsszenarien, Werkzeuge
- Textannotation: Tools
- Textedition: Tools
- Topic Modeling: Tools
- Wortfrequenzanalyse, Konkordanz: Tools
Wertvolle Hinweise und Anleitungen zur (linguistischen) Arbeit mit Texten bietet das Wiki Textdaten Romanistik der Freien Universität Berlin. Darüber hinaus empfiehlt sich ein Blick in andere geisteswissenschafliche Projekte, die zwar keinen ausdrücklich romanistischen Ansatz verfolgen, aber sehr hilflreiche nachnutzbare Einführungen erarbeiten. forTEXT bietet beispielsweise Informationen zu einzelnen digitalen Methoden für die (germanistische) Literaturwissenschaft und erklärt die dafür geeigneten Tools. CLARIN-D stellt etwa computergestützte Arbeitstechniken vor, die besonders für die Sprachwissenschaft von Interesse sind.
Neben einzelnen Werkzeugen gibt es auch sogenannte virtuelle Forschungsumgebungen, die als Arbeitsplattformen den gesamten Forschungsprozess unterstützen können. Sie ermöglichen etwa die Anwendung integrierter Tools und Methoden zur Analyse und Dokumentation der Daten sowie deren Speicherung und bieten darüber hinaus oft Hilfestellung und Informationsmaterial an. Beispiele für virtuelle Forschungsumgebungen sind:
- CLARIN-D (Schwerpunkt Linguistik)
- DARIAH-DE (für die Geistes- und Kulturwissenschaften)
- TextGrid (Literaturwissenschaft)
- Forschungsnetzwerk und Datenbanksystem (FuD) (Geistes- und Sozialwissenschaft)
- Revistas Culturales (spanischsprachige Kulturzeitschriften der Moderne)
- Verba Alpina (Arbeiten zum alpinen Kulturraum)
- Hamburger Zentrum für Sprachkorpora (HZSK) (Linguistik)
Die im Folgenden aufgelistete einschlägige Fachliteratur bietet einen Einstieg zu häufig genutzten Arbeitstechniken:
- Archer, Jodie / Jockers, Matthew Lee: The bestseller code. Anatomy of the blockbuster novel. New York: St. Martin's Press, 2016.
- Bock, Sina / Du, Keli / Huber, Michael / Pernes, Stefan / Pielström, Steffen: Der Einsatz quantitativer Textanalyse in den Geisteswissenschaften: Bericht über den Stand der Forschung. Göttingen: GOEDOC, Dokumenten- und Publikationsserver der Georg-August-Universität, 2016 (DARIAH-DE Working Papers, 18), urn:nbn:de:gbv:7-dariah-2016-4-0.
- Frey-Endres, Marcel / Simon, Tobias / Bartsch, Sabine / Gius, Evelyn / Müller, Marcus / Rapp, Andrea / Weitin, Thomas: Digitale Werkzeuge zur textbasierten Annotation, Korpusanalyse und Netzwerkanalyse in den Geisteswissenschaften. Darmstadt: TU Prints, 2021, DOI: 10.26083/TUPRINTS-00017850.
- Jannidis, Fotis: „6. Methoden der computergestützten Textanalyse“. In: Nünning, Ansgar / Nünning, Vera (Hgg.): Methoden der literatur- und kulturwissenschaftlichen Textanalyse: Ansätze – Grundlagen – Modellanalysen. Stuttgart: Metzler, 2010, S. 109–132.
- Jannidis, Fotis / Kohle, Hubertus / Rehbein, Malte: Digital Humanities. Eine Einführung. Stuttgart: Metzler, 2017.
- Klawitter, Jana (Hg.): Kulturwissenschaften digital. Neue Forschungsfragen und Methoden. Frankfurt a.M.: Campus 2012.
- Lücke, Stephan / Riepl, Christian / Trautmann, Carolin: „Softwaretools und Methoden für die korpuslinguistische Praxis“. In: Korpus im Text 1/2017, http://www.kit.gwi.uni-muenchen.de/?band=softwaretools-und-methoden-fuer-die-korpuslinguistische-praxis.
- Mahoney-Steel, Tamsyn: Nota Bene. Making Digital Marks on Medieval Manuscripts. New York / Bern / Berlin: Peter Lang 2018.
- Schöch, Christof: „Ein digitales Textformat für die Literaturwissenschaften. Die Richtlinien der Text Encoding Initiative und ihr Nutzen für Textedition und Textanalyse“. In: Romanische Studien 4/2016, S. 325–364, http://www.romanischestudien.de/index.php/rst/article/view/58/599.
Nutzung von anerkannten Standards
Um eine reibungslose Verarbeitung von Forschungsdaten zu gewährleisten, ist der Rückgriff auf frei zugängliche und anerkannte Standards und Formate unabdingbar. Dies erleichtert auch die Nachvollziehbarkeit und eventuelle Nachnutzung der Daten. Einige Institutionen haben dazu entsprechende Empfehlungen vorgelegt:
- DFG: Empfehlungen zu datentechnischen Standards und Tools bei der Erhebung von Sprachkorpora
- DFG: Förderkriterien für wissenschaftliche Editionen in der Literaturwissenschaft (Hinweise zu Standards auf S. 4)
- DFG: DFG-Praxisregeln „Digitalisierung“
Obwohl es sich dabei nicht um einen Standard im eigentlichen Sinn handelt, werden häufig die FAIR-Prinzipien als Richtlinie für das Forschungsdatenmanagement angeführt. Sie sind eng mit den Metadaten eines Datensatzes verknüpft.
Die Auswahl der Standards und Tools hängt dabei stets von der zugrunde liegenden Forschungsfrage ab.
Dokumentation von Forschungsdaten / Erstellung von Metadaten
Die Dokumentation ist ein wichtiger Aspekt des Forschungsdatenmanagements. Sie bildet die Grundlage zur Sicherstellung, dass der Forschungsprozess und die Ergebnisse auch nach Ende des Forschungsvorhabens nachvollziehbar sind (siehe Abschnitt „Speicherung und Langzeitarchivierung“).
Zu diesem Zweck ist es sinnvoll, Forschungsdaten mit sogenannten Metadaten zu versehen, also mit Daten, die formale, inhaltliche, administrative und technische Informationen über Forschungsdaten beinhalten. Metadaten können nicht nur als Basis für spezifische Untersuchungsmethoden dienen, sondern auch die Verzeichnung der Forschungsdaten in entsprechenden Nachweisinstrumenten erleichtern und so deren Auffindbarkeit verbessern.
Bei der Verwendung eines Repositoriums werden Metadaten in der Regel über eine Beschreibungsmaske abgefragt. Obwohl häufig nur ein kleiner Teil der Felder als verpflichtend gekennzeichnet ist, empfiehlt es sich, möglichst umfangreiche Angaben zu machen.
Auch bei Metadaten ist die Verwendung von Standards zu beachten (siehe Abschnitt „Nutzung von anerkannten Standards“).
Sehr empfehlenswert in diesem Zusammenhang ist der Blog-Beitrag von Ursula Winter (AG Digitale Romanistik): Qualitative Metadaten – Hilfe und Herausforderung zugleich
Das Projekt „Forschungsdatenmanagement Bayern“ (fdm-bayern.org) hat zu diesem Themenkreis ebenso kurze wie anschauliche Video-Tutorials verfasst:
- Metadaten: eine Einführung
- Metadatenarten und -schemata
- Beschreibung von Forschungsdaten am Beispiel von DataCite
- Normdaten
Zum Thema Normdaten hat auch das Konsortium NFDI4Culture eine Video-Handreichung bereitgestellt:
Weiterführende Hinweise:
- Abschnitt Beschreiben und Dokumentieren auf forschungsdaten.info
- Fachspezifische Empfehlungen für Daten und Metadaten im Wiki von DARIAH-DE