Vortrag zu Forschungsethik und „Big Data“ im November in Wien

Mal wieder ein kurzes Lebenszeichen aus Hamburch, diesmal mit erfreulichen Nachrichten: Das Programm zur Tagung „Digital Methods“ der DGPuK-Fachgruppe „Computervermittelte Kommunikation“, die vom 8. bis 9. November 2013 in Wien stattfinden wird, ist online.

Die aufmerksame LeserIn wird erkennen, dass ich auf der Tagung im (hoffentlich) besten Sinne „umtriebig“ sein werde. Zum einen organisiere ich, gemeinsam mit dem geschätzten Wiener Kollegen Axel Maireder, im Vorfeld der Tagung den Workshop „Anything goes? Ethische Perspektiven und Herausforderungen onlinebasierter Forschung“ (Zeit wird’s für so etwas!), und darf während der Tagung ein Panel zu Interpersonaler Kommunikation moderieren, auf das ich schon gespannt bin.

Und zum anderen werde ich selbst einen Vortrag halten, mit dem (Arbeits-)Titel: „Big Data – small problems? Ethische Perspektiven auf Forschung unter Zuhilfenahme onlinebasierter Kommunikationsspuren“. Aus diesem Grund möchte ich gerne das Extended Abstract dazu hier veröffentlichen und zur Diskussion stellen – was ist Eure/Ihre Meinung zum Thema? Welche Perspektiven oder Lösungsansätze gibt es dazu aus anderen Disziplinen?

Hier nun also das Abstract:

Wohl kaum eine „Neuerung“ hat in den vergangenen Jahren für derart großes Aufsehen und ein entsprechendes Echo in akademischen Diskursen gesorgt wie die Verwendung von „big data“ für (sozial-)wissenschaftliche Analysen. Verstanden werden hierunter „massive quantities of information produced by and about people, things, and their interactions“ (boyd/Crawford 2011: 1) sowie deren Erfassung, Speicherung und Verwertung, z. B. mittels statistischer Analyseverfahren oder Netzwerkanalysen.

Zwar werden hierdurch verschiedene Forschungsprozesse erleichtert, indem z. B. Informationen über Datenbanken und so genannte APIs erschlossen werden können. Allerdings stellen sich auch neue methodologische Fragen, z. B. im Hinblick auf die Archivierbarkeit, den Gehalt sowie die inhärenten „biases“ solcher Daten (vgl. Burgess/Bruns 2012; Crawford 2013), sowie nach der zunehmenden Bedeutung ihrer „Verwalter“, wie z. B. Twitter (Gillespie 2010). Und auch die Diskussion um eine notwendige Kontextualisierung von „big social data“ mittels qualitativer Verfahren hat unlängst begonnen (vgl. Manovich 2012).

Seltener indes werden die ethischen Implikationen dieser neuen Form onlinebasierter Forschung diskutiert. Gegenstand des Vortrags ist eine forschungsethische Einordnung der Erfassung und Analyse nutzergenerierter Verhaltensspuren unter Rückgriff auf die von Heise (2013) identifizierten Kontexte der Internetforschungsethik. Demnach sollen aufgrund der „hybriden Rolle“ der WissenschaftlerIn – als ErforscherIn und NutzerIn von Online-Kommunikation – im Verlaufe des Forschungsprozesses sowohl forschungs- als auch kommunikationsethische Prinzipien befolgt werden.

Vor dem Hintergrund einer solchen Lesart berührt Forschung mittels onlinebasierter „big data“ auch verschiedene kommunikationsethische Prinzipien, insbesondere die Wahrung der „Personalität“, also die Achtung Anderer als Selbstzweck und das Verbot einer Verdinglichung bzw. Instrumentalisierung von Personen (Wolff 2007): Während dieses Prinzip schon bei herkömmlichen standardisierten Verfahren „verwässert“, verschwindet die einzelne Nutzerin in großen, z. T. Millionen Einzeldaten umfassenden Datensätzen mehr oder weniger vollständig. Dass eine solche Form der Datenaggregierung ethisch bedenklich sei, hebt z. B. McFarland (2012) hevor: „because it dehumanizes those being judged (…) and thus threats those profiled objects as collections of facts, rather than as persons”.

Gleichsam berührt die Verwendung von „big data“ grundlegende Standards – Freiwilligkeit, informierte Einwilligung, Datenschutz, Anonymität – und Prinzipien der Forschungsethik  wie auch die Wertbasis von Wissenschaft allgemein (u. a. Diener/Crandall 1978; Fenner 2010). Vier forschungsethische Prinzipien (vgl. Strohm Kitchener und Kitchener 2009) seien hier exemplarisch herausgestellt:

  • Nonmaleficence: im Hinblick auf die Nichtschädigung stellen sich nicht nur Fragen nach der Vermeidung möglicher Risiken (für beforschte Personen/-gruppen), sondern auch nach dem Schutz von (sensiblen) Daten, der Privatsphäre sowie der Anonymisierung von Daten. So zeigt das von Zimmer (2010) diskutierte Beispiel einer US-amerikanischen Forschungsgruppe, die große Facebook-Nutzerdatensätze veröffentlichte, dass „big data“ nicht per se anonym sind. Und auch die vieldiskutierte Frage nach der (Nicht-)Öffentlichkeit bzw. Privatheit verschiedener Daten ist hier bedeutungsvoll (Schmidt 2009; boyd/Crawford 2011).
  • Beneficence: Hierbei geht es nicht nur um Wohlergehen, Autonomie und Selbstbestimmung der TeilnehmerInnen, sondern auch um die Anerkennung und Respektierung ihrer Werte und Entscheidungen, z. B. hinsichtlich der Frage nach einem „informed consent“ und der Wahrung ihres Rechtes auf informationelle Selbstbestimmung (vgl. Schmidt 2012) im Rahmen von „big data“-Analysen. Zudem stellt sich implizit die Frage, welchen (gesellschaftlichen) Nutzen und Folgen derartige Analysen haben, z. B. mittels „predictive analytics“ (Wen 2012)? Und welchen konkreten Einfluss hat die Deutung von „big data“ und deren inhärenten „biases“ auf das Leben von Menschen?
  • Justice: Im Hinblick auf das Prinzip, dass alle Menschen gleich behandelt werden sollen, stellt sich u. a. die Frage, welche Menschen von „big data“-Analysen ausgeschlossen sind (z. B. aufgrund der Nicht-Nutzung sozialer Netzwerke) und welche Konsequenzen dies hat. Oder in den Worten von Crawford (2013): „What happens if you live in the shadow of big data sets?” Auch hinsichtlich der Kontrolle, Macht und dem Zugang zu Daten gilt es dieses Prinzip zu hinterfragen, denn: “researchers have the tools and access, while social media users as a whole do not“ (boyd/Crawford 2011, S. 11).
  • Fidelity: Das Vertrauensprinzip bezieht sich nicht nur auf die informierte Einwilligung oder Datenschutz, sondern auch auf die Offenlegung von Forschung sowie das Ernstnehmen etwaiger Ängste und Bedenken seitens der NutzerInnen. So führt die jüngste Bekanntmachung massiver Ausspäh-Vorgänge durch die NSA einmal mehr vor Augen, wie wichtig es ist onlinebasierte Forschung vom Verdacht einer (verdeckten) „Überwachung“ der NutzerInnen abzugrenzen.

Die Frage „big data – small problems?“ muss im Hinblick auf forschungsethische Aspekte wohl eher verneint werden. Vielmehr kann und sollte das Aufkommen einer „data-driven science“ als Erinnerung an die besondere Verantwortung der Forschung verstanden werden. Denn wieder einmal stehen Wissenschaftler verschiedenster Disziplinen vor der Herausforderung, technische Machbarkeit und ethische Vertretbarkeit ihres Handelns abzuwägen (Eynon et al. 2009; Fraas et al. 2012). Vor diesem Hintergrund ist es nicht nur Ziel des Vortrages, die mannigfaltigen ethischen Fragen und „Dilemmata“ von Forschung auf Basis von „big data“ aufzuzeigen. Gleichsam geht damit eine Einladung an das Plenum – und an die scientific community – einher, jene Fragen gemeinsam zu diskutieren und Lösungsansätze zu entwickeln, etwa mittels der Umsetzung von Prinzipien wie Transparenz, Sicherheit und Accountability (Wen 2012).

Literatur:

boyd, d., & Crawford, K. (2011). Six Provocations for Big Data. http://softwarestudies.com/cultural_analytics/Six_Provocations_for_Big_Data.pdf. Zugegriffen: 9. Juni 2013.

Burgess, J., & Bruns, A. (2012). Twitter Archives and the Challenges of ‘Big Social Data’ for Media and Communication Research. M/C Journal, 15(5). http://journal.media-culture.org.au/index.php/mcjournal/article/viewArticle/561/0. Zugegriffen: 10. Juni 2013.

Crawford, K. (2013). The Hidden Biases of Big Data. http://blogs.hbr.org/cs/2013/04/the_hidden_biases_in_big_data.html. Zugegriffen: 10. Juni 2013.

Diener, E., & Crandall, R. (1978). Ethics in Social and Behavioral Research. Chicago: University of Chicago Press.

Eynon, R., Schroeder, R., & Fry, J. (2009). New Techniques in Online Research. Challenges for Research Ethics. 21st Century Society, 4(2), 187–199.

Fenner, D. (2010). Einführung in die Angewandte Ethik. Tübingen: Francke.

Fraas, C., Meier, S., & Pentzold, C. (2012). Online-Kommunikation. Grundlagen, Praxisfelder und Methoden. Wien: Oldenbourg Verlag.

Gillespie, T. (2010). The Politics of ‘Platforms’. New Media & Society, 12(3), 347–364.

Heise, N. (2013). ‘Doing it for real’ – Authentizität als kommunikationsethische Voraussetzung onlinebasierter Forschung. In M. Emmer, A. Filipovic, J.-H. Schmidt, & I. Stapf (Hrsg.), Echtheit, Wahrheit, Ehrlichkeit. Authentizität in der computervermittelten Kommunikation (S. 88–109). Weinheim: Juventa (Text hier im Blog).

Manovich, L. (2012). Trending: The Promises and the Challenges of Big Social Data. http://www.manovich.net/DOCS/Manovich_trending_paper.pdf. Zugegriffen: 9. Juni 2013.

McFarland, M. (2012). Ethical Implications of Data Aggregation. http://www.scu.edu/ethics/practicing/focusareas/technology/internet/privacy/data-aggregation.html. Zugegriffen: 10. Juni 2013.

Schmidt, J.-H. (2009). Braucht das Web 2.0 eine eigene Forschungsethik? Zeitschrift für Kommunikationsökologie und Medienethik, 11(2), 40–44.

Schmidt, J.-H. (2012). Persönliche Öffentlichkeiten und informationelle Selbstbestimmung im Social Web. In J.-H. Schmidt, & T. Weichert (Hrsg.), Datenschutz (S. 215-225). Bonn: Bundeszentrale für politische Bildung.

Strohm Kitchener, K., & Kitchener, R. F. (2009). Social Research Ethics. Historical and Philosophical Issues. In D. Mertens, & P. E. Ginsberg (Hrsg.), The Handbook of Social Research Ethics (S. 5–22). Thousand Oaks: Sage Publications.

Wen, H. (2012). The Ethics of Big Data. http://www.forbes.com/sites/oreillymedia/2012/06/21/the-ethics-of-big-data. Zugegriffen: 10. Juni 2013.

Wolff, O. J. (2007). Kommunikationsethik des Internets: eine anthropologisch-theologische Grundlegung. Hamburg: Verlag Dr. Kovač.

Zimmer, M. (2010). ‘But the data is already public’: on the ethics of research on Facebook. Ethics and Information Technology, 12(4), 313–326.

—–

UPDATE: die Folien zum Vortrag stehen nun auch online (Slideshare).