Generative Artificial Intelligence, Cultural Context and Discrimination Generative : Künstliche Intelligenzen, kultureller Kontext und Diskriminierung : Datensatz - Textdokumente : [research data]

Valerian Thielicke-Witt; Ana-Nzinga Weiß; Hannah Miltzow

doi:10.18453/rosdok_id00005015

Valerian Thielicke-Witt Ana-Nzinga Weiß Hannah Miltzow

Generative Artificial Intelligence, Cultural Context and Discrimination Generative : Künstliche Intelligenzen, kultureller Kontext und Diskriminierung : Datensatz - Textdokumente : [research data]

University of Rostock, Ludwig-Maximilians-Universität, 2025

https://doi.org/10.18453/rosdok_id00005015

Abstract: The dataset contains data from a qualitative study on texts generated by large language models (Mistral Large Instruct, Gemma 3, DeepSeek R1, Meta Llama 3.1, Llama Sauerkraut, Qwen 3) using various comparable prompts in three different languages (German, English, French) to define diversity in order to identify political and cultural bias in the training material. Each result was generated using a new context window and the same or comparable settings between the LLMs (medium temp, top_p and the same system prompt). The process was repeated at least five times for each prompt in the respective language. In addition, the settings were experimented with in an additional run. In total, the dataset comprises more than 270 comparable documents and more than 50 experimental documents, which are stored as .rtf files and .txt files in the dataset.

Datenpublikation Freier Zugang

Download:

(2.38 MB)Daten
Thielicke-Witt_2025_Daten.zip

MD5-Prüfsumme: 9291c881b2e372198c8c548c83985371

(467 KB)Dokumentation
Thielicke-Witt_2025_Dokumentation.pdf

MD5-Prüfsumme: 5ca3f98a166def88f6a00012d12cc8de

Titel:

Generative Artificial Intelligence, Cultural Context and Discrimination Generative : Künstliche Intelligenzen, kultureller Kontext und Diskriminierung : Datensatz - Textdokumente : [research data]

Beteiligte Personen:

Valerian Thielicke-Witt[VerfasserIn]
	0000-0001-5080-1752
	Universität Rostock, Institut für Politik- und Verwaltungswissenschaft
Ana-Nzinga Weiß[VerfasserIn]
	0000-0002-8624-537X
	LMU München, Institut für Publizistik- und Kommunikationswissenschaft
Hannah Miltzow[VerfasserIn]
	Universität Rostock, Institut für Politik- und Verwaltungswissenschaft

Zusammenfassung:

The dataset contains data from a qualitative study on texts generated by large language models (Mistral Large Instruct, Gemma 3, DeepSeek R1, Meta Llama 3.1, Llama Sauerkraut, Qwen 3) using various comparable prompts in three different languages (German, English, French) to define diversity in order to identify political and cultural bias in the training material. Each result was generated using a new context window and the same or comparable settings between the LLMs (medium temp, top_p and the same system prompt). The process was repeated at least five times for each prompt in the respective language. In addition, the settings were experimented with in an additional run. In total, the dataset comprises more than 270 comparable documents and more than 50 experimental documents, which are stored as .rtf files and .txt files in the dataset. [Englisch]

Dokumenttyp:

Datenpublikation

Einrichtung:

Wirtschafts- und Sozialwissenschaftliche Fakultät

Sprache:

Englisch

Sachgruppe der DNB:

000 Allgemeines, Wissenschaft

300 Sozialwissenschaften, Soziologie, Anthropologie

320 Politik

Veröffentlichung /
Entstehung:

Rostock: University of Rostock

München: Ludwig-Maximilians-Universität

2025

Verantwortlichkeitsangabe:

Valerian Thielicke-Witt, Ana-Nzinga Weiß, Hannah Miltzow

Anmerkungen:

Das Projekt wurde durch die Interdisziplinäre Fakultät (INF) der Universität Rostock im Rahmen des Bereichs "Wissen - Kultur - Transformation" (WKT) gefördert.

Identifikatoren:

K10plus-ID:	1945030178
URN:	urn:nbn:de:gbv:28-rosdok_id00005015-0
DOI:	10.18453/rosdok_id00005015
PURL:	https://purl.uni-rostock.de/rosdok/id00005015

Zugang:

frei zugänglich (Open Access)

Lizenz/Rechtehinweis:

CC BY-NC 4.0
Dieses Werk ist lizenziert unter einer
Creative Commons Namensnennung-Nicht kommerziell 4.0 International Lizenz.

RosDok-ID:

rosdok_document_0000026684

erstellt / geändert am:

01.12.2025 / 09.12.2025

Metadaten-Lizenz:

Die Metadaten zu diesem Dokument sind gemeinfrei
(CC0 1.0 Universal Public Domain Dedication).

Daten	Thielicke-Witt_2025_Daten.zip (2,38 MB; MD5: 9291c881b2e372198c8c548c83985371)
Dokumentation	Thielicke-Witt_2025_Dokumentation.pdf (467,1 KB; MD5: 5ca3f98a166def88f6a00012d12cc8de)

Generative Artificial Intelligence, Cultural Context and Discrimination Generative : Künstliche Intelligenzen, kultureller Kontext und Diskriminierung : Datensatz - Textdokumente : [research data]

Dauerhaft zitieren

Portale

Rechte

Export

Teilen

Kontakt

Service

MyCoRe