MENÜ
Prof. Dr. Stefanie Dipper

Linguistische Annotation von Nichtstandardvarietäten – Guidelines und „Best Practices“

Gefördert vom BMBF

Das Projekt zielt darauf ab, den Fokus der Korpuserstellung und -analyse über die Zeitungssprache hinaus auch auf andere Varietäten zu lenken, wie z.B. Sprache im Internet, Sprache von Lernenden oder gesprochene Sprache. Die entsprechenden Sprachdaten stellen etablierte Methoden in Frage. Beispielsweise liefern gängige Tokenizer angewendet auf Chat-Daten nur unbefriedigende Ergebnisse, und Annotationsguidelines sehen keine Richtlinien für die Annotation von abweichenden Strukturen vor, wie man sie in Texten von Deutschlernenden findet.

Projekt in Kooperation mit:

Prof. Lüdeling, HU Berlin