Human-Centered Data Science


Wir sind eine von Prof. Lisa Beinborn gegründete Forschungsgruppe. Wir arbeiten an Natural Language Processing (NLP) mit einem menschzentriertem Ansatz und sind dem Institut für Informatik und dem Campus-Institut Data Science der Georg-August Universität Göttingen angegliedert.

Team

Wir wachsen. Werde Teil unseres Teams!

Prof. Lisa Beinborn
Gruppenleiterin

Jonas Mayer Martins
PhD Student

Zhuojing Huang
PhD Student

Jana Hackethal
Assistentin

Aktuelles

  1. Lisa Beinborn wurde eingeladen, den Festvortrag beim Neujahrsempfang der Universität zu halten. Sie sprach über "Sprache modellieren — Das Zusammenspiel von Informatik, Linguistik und Psychologie".

  2. Lisa Beinborn wurde mit einemImpuls-Professur Stipendium ausgezeichnet, um an polyvokalen Sprachmodellen zu arbeiten, die sprachübergreifende und individuelle Unterschiede berücksichtigen können.

  3. Unsere Gruppe war sehr aktiv auf derEMNLP Konferenz 2024 in Miami:

    • Wir haben die Frequenzverzerrung aktueller Sprachmodelle untersucht und stellen einen neuen Ansatz namens Syntactic Smoothing vor, der sowohl die Frequenzverzerrung als auch die Anisotropie des Repräsentationsraums reduziert.

    • Unsere Gruppe hat beide Preise für herausragende Arbeiten bei der ConLL BabyLM Challenge gewonnen. Lisa Beinborn arbeitete mit Forschern aus Cambridge zusammen, um die Fähigkeiten eines Sprachmodells zu analysieren, das aus sprachähnlichen Eingaben lernt, die als Phoneme dargestellt werden. Unsere Gastforscherin Miyu Oba arbeitete an Variationsmengen. Für das Pre-Training des Sprachmodells verwendete sie zusammen mit einer Gruppe von Wissenschaftlern aus Groningen und Tokio-Nara systematisch verschiedene Mengen von Sätzen, die eine ähnliche Absicht ausdrücken.

    • Jenia Kim präsentierte auf dem TSAR Workshop ihre Ideen für die adaptive Vereinfachung von kommunalen Texten.

    • Miyu Oba zeigte, dass es Sprachmodellen immer noch schwer fällt grammatikalisches Wissen aus indirekten Hinweisen abzuleiten.

  4. Lisa Beinborn und Nora Hollenstein haben ein Buch über Kognitive Plausibilität in Natural Language Processing geschrieben.


Forschung


Wir entwickeln computergestützte Modelle, die menschliche Variation, Unsicherheit und kognitive Komplexität berücksichtigen, und interessieren uns derzeit vor allem für die folgenden Themen:
  • Multilingual NLP
  • Kognitiv plausibles Representation Learning
  • Interpretierbarkeit und Bias von Machine-Learning-Modellen
  • Sprachtechnologie für Bildungszwecke
  • Modellierung von Eye-Tracking-Daten der Sprachverarbeitung
Werfen Sie einen Blick auf unsere Projekte und Publikationen!


Lehre


Wir sind immer auf der Suche nach motivierten Studierenden, die mit uns arbeiten möchten. Wenn Ihnen unsere Kurse gefallen und Sie tiefer einsteigen möchten, wenden Sie sich an claplab@uni-goettingen.de. Werfen Sie einen Blick auf unsere Abschlussarbeitsthemen oder schlagen Sie Ihre eigene Idee vor, die auf einer aktuellen Arbeit oder einer Shared Task basiert.