Promotionsthema

Modellierung des Fachsprachenerwerbs im Physikunterricht

Leitung: Prof. Dr. Christian Wartena und Prof. Dr. Gunnar Friege

In den MINT-Fächer gehört das Schreiben von Versuchsprotokollen zu den fachsprachlich anspruchsvollen Aufgaben, deren Progression von der 5. bis 13. Klassenstufe in der Schule angestrebt wird. Die Nutzung maschineller Auswerteverfahren und der Modellierung der Lernprogression kann hier die Lehrkraft bei der Korrektur und der individuellen Förderung unterstützen.

Zum Lernen eines Faches ist der Erwerb der zugehörigen Fachsprache wichtig. Fachsprachen unterscheiden sich auf verschiedenen linguistischen Ebenen von der allgemeinen Sprache. Auf der Wortebene sind Fachsprachen vor allem durch die ergiebige Verwendung von Terminologie gekennzeichnet (H. Härtig, 2015). Das Erkennen von Terminologie in Textkorpora und das automatische Aufbauen von Terminologiesammlungen gehört zu den klassischen Anwendungsgebieten der Computerlinguistik. Eine Übersicht über die angewandten Methoden gibt z.B. Pazienza et al. (2005). A. Conde et al. (2016) stellen ein System für Terminologie-extraktion und den Aufbau von Terminologiesysteme spezifisch für pädagogische Zwecke vor. Obwohl die grundlegende Bedeutung von guten Kenntnissen der Fachsprache und der Fachterminologie oft hervorgehoben wird (sie z.B. Diethelm und Goschler, 2014; Pineker-Fischer, 2017) und auch spezifische Unterrichtsmethoden für den Erwerb von Fachsprachen entwickelt wurde (siehe z.B. J. Poupova, 2018) gibt es bisher keine dokumentierten Versuche, die Terminologiekenntnisse von Lernenden automatisch aus geschriebenen Texten, wie z.B. Versuchsprotokollen, abzuleiten.

Zunächst soll deutschsprachige Fachterminologie für Physik gesammelt werden. Hierzu sollen erstens bestehende Terminologiesammlungen genutzt werden. Daneben sollen auch Terminologieextraktionsverfahren auf deutschsprachige Physiktexte, wie Schulbücher oder Vorlesungsskripte gesammelt werden.  Neben Wörtern und Phrasen sollen hier auch typische Verwendungen der Terme festgehalten werden. In der zweiten Phase sollen die Texte der Schüler daraufhin analysiert werden, wie gut die Schüler die Physikterminologie beherrschen. Die große Herausforderung hierbei ist, dass kaum statistische Analysen der Texte eines einzelnen Schülers durchgeführt werden können, sondern dass eine genau syntaktische und semantische Analyse einzelner Sätze Hinweise über die Korrekte Verwendung oder über die Abwesenheit eines gewünschten Wortes geben soll. Neben traditionelle strukturbasierte Verfahren, ist es hier vorstellbar neuere Verfahren auf der Grundlage künstlicher neuronaler Netze, insbesondere (contextual) word embeddings zu nutzen, die auf Modelle zur Fehlerkorrektur im Rahmen vom Fremdsprachenunterricht aufbauen (Devlin et al. (2018), Amjadian et al. (2016), Kochmar und Briscoe (2014), Herbelot und Kochmar (2016)). Schließlich sollen Modelle für die Entwicklung der Terminologiekompetenz von Schülern sowie Konzepte für die Anwendung der entwickelten Verfahren im Physikunterricht entwickelt werden. Der Transfer der gewonnenen Erkenntnisse von der Physik auf andere MINT-Fächer wird angestrebt.

Literatur

Härtig, H., Bernholt, S., Prechtl, H., & Retelsdorf, J. (2015). Unterrichtssprache im Fachunterricht–Stand der Forschung und Forschungsperspektiven am Beispiel des Textverständnisses. Zeitschrift für Didaktik der Naturwissenschaften, 21(1), 55-67.

Pazienza, M. T., Pennacchiotti, M., & Zanzotto, F. M. (2005). Terminology extraction: an analysis of linguistic and statistical approaches. In Knowledge mining (pp. 255-279). Springer, Berlin, Heidelberg.

Conde, A., Larrañaga, M., Arruarte, A., Elorriaga, J.A. and Roth, D. (2016), LiTeWi: A Combined Term Extraction and Entity Linking Method for Eliciting Educational Ontologies From Textbooks. J Assn Inf Sci Tec, 67: 380-399. doi:10.1002/asi.23398

Diethelm, I., & Goschler, J. (2014). On human language and terminology used for teaching and learning CS/informatics. In Proceedings of the 9th Workshop in Primary and Secondary Computing Education (pp. 122-123). ACM.

Pineker-Fischer, A. (2016). Sprach- und Fachlernen im naturwissenschaftlichen Unterricht: Umgang von Lehrpersonen in soziokulturell heterogenen Klassen mit Bildungssprache. Springer-Verlag.

Poupova, J. (2018). Biological Terminology: an Opportunity for Teaching in Tandem. In Conference proceedings: New Perspectives in Science Education  (pp. 382-387). Libreraria Universitaria, Padua.

Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805.

Amjadian, E., Inkpen, D., Paribakht, T. S., & Faez, F. (2016). Local-global vectors to improve unigram terminology extraction. In Proceedings of the 5th international workshop on computational terminology (pp. 2-11).

Kochmar, E., & Briscoe, T. (2014). Detecting learner errors in the choice of content words using compositional distributional semantics. In Proceedings of COLING 2014, the 25th International Conference on Computational Linguistics: Technical Papers (pp. 1740-1751).

Herbelot, A., & Kochmar, E. (2016). ‘Calling on the classical phone’: a distributional model of adjective-noun errors in learners’ English. In Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers (pp. 976-986).

%d bloggers like this: