KI im Prüfungswesen: Neue Perspektiven für (E-)Prüfungen

Der rasante Fortschritt generativer Künstlicher Intelligenz (KI) verändert zunehmend auch das hochschulinterne Prüfungswesen. Insbesondere im Bereich der (E-)Prüfungen entstehen neue didaktische, rechtliche und organisatorische Fragestellungen. Während KI einerseits neue Formen der Leistungsüberprüfung ermöglicht, fordert sie zugleich etablierte Verständnisse von Eigenleistung, Transparenz und Bewertung heraus. Der folgende Beitrag beleuchtet zentrale Rahmenbedingungen, zeigt konkrete Einsatzmöglichkeiten auf und ordnet aktuelle Forschungsergebnisse ein.


KI im Prüfungsprozess: Nutzung unter klaren Bedingungen

Der Einsatz von KI im Prüfungskontext ist nicht ausgeschlossen, sondern an klare Anforderungen gebunden. Für Studierende gelten insbesondere drei Prinzipien: Eigenleistung, Deklaration und Urheberrecht. Prüfungsleistungen dürfen nicht vollständig KI-generiert sein, der Einsatz von KI-Tools ist transparent offenzulegen – beispielsweise durch ein Hilfsmittelverzeichnis-, und unzitierte Inhalte sind unzulässig. Gleichzeitig besteht die Möglichkeit, den Einsatz von KI in Prüfungen explizit zu untersagen.

Auch für Lehrende ist der Einsatz von KI erlaubt, sofern dieselben Grundsätze eingehalten werden, also beispielsweise deklariert wird, dass KI zur Erstellung von Prüfungsfragen genutzt wurde. KI wird damit nicht als autonomer Akteur verstanden, sondern als unterstützendes Werkzeug, dessen Nutzung stets in menschlicher Verantwortung bleibt.


Transparenz als zentrales Sicherheitsprinzip

Statt auf technische Detektionsverfahren zu setzen, rückt zunehmend die präventive Gestaltung von (E-)Prüfungen in den Vordergrund. Transparenz wird dabei zu einem zentralen didaktischen Steuerungsinstrument. Bewährt haben sich unter anderem:

Durch diese Massnahmen wird nicht nur Rechtssicherheit geschaffen, sondern auch ein reflektierter Umgang mit KI gefördert.


Potenziale von KI für Prüfende in (E-)Prüfungen

Generative KI eröffnet vielfältige Unterstützungsmöglichkeiten für Dozierende entlang des gesamten Prüfungsprozesses, insbesondere bei digital gestützten Prüfungsformaten:

  • Aufgabenerstellung: KI kann in kurzer Zeit vielfältige Prüfungsfragen generieren, etwa für Multiple-Choice- oder Kurzantwortformate. Eine Anpassung und Kontrolle sind dabei grundlegend.
  • Bewertungsraster: Entwürfe für Lösungsskizzen und Beurteilungskriterien lassen sich vorbereiten.
  • Korrekturassistenz: KI kann als Zweitkorrektorin eingesetzt werden, insbesondere bei grossen Studierendenzahlen. Wichtig ist hier, dass kontrolliert wird, ob die Bewertungen passen.
  • Training von Studierenden: Automatisch generierte Übungsaufgaben unterstützen formatives Lernen und Prüfungsvorbereitung.

Gerade in E-Prüfungen können dadurch neue Spielräume für Effizienz, Skalierung und Individualisierung entstehen.


Empirische Befunde zum KI-Einsatz im Prüfungswesen

Die Diskussion um KI im Prüfen wird zunehmend durch empirische Studien gestützt. Zwei aktuelle Untersuchungen liefern hierzu interessante Ergebnisse:

KI in der Fragenerstellung

In einer medizinischen Studie an der Uni Bonn (2024) wurden 50 Multiple-Choice-Fragen miteinander verglichen, die zur Hälfte von einer Lehrperson und zur Hälfte von einem generativen KI-System erstellt wurden. 161 Studierende bearbeiteten die Aufgaben. Die Ergebnisse zeigen:

  • Studierende haben 57% der KI-generierten Fragen als solche erkannt,
  • die KI erreichte einen vergleichbaren Schwierigkeitsgrad bei Fragen wie Lehrperson und
  • die KI konnte eine signifikante Zeitersparnis bei der Erstellung der Fragen erreichen.

Das Fazit der Studie lautet, dass KI die Fragenerstellung wirksam unterstützen kann. Eine fachliche Endkontrolle durch Prüfende bleibt jedoch unverzichtbar.
Zur Studie

KI in der Korrektur von Freitextantworten

Eine weitere Studie an der Uni Passau (2025) untersuchte den Einsatz von KI bei der Bewertung von 300 Freitextantworten aus sechs volkswirtschaftlichen Prüfungsfragen. Zusätzlich wurden zu allen Fragen noch KI-generierte Antworten in den Bewertungspool eingespeist. Der Vergleich zwischen menschlicher und KI-gestützter Korrektur ergab:

  • ein sehr ähnliches Leistungsranking, wenn es darum geht, welche Leistung als sehr gut,mittel – hoch),
  • eine leichte Tendenz zu milderen Bewertungen durch die KI im Falle einer Notenvergabe und
  • keinen systematischen Bias zugunsten von KI-generierten Antworten.

Die Autorinnen und Autoren kommen zum Schluss, dass KI sich gut als Zweitprüferin eignet, während die abschliessende Bewertung weiterhin in menschlicher Verantwortung liegen sollte.
Zur Studie

Beide Studien unterstreichen das Potenzial von KI als Assistenzsystem – nicht als Ersatz, sondern als Ergänzung professioneller Prüfungspraxis.


Prüfen mit oder ohne KI? Didaktische Entscheidungsfragen

Eine zentrale Frage bei der Gestaltung von konkreten Prüfungssituationen lautet, ob man mit oder ohne KI prüft. Eine Unterstützung kann der untenstehende Entscheidungsbaum (Abb. 1) bieten.

Abbildung 1. Angepasster Entscheidungsbaum Prüfen mit oder ohne KI (ESL FHNW, 2025).

Zukünftig fragen wir uns vielleicht nicht mehr, ob KI eingesetzt wird, sondern unter welchen Bedingungen. Dabei lassen sich zwei grundlegende Szenarien unterscheiden:

  • Wenn KI künftig Teil der beruflichen Handlungskompetenz ist, könnte diese ausdrücklich auch in der Prüfung bewertet werden.
  • Wenn eine Kompetenz ohne KI beherrscht werden muss, sind praxisnahe, kontextgebundene Aufgaben, Prozessdokumentationen und Reflexionen besonders geeignet.

Hybride Prüfungsformate, die den Vergleich zwischen Bearbeitung mit und ohne KI ermöglichen, gewinnen in diesem Zusammenhang an Bedeutung. Der Fokus verschiebt sich damit zunehmend von der reinen Produktbewertung hin zur Bewertung von Denk-, Arbeits- und Reflexionsprozessen.


Zwischen Kontrolle und Innovation

Der Einsatz von KI im Prüfungswesen wirft grundlegende Fragen auf:

  • Wo verlaufen die Grenzen zwischen zulässiger Unterstützung und unzulässiger Automatisierung?
  • Soll vorrangig auf Detektion oder auf präventive Aufgabengestaltung gesetzt werden?
  • Wie lassen sich Eigenleistungen in Mensch-KI-Kooperationen erkennen und bewerten?
  • Wie können Prüfungsformate weiterentwickelt werden, ohne in alte Muster zurückzufallen?

Insbesondere (E-)Prüfungen bieten hier ein hohes Innovationspotenzial – etwa durch verschiedene Aufgabenformate, prozessorientierte Prüfungen oder die dokumentierte Nutzung von KI als Bestandteil der Prüfungsleistung.


Fazit

Generative KI verändert das Prüfen nicht nur technisch, sondern auch didaktisch und kulturell. Die empirischen Befunde zeigen deutlich, dass KI Prüfende sowohl bei der Erstellung als auch bei der Bewertung von Prüfungen wirksam entlasten kann. Gleichzeitig bleibt die fachliche, rechtliche und ethische Verantwortung uneingeschränkt beim Menschen. Für die Weiterentwicklung einer zukunftsfähigen Prüfungskultur werden Transparenz, klare Kommunikation und eine bewusste didaktische Neuausrichtung zu zentralen Gestaltungsprinzipien.


Warum lohnt sich eine vertiefte Auseinandersetzung?

Die Auseinandersetzung mit KI im Prüfungswesen eröffnet nicht nur neue Perspektiven auf Leistungsmessung, sondern auch auf Lehr- und Lernprozesse insgesamt. Sie bietet die Chance, Prüfungen kompetenzorientierter, authentischer und nachhaltiger zu gestalten – insbesondere im digitalen Raum.

Sollten Ideen, Anregungen und Fragen zum Thema bestehen, freuen wir uns über eine Kontaktaufnahme unter elearning.ph@fhnw.ch.

Keine News mehr verpassen - jetzt eintragen und bei neuen Blogeintragen automatisch per Mail informiert werden:
Loading
zurück zu allen Beiträgen