Bildung: Die Sortiermaschine

Erster Entwurf mit Crashtest-Dokumentation: Version 1.0

Strukturelle Vernunft — Essay Nr. 5 — v2.5

Das Versprechen

Das Versprechen ist nicht neu. Es ist aus dem Jahr 2008. Es ist amtlich beschlossen. Es ist quantifiziert. Und es ist messbar.

Am 22. Oktober 2008 beschlossen Bundeskanzlerin Angela Merkel und die Regierungschefs der Länder beim Dresdner Bildungsgipfel die Qualifizierungsinitiative für Deutschland. Merkel prägte dabei die Formel, die seither das politische Versprechen trägt: „Wir müssen die Bildungsrepublik Deutschland werden (…). Wohlstand für alle heißt heute und morgen: Bildung für alle." [1]

Die Initiative war nicht nur ein Schlagwort. Sie definierte fünf konkrete, messbare Zielwerte [2]:

Bildungsausgaben: Steigerung der Ausgaben für Bildung und Forschung auf 10 Prozent des BIP bis 2015 — davon 7 Prozent für Bildung, 3 Prozent für Forschung.
Schulabbrecher: Halbierung der Quote der Schüler ohne Hauptschulabschluss von 8 Prozent auf 4 Prozent.
Ungelernte: Halbierung der Quote junger Erwachsener (20–29 Jahre) ohne Berufsabschluss von rund 17 Prozent auf 8,5 Prozent.
Studienanfängerquote: Steigerung auf 40 Prozent eines Jahrgangs.
Weiterbildungsbeteiligung: Steigerung der Beteiligung an Weiterbildungsmaßnahmen auf 50 Prozent der Erwerbsbevölkerung.

Auf diese Zielarchitektur sind zwei aktuelle Versprechen aufgesattelt worden:

Der Rechtsanspruch auf Ganztagsbetreuung in der Grundschule tritt am 1. August 2026 in Kraft, zunächst für die erste Klasse, mit jährlich erweitertem Anwendungsbereich [3]. Der Anspruch ist juristisch einklagbar.

Der DigitalPakt Schule 2.0 wurde von Bund und Ländern mit einem Gesamtvolumen von 5 Milliarden Euro für die Schuldigitalisierung beschlossen — je 2,5 Milliarden Bund und Länder [4]. Die Timeline ist präzise: Am 13. Dezember 2024 verständigten sich BMBF und KMK in einer gemeinsamen Grundsatzerklärung auf die Eckpunkte; die finale politische Einigung der Bildungsministerkonferenz fiel am 18. Dezember 2025 in Berlin; der Förderzeitraum begann offiziell am 1. Januar 2026 und läuft bis Ende 2030, einzelne Projekte bis 2032 [12].

Diese drei Versprechensschichten — die amtlichen Zielwerte von 2008, der Ganztagsanspruch ab 2026 und der DigitalPakt 2.0 — bilden zusammen das, was die Republik sich selbst als Bildungspolitik zugesagt hat. Sie sind nicht hypothetisch. Sie sind kabinettsbeschlossen, gesetzlich verankert, koalitionsvertraglich fortgeschrieben.

Die Realität

Am 13. Mai 2026 hat das UNICEF Innocenti Research Centre die Report Card 20 veröffentlicht. Sie misst das Kinderwohl in 37 Industriestaaten. Deutschland landet im Gesamtranking auf Platz 25 — hinter Rumänien, Ungarn und der Slowakei [5]. Das geschieht in der viertgrößten Volkswirtschaft der Welt.

Erstens — die Bildungskompetenz. Bei den 15-Jährigen erreichen nur 60 Prozent die Mindestkompetenzen in Lesen und Mathematik. Deutschland landet auf Platz 34 von 41 [6]. Nach Einkommen aufgeschlüsselt: 46 Prozent der Jugendlichen aus einkommensschwachen Familien gegenüber 90 Prozent aus wohlhabenden — eine Lücke von 44 Prozentpunkten [6]. Der Schulsegregationsindex liegt bei 0,25 — arme und reiche Kinder besuchen strukturell unterschiedliche Schulen.

Zweitens — das mentale Wohlbefinden. Deutschland steht auf Platz 30 von 37 [7]. Auf die Frage, ob es leicht falle, Freunde zu finden, antworten 69 Prozent der 15-Jährigen mit ja. Das ist Platz 41 von 42. Vorletzter [7]. Rumänien: 83 Prozent. Niederlande: 87 Prozent.

Drittens — der Lehrkräftemangel. Im Schuljahr 2025/26 fehlen nach KMK-Daten rund 35.000 Lehrkräfte [8]. Die Lücke ist strukturell: 22.500 Neuabsolventen stehen 30.700 ausgeschriebenen Stellen gegenüber [9]. 10,5 Prozent aller Lehrkräfte arbeiten ohne Lehramtsprüfung [9]. Die Teilzeitquote beträgt 42,3 Prozent — der höchste Stand seit zehn Jahren [10]. Die Zahl der Lehramtsabsolventen ist zwischen 2014 und 2024 von 33.300 auf 30.600 gesunken — minus 8 Prozent in einem Jahrzehnt steigenden Bedarfs [10]. In NRW allein waren im Dezember 2025 rund 8.800 Stellen unbesetzt [9].

Viertens — der Ganztagsanspruch. Eine VBE-Umfrage vom Januar 2026 hat ergeben, dass 25 Prozent der Schulleitungen den Rechtsanspruch nicht erfüllen können. Bundesweit fehlen rund 65.000 Betreuungsplätze. Als Haupthindernisse benennen Schulleitungen fehlende Räume (74 Prozent) und fehlendes Fachpersonal (67 Prozent) [11]. Der Anspruch tritt in Wochen in Kraft. Die Infrastruktur tritt nicht in Kraft.

Fünftens — der DigitalPakt 2.0. Die finale Einigung vom 18. Dezember 2025 verzichtet auf eine Verknüpfung der Mittelvergabe mit Lehrplan- oder Prozessreformen [12]. DigitalPakt 1.0 hat 29.400 Schulen erreicht [4]. Was die Evaluation belegt, folgt im nächsten Abschnitt.

Das Delta

Das Delta lässt sich nicht behaupten. Es lässt sich rechnen.

Bildungsausgaben: Versprechen 7 Prozent des BIP für Bildung bis 2015 — als gesamtgesellschaftliches Ziel definiert, öffentliche Haushalte plus private Bildungsinvestitionen, kalibriert auf den OECD-Standard [13]. Realität: Die öffentlichen Bildungsausgaben 2024 lagen bei 198 Milliarden Euro — 4,6 Prozent des BIP. Inklusive privater Bildungsausgaben (duale Ausbildung, Eigenbeiträge der Haushalte) erreicht Deutschland in der Gesamtrechnung ca. 6,4 bis 6,5 Prozent des BIP [13]. Delta gegenüber dem 2008er-Ziel: 0,5 bis 0,6 Prozentpunkte BIP, das sind 22 bis 27 Milliarden Euro jährlich. Das ist eine fiskalisch begründete Lücke, aber keine Größenordnung, die jede andere strukturelle Maßnahme rahmt — die Korrektur gegenüber der Lautstärke, mit der das 7%-Ziel rhetorisch beschworen wird.

Die Verschiebung liegt nicht in der Höhe, sondern in der Allokation: Deutschland gibt international überdurchschnittlich viel pro Hochschulstudent aus; bei den Primar-Ausgaben liegt Deutschland am OECD-Durchschnitt (OECD EAG 2024: 11.900 USD pro Primarschüler, 20.500 USD pro Tertiär-Student) [13]. Die Spreizung zwischen beiden Investitionspfaden ist in Deutschland größer als im OECD-Schnitt. Wer früh sortiert wird, sitzt im Segment mit der relativ schwächeren Budgetausstattung.

Schulabbrecherquote: Versprechen 4 Prozent bis 2015 (Dresden-Halbierung). Realität ist nicht ein Einzelwert, sondern eine Trendlinie nach oben: 5,5 Prozent (2013/14) → 6,2 Prozent (2021) → rund 7,0 Prozent (Schuljahr 2023/24, ~62.000 Betroffene), neuer Höchststand, 2024/25 bereits über 64.000. Delta: das Ziel war Halbierung — die Quote ist stattdessen um rund 1,5 Prozentpunkte gestiegen. Förderschul-Vorbehalt: etwa die Hälfte der Betroffenen sind Förderschülerinnen und -schüler, die ihren Bildungsgang planmäßig beenden, aber formal ohne Hauptschulabschluss abgehen — der Anstieg (5,5 → 7,0 Prozent) trägt das Delta dennoch, weil dieser Anteil über die Zeit etwa konstant ist. [14]

Ungelernten-Quote: Versprechen war die Halbierung von 17 Prozent auf 8,5 Prozent (20–29 Jahre) bis 2015. Realität: rund 18 Prozent in jeder Abgrenzung — 18,8 Prozent der 20- bis 34-Jährigen ohne Berufsabschluss (~2,76 Mio., Berufsbildungsbericht 2026, BMBFSFJ). Delta: gestiegen statt halbiert — strukturelle Verfehlung. [14]

Studienanfängerquote: Versprechen 40 Prozent. Realität: über 50 Prozent. Ziel übererfüllt — Kritik: zulasten der dualen Ausbildung.

Weiterbildungsbeteiligung: Versprechen 50 Prozent. Realität: über 50 Prozent. Ziel erreicht.

Die Bilanz nach 18 Jahren ist eindeutig: Die quantitativen Ziele (Akademisierung, Weiterbildung) wurden erreicht oder übertroffen. Die qualitativen Ziele am unteren Ende der Leistungsskala — die für die Chancengerechtigkeit entscheidenden — wurden strukturell verfehlt. Die Bildungsausgaben wurden moderat verfehlt — aber das Geld floss an das obere Ende des Pfads, nicht an das untere. Die fiskalische Verfehlung ist nicht primär eine Höhe, sondern eine Schichtung.

Beim Ganztag: Das Versprechen lautet 100 Prozent Anspruchserfüllung ab 1. August 2026. Die Realität: 25 Prozent Nichterfüllbarkeit zum Stichtag, 65.000 fehlende Plätze [11]. Delta: mindestens 25 Prozent struktureller Bruch — ein einklagbarer Anspruch trifft auf eine nicht gelieferte Infrastruktur.

Beim DigitalPakt 2.0: Das Versprechen ist eine digital handlungsfähige Schule. Die Realität ist Geld ohne Prozessreform-Bedingung. Wie sich diese Architektur in v1.0 ausgewirkt hat, ist amtlich evaluiert: Der Bundesrechnungshof stellt in seinem Prüfbericht 2022 fest, dass „ungeklärt und nicht belegt ist, ob sich durch die Bundesbeteiligung die erhofften Erfolge beim digitalen Lernen einstellen" [15]. Die wissenschaftliche Evaluation (InterVal/Eickelmann, Zwischenbericht 2024) ergänzt: Die verpflichtenden technisch-pädagogischen Einsatzkonzepte wurden „in der Praxis oft rein formal administrativ ausgefüllt, um an die Gelder zu gelangen, anstatt einen echten Schulentwicklungsprozess anzustoßen." Endgeräte lagen mancherorts monatelang unausgepackt in Kellern, weil Support- und Wartungsstrukturen fehlten [16]. Delta: Hardware geliefert, Wirkung nicht.

Die Ursache

Vier strukturelle Mechanismen erzeugen das Ergebnis zwangsläufig. Sie sind nicht das Resultat schlechter Bildungspolitik. Sie sind das, was die Architektur produziert.

Erstens — die föderale Asymmetrie zwischen Hoheit und Kapazität. Bildung ist gemäß Art. 70 GG Ländersache. Die Länder halten die Verfassungshoheit, aber zahlreiche Landeshaushalte können den realen Aufwand für Bildungskapazität (Lehramtskapazitäten, Schulbauten, Sozialinfrastruktur) strukturell nicht stemmen. Der Bund darf gemäß Art. 104c GG Finanzhilfen für die Bildungsinfrastruktur gewähren — aber nur den Ländern, nicht direkt den Kommunen. Eine direkte Auszahlung an Schulen oder Schulträger unter Umgehung der Länder verletzt das grundgesetzliche Verbot der Mischverwaltung (Art. 104a Abs. 1 GG) [17]. Das ist keine politische Konvention — es ist Verfassungsrecht. Jede strukturelle Konsequenz muss sich daran abarbeiten.

Zweitens — die KMK als Konsensmaschine. Die Kultusministerkonferenz beschließt bildungspolitische Kernstandards — zu Einheitlichkeit, Haushaltswirkung und Mobilität — einstimmig. Eine 2024 eingeführte Zwei-Drittel-Mehrheit gilt ausschließlich für unverbindliche Empfehlungen und Berichte [24]. Was 16 Länder einstimmig zu Kernstandards beschließen, ist immer der höchste gemeinsame Nenner — und damit der niedrigste anspruchsvolle Standard. Bildungsstandards die Bayern, Bremen, Sachsen-Anhalt und Berlin gleichzeitig akzeptieren können, sind per Definition keine ambitionierten Standards. Conway’s Law gilt auch in der Bildungspolitik: Die Organisation produziert Standards, die ihre eigene Struktur spiegeln.

Drittens — die Sortier-Architektur des Schulsystems und ihr fiskalischer Schatten. Das gegliederte Schulsystem mit Frühsortierung ab Klasse 5 (in den meisten Ländern) erzeugt strukturelle Segregation. Der Schulsegregationsindex von 0,25 [6] belegt: Schulartenwechsel sind selten und sozial sortiert. Die UNICEF-Diagnose „das System sortiert nach Herkunft, nicht nach Potenzial" [6] ist keine Wertung — sie ist eine technische Beschreibung dessen, was die Architektur produziert. Hauspreise korrelieren mit Schulqualität (vgl. Essay 2: Wohnen), Schulqualität korreliert mit Kompetenzergebnissen, Kompetenzergebnisse reproduzieren Herkunftsstrukturen [6]. Der Kreislauf ist geschlossen. Er ist die Maschine.

Die Sortiermaschine produziert nicht nur Kompetenzlücken — sie produziert auch Investitionslücken. Wer am Anfang des Pfads (frühkindlich, Primarstufe) sortiert wird, sitzt in dem Segment, das budgetär am schwächsten ausgestattet ist. Der OECD-Schnitt 2024 liegt bei 11.900 USD pro Primarschüler und 20.500 USD pro Tertiär-Student (OECD Education at a Glance 2024, Kapitel C1) [13]. Deutschland rangiert bei den Tertiär-Ausgaben im obersten OECD-Quintil, bei den Primar-Ausgaben am OECD-Durchschnitt. Relevant ist die Spreizung, nicht die absolute Höhe: In Deutschland ist die Distanz zwischen Primar- und Tertiär-Investition größer als in vergleichbaren OECD-Ländern. Das ist eine Schichtung der Investition, die ihre eigene Sortierungslogik spiegelt — kein Sparzwang. Bildungspolitik wird mehrheitlich von Menschen geschrieben, die den Gymnasial-Hochschul-Pfad selbst gegangen sind; die Budgetallokation folgt dieser biographischen Wertung. Der Autor dieses Essays hat den valorisierten Pfad selbst genommen. Er verdient gut, weil er ihn genommen hat. Sein älterer Sohn wird ihn aller Wahrscheinlichkeit nach offen vorfinden.

Viertens — die Lehrkräfte-Zuflusspolitik. Die Zahl der Lehramtsabsolventen ist seit 2014 um 8 Prozent gesunken [10] — Hochschulkapazitäten wurden in einem Jahrzehnt steigenden Bedarfs nicht aufgestockt. Landeshaushaltszwänge, Hochschulkapazitätsrecht und die föderale Studienplatzplanung treffen denselben Flaschenhals. Das ist keine Fehlplanung — das ist Planung, die das Ergebnis nicht zur Voraussetzung macht.

Die Profiteure des Status Quo

Die Architektur hält, weil sie für eine Reihe von Akteuren funktioniert. Wer Strukturreform will, muss diese Veto-Spieler einkalkulieren:

Das Bundesfinanzministerium: Das BMF erscheint in keiner bildungspolitischen Debatte — es erscheint im Haushaltsausschuss, und dort entscheidet es. Es ist kein Bildungsakteur; es ist der fiskalische Rahmengeber, der jeden Programmansatz ab einer Größenordnung von 10 Milliarden Euro über eine Legislaturperiode durch den Supplementärhaushalt-Engpass presst. Nach dem BVerfG-Urteil 2023 (Nachtragshaushalt) und der laufenden Schuldenbremse (Art. 115 GG) ist der Bundesfinanzminister der einzige Akteur, der ein Programm dieser Kostenklasse ohne Verfassungsbruch stoppen kann — nicht durch politischen Widerspruch im Bundesrat, sondern durch Nichteinstellung der Mittel in den Bundeshaushalt. Dieses Veto ist strukturell, nicht ideologisch: Jeder Bundesfinanzminister unter Schuldenbremse agiert identisch. Das rationale Eigeninteresse ist nicht „Bildung ist unwichtig" — es ist „dauerhafte Bundesverpflichtungen sind verfassungsrechtlich riskant und haushälterisch nicht kontrollierbar". Der Quid-pro-quo liegt entsprechend auf der Hand: Ein Programm dieser Kostenklasse ist mit dem BMF nur möglich, wenn der Bundesfinanzierungsanteil degressiv konstruiert ist — der Bund finanziert den kapitalintensiven Anschub (Art. 104c-kompatibel: investiver Charakter), die Länder übernehmen mit fortlaufender Dauer einen steigenden Eigenanteil an den laufenden Kosten. Es ist die einzige Konstruktion, die den Bundeshaushalt vor einer dauerhaften Leistungsverpflichtung schützt und dem BMF das strukturelle Argument liefert, das Kabinetteinigung ermöglicht — keine Abschwächung der Programmarchitektur.
Die föderalen Bildungssieger — Bayern und Baden-Württemberg: Der am häufigsten übersehene Veto-Spieler ist nicht der Verlierer des Systems, sondern sein Gewinner. Bayern liegt in den PISA-Ländervergleichen durchgängig auf Platz 1–2 innerhalb Deutschlands, international vergleichbar mit der OECD-Spitzengruppe. Für Bayern ist der Bildungsföderalismus kein Dysfunktions-Symptom — er ist das Instrument, mit dem das Land seine Relativposition verteidigt. Jede Homogenisierung (bundeseinheitlicher Sozialindex, skaliertes Startchancen-Programm, DigitalPakt mit Bedingungen) liest Bayern als Qualitätsabsenkung — und liegt in dieser Einschätzung nicht falsch. Das ist kein Kulturhoheits-Reflex, sondern rationales System-Optimum. Wer eine Bundesreform plant, die darauf baut, dass Bayern und Baden-Württemberg mitziehen, plant gegen deren wohlverstandenes Eigeninteresse. Das ist die analytische Lücke, die Reformkonzepte im Bundesrat tötet: Die Länder, die am lautesten Nein sagen, sind nicht die, die das System dysfunktional finden — es sind die, die es für sich haben funktionieren lassen.
Länderfinanzministerien: Bildungshoheit ist Verhandlungsmasse im föderalen Finanzausgleich. Wer die Hoheit abgibt, verliert Spielraum. A14 für Primarstufenlehrkräfte ist darüber hinaus eine Besoldungspräzedenz mit mehrstelligen Millionen-Haushaltskonsequenzen pro Bundesland — ein struktureller Blockadegrund, der Eingriff 2 geografisch begrenzt.
Kultusminister — als Profiteure der Auditierbarkeits-Lücke: Das sind keine Blockierer aus schlechtem Willen, sondern Akteure mit einem rationalen institutionellen Eigeninteresse, das vom Länderfinanzministerium strukturell verschieden ist. Das Finanzministerium blockiert aktiv, weil Bildungsreform Geld kostet. Das Kultusministerium kann formal kooperieren — und strukturell unterwandern: Verwaltungsvereinbarungen werden unterschrieben, Konzepte werden eingereicht, Berichte werden geliefert. Was dabei nicht entsteht, ist substanzieller Wandel. Jede Transparenz- und Auditierbarkeitsanforderung — Prüfkatalog der Wissenschaftlichen Bewertungskommission, Wirksamkeits-Trigger, öffentliche Konzept-Veröffentlichung im Amtsblatt — ist ein Einschnitt in diesen diskretionären Spielraum. Das DigitalPakt-1.0-Muster [16] — technisch-pädagogische Einsatzkonzepte formal abgehakt um an Gelder zu gelangen, ohne dass echte Schulentwicklung stattfand — ist nicht das Ergebnis bürokratischer Unfähigkeit, sondern der rationale Output einer Anreizstruktur, die Compliance-Theater belohnt. Das Tranchen-Modell in Eingriff 3 ist die direkte Antwort auf diesen Akteur: Es macht das Compliance-Theater strukturell unprofitabel, weil die nächste Tranche an nicht-papierbasierte Outcome-Nachweise gebunden ist.
Bildungsnahe Mittelschicht mit Kindern am Gymnasium: Die höchste Wahlbeteiligungsrate aller identifizierbaren Veto-Gruppen. Organisiert über Elternbeiräte, Elternverbände und Schulfördervereine. Ihr materielles Interesse am Erhalt der Sortierarchitektur ist direkt, messbar und den Betroffenen bewusst: Bildungserfolg ist ein relativer Vorteil — er existiert nur, solange andere weniger haben. Jede Maßnahme, die Bildungserfolg vom sozialen Hintergrund entkoppelt, trifft diesen relativen Vorteil. Diese Gruppe fehlt in den meisten Bildungsreform-Analysen nicht aus analytischer Blindheit, sondern weil sie am schwierigsten zu benennen ist — man benennt die eigene Demografie ungern als Blockade. Der Verfasser dieses Essays gehört zu ihr.
Kommunen mit gutem Sozialindex: Hauspreise korrelieren mit Schulqualität. Wer in den richtigen Schulbezirken Eigentum hält, profitiert direkt vom Segregationsmechanismus. Der Verfasser dieses Essays gehört zu dieser Gruppe — Eigenheimbesitzer im ländlichen Raum mit funktionierender Grundschule.
Private Schulträger: Die Nachfrage nach privaten Schulen steigt erfahrungsgemäß mit der Funktionsstörung des staatlichen Systems — ein Marktmechanismus, der durch Systemversagen angetrieben wird.
Freie Träger der Jugendhilfe — Caritas, AWO, Diakonie, DRK: Das § 4 SGB VIII-Subsidiaritätsprinzip gibt freien Trägern Vorrang bei der Erbringung von Jugendhilfeleistungen — Ganztagsbetreuung wird in Deutschland mehrheitlich nicht von Kommunen selbst betrieben, sondern von diesen Organisationen. Sie sind direkte Empfänger von SGB-VIII-Mitteln, haben institutionellen Zugang zu Familienausschuss und Sozialausschuss im Bundestag, und profitieren von Programm-Komplexität: Viele Finanzierungsquellen und wenig Wirkungskontrolle sind für institutionelle Träger mit stabilen Förderbeziehungen strukturell vorteilhaft. Ihr operatives Problem — Fachkräftemangel im Erziehungsbereich — ist kein institutionelles Interesse, sondern eine Kapazitätsgrenze, die das Stufenmodell als eigene Kategorie berücksichtigen muss.
Bestehende Lehrkräfte mit Teilzeitoption: Die Teilzeitquote von 42,3 Prozent ist nicht nur Symptom des Mangels, sondern auch Folge individueller Wahlfreiheit. Jede Reform der Lehrerarbeitszeit kollidiert mit erworbenen Erwartungen.
GEW, Philologenverband und dbb-Beamtenbund: Das sind keine Interessengruppen — das sind organisierte Veto-Spieler mit drei Hebeln: Streikrecht, Tarifverhandlung (TVöD/TV-L) und Laufbahnrecht. Eingriff 2 (Quereinsteiger-Formalisierung) ist ein direkter Angriff auf das berufliche Leitbild der Lehramtsausbildung. Die GEW hat rund 275.000 Mitglieder [26]. Der Philologenverband schützt die Gymnasium-Lehrerstellen strukturell. Der Beamtenbund sichert das Laufbahnrecht gegen eine zweite reguläre Eintrittsspur. Diese drei werden “Deprofessionalisierung” sagen — und in einem formalen Sinne Recht haben.
Die Hochschulrektorenkonferenz (HRK): In Schulgerechtigkeits-Debatten erscheint sie selten — aber sie kontrolliert das stärkste fiskalische Gravitations-Instrument des Bundes im Bildungsbereich: den Hochschulpakt. Ihr Interesse ist legitim und klar umrissen: die Integrität der Hochschulmittel. Jeder Versuch, Hochschulpakt-Mittel als Hebel für schulpolitische Ziele in der Primarstufe umzufunktionieren, trifft auf eine institutionelle Standardreaktion — Befassung des BMBF, das Zweckentfremdungs-Argument, notfalls der Gang vor die Gerichte. Das ist eine Strukturbedingung: Wer den Hochschulpakt als Schul-Hebel plant, plant gegen die HRK. Die Konsequenz für den Lösungsentwurf ist nicht Frontalangriff, sondern saubere Trennung der Fördervehikel — ausgeführt in Eingriff 2.

Wer Profiteure nicht benennt, plant Reformen die scheitern. Die Profiteure sind nicht das Problem. Sie sind die Bedingung, an der jeder Lösungsentwurf gemessen werden muss.

Die strukturelle Konsequenz

Fünf Eingriffe. Alle verfassungskonform — was Bildungshoheit nicht heißt, ist, dass der Bund kein Instrument hätte. Was der Bund hat, ist Geld, Vertragspartner und Bedingungen. Das ist mehr als nichts. Es ist nur weniger, als die Empörungsrhetorik suggeriert.

Was diese fünf Eingriffe zusammen kosten, steht in keiner Pressemitteilung. Es steht hier:

Eingriff	Bundesanteil (Schätzband)	Zeithorizont	Haushaltsinstrument
Eingriff 1: Skalierung Startchancen-Programm	~40 Mrd. Euro	10 Jahre	Verwaltungsvereinbarung Art. 104c GG, degressiver Bundesanteil
Eingriff 2: Verwaltungsvereinbarung Lehrkräfte-Kapazität	3–8 Mrd. Euro (Schätzung auf offengelegter Rechenbasis, kein amtlicher Wert: Grundschullehrkräfte-Zahl × Besoldungsdifferenz A13→A14 × Förderquote, Destatis-Lehrkräfte [10])	10 Jahre	Verwaltungsvereinbarung Art. 104c GG, degressiver Bundesanteil
Eingriff 3: DigitalPakt 2.0 (Bundesanteil)	2,5 Mrd. Euro	2026–2030 (Projekte teils bis 2032)	BMBF-Haushalt (finale Einigung 18. Dezember 2025)
Eingriff 4: Länderfonds Haftungsfreistellung	0,5–3 Mrd. Euro (Schätzung auf offengelegter Rechenbasis, kein amtlicher Wert: Fallzahl 65.000 fehlende Plätze [11] × Schadensersatz-Annahme)	2026–2028	Haushaltsmittel Bund, transitional
Eingriff 5: Anschubfinanzierung Schulpsychologie	2–4 Mrd. Euro (Schätzung auf offengelegter Rechenbasis, kein amtlicher Wert: Stellenlücke BDP 1:5.218 → 1:3.000 [20] × Ersteinrichtungskosten/Stelle)	5–8 Jahre	Verwaltungsvereinbarung Art. 104c GG, degressiver Bundesanteil
Bundesanteil gesamt	~48–58 Mrd. Euro	über eine Implementierungsdekade

Ohne Einigung mit dem BMF über diesen Haushaltspfad ist kein einziger der fünf Eingriffe startfähig. Das BMF steht im Profiteure-Register — nicht weil es strukturelle Defizite im Bildungssystem schätzt, sondern weil sein institutionelles Mandat es zwingt, jeden Ausgabenbeschluss dieser Größenordnung durch den Supplementärhaushalt-Engpass zu pressen. Die degressive Bundesfinanzierungsarchitektur aller Verwaltungsvereinbarungs-Eingriffe ist deshalb die einzige Konstruktion, die dem BMF das Kabinett-Argument liefert, ohne die es keine Mehrheit gibt.

Diese Eingriffe lassen den Gymnasium-Pfad strukturell unberührt. Das ist eine bewusste politische Entscheidung, nicht eine verfassungsrechtliche Grenze: Maßnahmen, die den gymnasialen Sortierungsmechanismus direkt komprimieren — Schulstrukturreformen, erzwungene Ressourcenumverteilung von Gymnasium zu Hauptschule, Abschaffung der frühen Differenzierung — sind politisch nicht mehrheitsfähig in einer Gesellschaft, in der die politisch aktivste Wählergruppe einen direkten materiellen Nachteil von ihnen hätte. Die strukturelle Konsequenz lautet: Diese fünf Eingriffe bremsen die Sortiermaschine. Sie stoppen sie nicht. Gestoppt werden könnte sie nur mit der Zustimmung der Gruppe, die von ihr am stärksten profitiert — und diese Zustimmung ist heute nicht verfügbar. Wer das verschweigt, verspricht mehr als die Architektur liefern kann.

Die Wirkungstheorie: Was fünf Eingriffe an der Spreizung bewegen können

Bevor die Eingriffe einzeln stehen, ist die Frage zu beantworten, die jede Maßnahmenliste schuldig bleibt: Warum sollten diese fünf Eingriffe die gemessene Spreizung von 44 Prozentpunkten [6] überhaupt bewegen — und um wie viel? Ein Messkriterium ohne Wirkungstheorie ist eine Zahl ohne Begründung.

Die 44 Prozentpunkte sind kein homogener Block. Die Bildungssoziologie zerlegt Herkunftsungleichheit seit Raymond Boudon in primäre und sekundäre Herkunftseffekte [28]. Auf diese Spreizung angewendet ergeben sich drei systemische Korridore — keine nachkommagenauen Werte, sondern Bänder, weil kein empirisches Modell der Bildungsforschung die 44 Punkte auf die Stelle isolieren kann. Wer hier Scheingenauigkeit behauptet, liefert dem nächsten methodischen Angriff den Vektor selbst:

Primäre Herkunftseffekte — Korridor 22 bis 26 Prozentpunkte. Kompetenzunterschiede, die vor und außerhalb der Schule entstehen: frühkindliche Sozialisation, Sprachentwicklung, das kognitive Umfeld im Elternhaus. Schulische Kompensation an Brennpunktschulen (Eingriff 1, 2) kann diesen Anteil dämpfen, aber nicht auflösen — die Schule ersetzt das Elternhaus nicht. Kurz- bis mittelfristig ist dieser Anteil strukturell nicht kompensierbar.

Sekundäre Herkunftseffekte und institutionelle Sortierung — Korridor 8 bis 12 Prozentpunkte. Die institutionell verstärkte Segregation: Schulsegregationsindex 0,25 [6], herkunftsabhängige Gymnasialempfehlungen, Peer-Group-Effekte des gegliederten Systems. Weil dieser Essay den Gymnasium-Pfad aus realpolitischen Gründen unberührt lässt (siehe oben), läuft dieser Verstärker ungehindert weiter. Das ist der deklarierte, quantifizierte Preis der Invariante: nicht eine Lücke in der Analyse, sondern eine benannte politische Entscheidung mit Preisschild.

Kompensierbarer Schul-Funktionsanteil — Korridor 12 bis 16 Prozentpunkte. Asymmetrische Ressourcenallokation, Unterrichtsausfall durch Lehrermangel an Brennpunktschulen, fehlende psychosoziale Infrastruktur. Nur dieses Segment adressieren Eingriff 1 (Startchancen), Eingriff 2 (Quereinsteiger) und Eingriff 5 (Schulpsychologie) direkt.

Die drei Korridore überlappen an den Rändern und addieren sich bewusst nicht auf die Stelle — bei voller Bandbreite ergäben sie 42 bis 54 Prozentpunkte, was nur zeigt, dass es Schätzkorridore sind und keine Bilanzposten. Die Aussage ist trotz der Unschärfe eindeutig: Adressierbar ist allein der dritte Korridor, im Optimalfall rund 14 Prozentpunkte.

Daraus folgt das Messziel — und seine Grenze. Im Optimalfall sinkt die Spreizung von 44 um den maximal kompensierbaren Anteil von rund 14 Punkten auf ein systemisches Residuum von etwa 30 Prozentpunkten. Diese Zielgröße „Spreizung < 30 Prozentpunkte bis 2030" ist ausdrücklich eine deklarierte Schätzung mit Unsicherheitsband, keine extern kalibrierte Zahl: Sie steht und fällt mit der Boudon-Dekomposition der 44 Punkte in drei Korridore, und diese Dekomposition ist — wie Fußnote [28] offenlegt — eine systemische Schätzung des Verfassers, kein aus den Quellen direkt entnommener Effektwert. Ein Kritiker, der die Korridore anders schneidet (8 statt 14 kompensierbare Punkte), kann die kommunizierte Zahl verschieben. Genau deshalb trägt diese Zahl die Falsifizierbarkeit des Programms nicht: Sie ist ein begründeter Erwartungspfad, kein hart verbuchtes Ziel. Die operative Versagens-Schwelle — an der das Programm tatsächlich scheitert oder besteht — ist von der Boudon-Schätzung entkoppelt und extern verankert (EEF-Mindest-Effektstärke, Wartelisten-Kontrolle, siehe unten); sie hängt nicht an dieser Zahl. „< 30 pp" markiert damit den äußeren Rand des begründet Erwartbaren, nicht den Erwartungswert und nicht das Kriterium, an dem das Programm gemessen wird.

Diese Zielgröße gilt ausschließlich für die Teilnehmerländer des skalierten Programms. Da Bayern und Baden-Württemberg voraussichtlich in der 70-Prozent-Spur oder außerhalb bleiben, ist ein seriöses bundesweites Spreizungs-Benchmark für 2030 nicht ausweisbar — UNICEF misst Deutschland-weit und schließt diese Länder ein. Das erzeugt eine strukturelle Lücke zwischen Programm-Messerfolg und nationaler Wahrnehmung: Das Programm kann 2030 sein teilnehmerland-gewichtetes Ziel erreichen und Deutschland liegt im UNICEF-Ranking dennoch auf Platz 33. Das ist kein Widerspruch im Programm — es ist der deklarierte Preis der Opt-out-Struktur. Die Messkriterien-Tabelle führt deshalb zwei Signale: das Programm-Messziel (teilnehmerland-gewichtet, durch die Eingriffe beeinflussbar) und einen nationalen UNICEF-Monitoring-Wert (Deutschland gesamt, als Transparenz-Signal, kein Programm-Ziel).

Hier lauert allerdings eine Falle, die diese Argumentation sich selbst stellt: Wenn „es ist das Gymnasium" die Erklärung für jedes Stagnieren wird, kann das Programm nicht mehr scheitern. Jeder Wert zwischen 30 und 37 Prozentpunkten bestätigt dann die Wirkungstheorie, und ein Programm, das sich gegen das eigene Scheitern immunisiert, ist genau der Typ Politik, den dieser Essay kritisiert. Die Trennung von Programmversagen (die Förderung bewegt nichts) und systemischem Residuum (die Förderung wirkt, das Gymnasium deckelt das Aggregat) darf deshalb nicht im Auge des Betrachters liegen — sie muss messbar sein. Die dafür nötige Evidenz-Architektur ist Teil von Eingriff 1; sie ist das, was den Unterschied zwischen einer Wirkungstheorie und einer Entschuldigungsarchitektur ausmacht.

Diese Trennung muss auf beiden Ebenen halten, nicht nur auf der einzelnen Schule. Auf der Mikro-Ebene leistet das die Wartelisten-Kontrolle: Schlägt die geförderte Schule ihre Kontrollgruppe unter demselben Gymnasium nicht um die extern verankerte Mindest-Effektstärke, hat das Programm versagt — nicht das System. Auf der Aggregat-Ebene, auf der die öffentliche Debatte den Erfolg verbucht, fehlte diese Härte bisher: Ein enttäuschender Makro-Wert ließe sich per Auslegung in eine der vorgefertigten Residuum-Kategorien einsortieren (Gymnasium-Sortierung, Bayern/BW-Opt-out, unterer Korridorrand), und die Trennung läge wieder im Auge des Betrachters. Deshalb wird die symmetrische, vorab-gesperrte Zwei-Schlüssel-Logik der Mikro-Ebene auf die Aggregat-Ziele gespiegelt — nicht neu erfunden, sondern aus der bereits funktionierenden Mikro-Governance übertragen:

Schlüssel M-A — die geförderten Schulen im Aggregat. Erste Frage bei jedem verfehlten Aggregat-Ziel: Haben die geförderten Schulen aggregiert ihre Wartelisten-Kontrolle um die extern verankerte EEF-Mindest-Effektstärke [30] geschlagen? Lautet die Antwort nein, ist es Programmversagen — die Eingriffe wirken nicht einmal an ihren eigenen Teilnehmern, und an diesem vorab gesperrten Test sind die drei Ausreden gesperrt: „Gymnasium-Residuum", „Bayern/BW-Opt-out" und „Korridor am Unterrand" sind als Erklärung für ein verfehltes Aggregat unzulässig, solange M-A nicht bestanden ist. Eine Wirkung, die an den geförderten Schulen selbst ausbleibt, kann nicht mit dem Verhalten der Nicht-Teilnehmer entschuldigt werden.

Aber M-A misst nur die Innenwirkung an den geförderten Schulen — Treatment gegen Kontrolle innerhalb der Förderkohorte. Das öffentlich verbuchte Aggregat-Ziel hängt an der Gesamt-Kohorte aller 15-Jährigen der Teilnehmerländer. Ein an seinen wenigen geförderten Schulen messbar wirksames, aber mengenmäßig zu kleines Programm besteht M-A und könnte sich über M-B als „Residuum" freikaufen, obwohl es schlicht zu wenige der Berechtigten erreicht hat, um das Aggregat zu bewegen. Deshalb wird zwischen M-A und M-B eine dritte, M-B vorgeschaltete Bedingung eingezogen.

Schlüssel M-A0 — das Reichweite-Gate. Bevor die Residuum-Lesart überhaupt freigeschaltet wird, ist nachzuweisen: Hat die Förderung mengenmäßig genug der berechtigten Sozialindex-Schüler in den Teilnehmerländern erreicht, dass die nachgewiesene Innenwirkung × Reichweite das teilnehmerland-gewichtete Aggregat-Ziel rechnerisch tragen könnte? Der dafür nötige Mindest-Reichweite-Anteil wird — wie alle anderen Schwellen — von der Wissenschaftlichen Bewertungskommission vor Rollout-Start veröffentlicht und gesperrt festgelegt, extern an die IQB-Bildungstrend-Verteilung des kompensierbaren Gefälles [29] gekoppelt; die Trag-Rechnung Innenwirkung × Reichweite wird dabei mit der konservativen Untergrenze des M-A-Konfidenzintervalls gefahren — nicht mit dem Punktschätzer —, und diese Wahl wird wie der Reichweite-Anteil selbst vorab gesperrt veröffentlicht, damit der Konfidenz-Grenzbereich nicht nachträglich zugunsten der Residuum-Lesart umetikettiert werden kann; Revision nur über das öffentliche, gerichtlich überprüfbare Normänderungsverfahren (primärer Enforcer), BRH-Gegenzeichnung als zusätzliche Sicherung, soweit verwaltungsrechtlich zulässig (sekundärer Enforcer). Ist M-A bestanden, M-A0 aber nicht (zu wenige Berechtigte erreicht), ist ein verfehltes Aggregat kein Opt-out-Residuum, sondern eine eigene, dritte Kategorie: Skalierungsversagen — getrennt von „Programmversagen" (M-A nicht bestanden) und „systemischem Residuum" (M-B). Konsequenz: Die Opt-out-/Gymnasium-/Bayern-BW-Ausreden bleiben gesperrt, BRH + BMBF lösen das Audit aus, und die Frage lautet „warum hat die Förderung zu wenige der Berechtigten erreicht", nicht „das Gymnasium deckelt". Dieses Reichweite-Gate ist sprachlich und sachlich getrennt vom bereits bestehenden Mittelfluss-Coverage-Kriterium (Mittelabfluss < 80 % berechtigter Schulen → Rückforderungsregel): Jenes prüft den Mittelabfluss als Auslöser der Rückforderung; M-A0 prüft die erreichte Schüler-/Schulmenge als Gate gegen die M-B-Ausrede.

Schlüssel M-B — die Aggregat-Lücke trotz Teilnehmer-Wirkung und ausreichender Reichweite. Nur wenn M-A und M-A0 bestanden sind, das teilnehmerland-gewichtete Aggregat aber dennoch unter seinem Erwartungspfad bleibt, gilt „systemisches Residuum / Opt-out-Preis" als zulässige Lesart — und auch dann nur bis zu einer vorab quantifizierten Opt-out-Decke. Diese Decke ist extern verankert an den schulscharfen IQB-Bildungstrend-Länderdaten [29] — dem Anteil des kompensierbaren Gefälles, der rechnerisch außerhalb von Bayern und Baden-Württemberg liegt, also exakt der Konzentrations-These, die dieser Essay ohnehin als prüfbaren Parameter deklariert. Nicht aus der essay-eigenen Boudon-Dekomposition.

Wie bei der Mikro-Schwelle gilt: Erwartungspfad, Mindest-Effektstärke, Reichweite-Mindestanteil und Opt-out-Decke werden von der Wissenschaftlichen Bewertungskommission vor Rollout-Start veröffentlicht und gesperrt festgelegt. Ihr Revisionsschutz ruht auf zwei voneinander unabhängigen Enforcern. Primärer Enforcer ist die Verankerung der Schwellen in einer veröffentlichten gesetzlichen Norm beziehungsweise Rechtsverordnung: Jede nachträgliche Revision erfordert das ordentliche, öffentliche und gerichtlich überprüfbare (BVerfG, Verwaltungsgerichte) Normänderungsverfahren — eine bereits existierende, nicht erst zu schaffende Durchsetzungsinstanz. Die Norm verankert dabei den bestimmbaren Maßstab selbst — die an der EEF-Referenz für kompensatorische Schulförderung [30] ausgerichtete Mindest-Effektstärke —, den die Kommission vor Rollout nur noch technisch zu beziffern hat. So trifft der Gesetzgeber die wesentliche Entscheidung über Inhalt, Zweck und Ausmaß der Schwelle selbst; die Kommission instanziiert nur den Wert. Sekundärer Enforcer ist die BRH-Gegenzeichnung als zusätzliche Sicherung, soweit verwaltungsrechtlich zulässig. Diese Zweistufigkeit löst den Single Point of Failure auf: Fällt die BRH-Gegenzeichnung weg, bleibt die Schwellen-Revision an den justiziablen Normsetzungsweg gebunden — die Vorab-Sperr-Garantie kippt nicht, sie wird nur auf ihren primären, gerichtlich überprüfbaren Anker zurückgenommen. Der Schutz sichert die Schwellen-Definition innerhalb einer Legislatur, nicht die Mittelbindung über Legislaturen hinweg (R-001, das Folgeparlament ist nicht bindbar). Ob die Delegation der technischen Schwellen-Bezifferung an die Kommission verfassungsrechtlich trägt (Bestimmtheitsgebot, Wesentlichkeitstheorie, Art. 80 GG), ist eine vor Programmstart abschließend gutachterlich zu klärende Frage — durch die Verankerung des wesentlichen Maßstabs im Gesetz gemildert, nicht erledigt. Kein Programmbetreiber entscheidet im Nachhinein, ob ein verfehltes Aggregat „Versagen", „Skalierungsversagen" oder „Residuum" war. Die Mikro-Härtung beweist, dass eine solche Schwelle ohne neuen Durchsetzungsapparat trägt; die Aggregat-Schwelle setzt nur darauf auf.

Eingriff 1 — Skalierung und Schärfung des Startchancen-Programms

Die strukturelle Konsequenz lautet nicht „Bund finanziert Schulen direkt unter Umgehung der Länder" — das wäre verfassungswidrig (Mischverwaltungsverbot). Die strukturelle Konsequenz lautet: Das bereits existierende Startchancen-Programm wird skaliert, methodisch harmonisiert und mit Wirksamkeits-Triggern versehen.

Konkret:

Sozialindex-Harmonisierung: Bund und Länder einigen sich in einer neuen Verwaltungsvereinbarung auf einen bundeseinheitlichen Sozialindex nach dem Modell Nordrhein-Westfalens. Das NRW-Modell ist für Flächenstaaten skaliert: Es nutzt schulscharfe Approximation über die Wohnbezirke der Schüler, gewichtet mit Bundesagentur-für-Arbeit-Daten zur Arbeitslosigkeit [18]. Das Hamburger Modell setzt zu kleinräumige Geodaten voraus und ist auf Flächenländer analytisch nicht übertragbar. Damit fällt die Wahl auf das NRW-Modell.
Mittel-Skalierung: Volumen-Verdoppelung gegenüber dem aktuellen Startchancen-Programm (Referenz: 20 Mrd. Euro über 10 Jahre für ca. 4.000 Schulen) [19], gebunden an Sozialindex-Schulen der oberen drei Belastungsstufen.
Wirksamkeits-Trigger: Auszahlung der zweiten Tranche an einen Schulträger ist gebunden an einen messbaren Wirksamkeitsnachweis — Reduktion der Kompetenzlücke an den geförderten Schulen gegenüber der Wartelisten-Kontrollgruppe (siehe Evidenz-Architektur unten), nicht gegen die eigene historische Baseline.
Rückforderungsregel: Wenn Länder die zweckgebundenen Mittel nicht den vereinbarten Sozialindex-Schulen zukommen lassen, entfällt die Bundesbeteiligung für die nächste Förderperiode.
VERA-Berichtspflicht und Basisjahr-Kalibrierung: Die Verwaltungsvereinbarung enthält eine zwingende, standardisierte Berichtspflicht. Teilnehmende Länder melden pseudonymisierte schulscharfe VERA-Rohdaten inklusive der Sozialindex-Klassifizierung jährlich an das IQB und die Wissenschaftliche Bewertungskommission. Länder, die nicht berichten, verlieren die nächste Mitteltranche. Diese Pflicht hat eine doppelte Funktion: Sie bricht die föderalen Datensilos auf, und sie kalibriert das operative Mess-Instrument — die VERA-basierte Kompetenzlücke zwischen Sozialindex-Extrembändern (Stufen 7–9 vs. 1–3, teilnehmerland-gewichtet) als 2028-Frühwarnsignal des Circuit Breakers — bevor das erste Programm-Euro fließt.

Gegenargument: „Das ist Mischverwaltung durch die Hintertür." Antwort: Nein. Die Mittel fließen an die Länder (verfassungskonform nach Art. 104c GG), die Bedingungen sind in der Verwaltungsvereinbarung formuliert (verfassungskonform), die Wirksamkeitskontrolle erfolgt durch das Land (verfassungskonform). Das Startchancen-Programm folgt bereits dieser Logik [19] — was hier vorgeschlagen wird, ist Skalierung und Verschärfung, nicht Verfassungsbruch.

Plan B — Was wenn Bayern und Baden-Württemberg ablehnen? Die Verwaltungsvereinbarung erfordert keine Einstimmigkeit der Länder — Länder die teilnehmen wollen, können bilateral unterzeichnen. Um die Abwehroption zu bepreisen ohne verfassungsrechtlichen Zwang, gilt die Zwei-Spuren-Architektur: Länder, die den bundeseinheitlichen NRW-Index übernehmen, erhalten 100 Prozent des Bundessatzes; Länder, die ihren eigenen Index beibehalten, 70 Prozent — sofern dieser drei Mindeststandards erfüllt: (1) öffentliche Transparenz der Indexberechnung, (2) Jahreskohorten-Vergleichbarkeit über mindestens fünf Jahre, (3) Verifikation durch eine externe Stelle. Länder, die weder harmonisieren noch die Mindeststandards erfüllen, erhalten keine Bundesmittel.

Hier ist die Grenze der Gravitations-Logik zu benennen. Der Hochschulpakt wird gern als Präzedenzfall angeführt — alle Länder, Bayern eingeschlossen, haben teilgenommen, obwohl er Bedingungen enthielt [25]. Aber die Analogie trägt nur halb. Der Hochschulpakt zahlte Bayern für etwas, das Bayern ohnehin ausgebaut hätte: Studienplätze. Das skalierte Startchancen-Programm zahlt Bayern dafür, einen bundeseinheitlichen Sozialindex zu übernehmen, der seine Eigenpositionierung einschränkt. Das ist strukturell etwas anderes. Bayern und Baden-Württemberg haben die fiskalische Kapazität — und über ihre Landespolitik den Willen —, die 30 Prozent Opportunitätskosten zu tragen, um die Indexhoheit zu behalten. Der realistische Fall ist deshalb nicht „alle ziehen mit", sondern: die beiden bundesweit besten Bildungsländer bleiben in der 70-Prozent-Spur oder ganz draußen.

Das hat eine harte Konsequenz für die Datenbasis. Fehlen Bayern und Baden-Württemberg im harmonisierten Index, ist kein seriöses bundesweites Spreizungs-Benchmark für 2030 mehr ausweisbar. Das Ziel wird deshalb explizit als teilnehmerland-gewichtete Größe definiert, nicht als nationale Bilanz. Die strategische Gegenfrage — ob das Opt-out der Spitzenländer die Gesamtwirkung untergräbt — lautet konkret: Wie viel des kompensierbaren Gefälles liegt überhaupt außerhalb von Bayern und Baden-Württemberg? Die plausible Antwort ist: der größte Teil, weil der kompensierbare Schul-Funktionsanteil sich in den Ländern mit den schwächsten Ergebnissen konzentriert — Bremen, Berlin, Sachsen-Anhalt —, deren Binnen-Spreizung größer ist als die der Spitzenländer. Aber „plausibel" ist hier nicht genug: Diese Konzentrations-These trägt das strategische Argument, und ein tragendes Argument darf nicht als Vermutung stehen bleiben. Sie wird deshalb prüfbar gemacht — wie, klärt die Evidenz-Architektur.

Die Evidenz-Architektur — gestaffelter Rollout und externe Versagens-Schwelle. Das skalierte Programm kann nicht alle berechtigten Sozialindex-Schulen an Tag eins finanzieren — bei rund 4.000 Schulen [19] ist die Staffelung über mehrere Jahre physisch und fiskalisch unvermeidbar. Diese Notwendigkeit wird zum Instrument: Die Reihenfolge der Aufnahme unter den berechtigten Schulen wird nicht nach Antragsgeschwindigkeit vergeben — das bevorzugte systematisch die Kommunen mit den stärksten Verwaltungsapparaten —, sondern randomisiert. Die noch nicht geförderten, aber berechtigten Schulen bilden eine Wartelisten-Kontrollgruppe: gleiches Sozialindex-Band, gleicher Gymnasium-Kontext, Unterschied allein im Förder-Timing. Dass eine randomisierte Aufnahmereihenfolge unter gleichermaßen berechtigten Schulen verwaltungsrechtlich zulässig ist — die Vergabe knapper Kapazität per Losverfahren ist in der deutschen Rechtsprechung etwa bei der Studienplatzvergabe anerkannt —, ist plausibel, aber hier nicht belegt: Ob die Art.-3-GG-Konformität der randomisierten Förderreihenfolge trägt, ist eine offene Rechtsfrage, die vor Programmstart gutachterlich zu klären ist — die Präzedenz des Losverfahrens bei knapper Kapazität (Studienplatzvergabe) stützt sie, ersetzt die abschließende Prüfung aber nicht.

Die Evidenz-Architektur ist damit zweistufig angelegt — Plan A wenn das Gutachten die Randomisierung bestätigt, Plan B wenn das Gutachten sie kippt.

Plan A (Randomisierung verfassungsrechtlich gesichert): Randomisierte Aufnahmereihenfolge unter berechtigten Schulen — sauberer Wartelisten-Kontrollarm, klarster verfügbarer Counterfactual, Programmversagen von Gymnasium-Residuum trennbar ohne dass die Kontrollgruppe unter einem anderen institutionellen Kontext sitzt.

Plan B (Randomisierung rechtlich nicht haltbar): Quasi-experimenteller Ansatz — bundesweit gepooltes Propensity-Score-Matching (PSM) oder Inverse Probability of Treatment Weighting (IPTW) geförderter Schulen gegen strukturell vergleichbare Schulen (gleiches Sozialindex-Band) aus nicht-teilnehmenden Ländern oder der zweiten Staffelungsrunde; ergänzt durch Pre-Post-Analyse geförderter Schulen gegen den IQB-Bildungstrend-Landesdurchschnitt [29].

Das Matching-Design muss bundesweit gepoolt konzipiert werden. Ein länderweise isoliertes Matching in kleinen Bundesländern — Bremen, Saarland — erreicht bei den verfügbaren Schulkohortenstärken nie die statistische Power, die für kleine Effektstärken erforderlich ist. IPTW behält die gesamte Stichprobe und erzielt dadurch strukturell höhere statistische Power als 1:1-Matching, das unmatched Schulen verwirft.

Plan B hat einen methodischen Preis: Selektionseffekte können nicht vollständig ausgeschlossen werden. Die Programmversagens-Schwelle bleibt an der externen EEF-Effektstärken-Referenz [30] verankert, aber die Kausalzuschreibung ist erkennbar schwächer als unter Plan A. Dieses methodische Schwächesignal ist bei jeder Auswertung explizit auszuweisen.

Operationalisierbarkeits-Bedingung: Plan B gilt nur als gültige Evaluierungsarchitektur, wenn die Wissenschaftliche Bewertungskommission vor Rollout-Start eine Power-Analyse vorlegt, die nachweist, dass das gepoolte Matching-Design bei den verfügbaren deutschen Grundschulkohortenstärken die extern verankerte Mindest-Effektstärke bei ≥ 80 % statistischer Power detektieren kann. Stichprobengröße und Matching-Designspezifikation sind Teil dieser Analyse. Dabei ist d = 0,10 am anspruchsvollen Rand des Erreichbaren — er verlangt sehr große Fallzahlen und ein günstiges Cluster-Design —, während d = 0,15 realistischer liegt; genau für diesen Randbereich existiert das Gate. Die Gate-Logik selbst (negative Power-Analyse → Plan B nicht startfähig) bleibt davon unberührt — diese Annahme ist vor Rollout durch die Kommission zu rechnen; das Power-Gate sichert sie ab.

Fällt die Power-Analyse negativ aus, gilt Plan B nicht als gültige Fallback-Architektur. Das Programm ist dann ohne Plan-A-Clearance — positives Art.-3-GG-Gutachten — nicht als evaluierbares Programm startfähig.

Was Plan B verliert: die Sauberkeit des Kausalschlusses und — wenn die Power-Analyse nicht besteht — auch die Messbarkeit des Circuit Breakers. Das ist der Preis, den ein negatives Art.-3-GG-Gutachten kostet.

Das löst zwei Probleme auf einmal. Erstens entzieht der Zufall den gut vernetzten Schulträgern das Vorzugsrecht — eine Brennpunktschule in einer strukturschwachen Kommune hat dieselbe Chance auf einen frühen Startplatz wie eine in einer ressourcenstarken Kreisstadt. Zweitens: Die Wartelisten-Kontrolle liefert den sauberen Counterfactual. Eine Verbesserung an geförderten Schulen ist sonst von bloßer Regression zur Mitte — selektierte Schwach-Performer steigen statistisch ohnehin — nicht zu unterscheiden. Mit Kontrollarm ist sie es.

Darauf baut die Versagens-Schwelle auf. Sie wird nicht aus der eigenen Spreizungs-Dekomposition abgeleitet — das wäre der Zirkel, in dem das Ziel und die Entschuldigung für sein Verfehlen aus derselben Quelle stammen. Sie wird extern verankert: an den Effektstärken vergleichbarer Kompensationsprogramme — der wissenschaftlichen Begleitung des laufenden Startchancen-Programms, der NRW-Sozialindex-Wirksamkeitsforschung, internationalen Referenzen wie dem englischen Pupil Premium und der Effektstärken-Datenbank der Education Endowment Foundation [30]. Daraus folgt ein konkreter Schwellenwert: Schlagen die geförderten Schulen ihre Wartelisten-Kontrollgruppe nach einem definierten Zeitfenster nicht um die extern verankerte Mindest-Effektstärke, hat das Programm versagt — nicht das Gymnasium. Diese Schwelle ist gegen das Gymnasium-Argument immun, weil die Kontrollgruppe unter demselben Gymnasium sitzt: Ein Effekt, der zwischen Treatment und Kontrolle verschwindet, kann nicht mit dem Sekundäreffekt erklärt werden, der auf beide gleich wirkt.

Diese externe Verankerung braucht eine Governance, die den Festlegungsprozess selbst absichert. Der stärkste Einwand gegen jede Versagens-Schwelle ist nicht ihre Methode — er ist ihre Terminierung. Politische Akteure können die Festlegung des konkreten Schwellenwertes technisch immer verzögern: Wird er erst nach dem ersten Messzeitpunkt gesetzt, ist er frei wählbar und taugt als Entschuldigung für jedes Ergebnis. Deshalb sind zwei Strukturbedingungen zwingend. Erstens legt die Wissenschaftliche Bewertungskommission — ohne Programm-Mandat, besetzt aus Bildungsforschung und Sozialwissenschaften, verfassungsrechtlich gestützt auf Art. 91b Abs. 2 GG, administrativ angebunden an das DIPF in Kooperation mit dem IQB [31] — den Schwellenwert vorab, vor Rollout-Start, veröffentlicht und gesperrt fest. Der Revisionsschutz ist derselbe zweistufige Enforcer wie bei der Aggregat-Schwelle (siehe oben): primär die Verankerung des Schwellenwerts — des an der EEF-Referenz [30] ausgerichteten bestimmbaren Maßstabs, den die Kommission nur technisch beziffert (Bestimmtheitsgebot/Art. 80 GG) — in einer veröffentlichten gesetzlichen Norm, deren Revision allein das justiziable Normänderungsverfahren erlaubt; sekundär die BRH-Gegenzeichnung, soweit zulässig. Die institutionelle Trennung ist dabei zwingend: Die Bewertungskommission setzt die Norm, der BRH prüft ihre Einhaltung und zeichnet Revisionen gegen — kein Akteur besetzt beide Rollen, denn ein BRH, der den Schwellenwert selbst vorab festlegt, ist bei der späteren Prüfung nicht mehr unabhängig gegenüber der eigenen Norm. Zweitens ist die veröffentlichte, gesperrte Schwelle Bedingung für die Auszahlung der ersten Mittel-Tranche. Kein Schwellenwert vor Rollout-Start — keine erste Tranche. Wer die Messlatte nach hinten schiebt, schiebt auch das Geld nach hinten. Das Verschieben ist damit nicht mehr nur institutionell unerwünscht — es macht das Programm nicht startfähig.

Das hat einen Preis, und er wird hier benannt, nicht versteckt: Der gestaffelte Rollout bedeutet, dass manche berechtigte Brennpunktschule die Förderung bewusst später erhält, um als Kontrolle zu dienen. Der Vorwurf „Experimente auf dem Rücken der Ärmsten" liegt nahe. Die Antwort ist nicht, ihn zu bestreiten, sondern den Tausch offenzulegen. Erstens: Jede berechtigte Schule wird gefördert — die Staffelung verzögert, sie verweigert nicht. Zweitens: Wenn ohnehin gestaffelt werden muss, ist der Zufall die gerechteste Reihenfolge, weil er den gut vernetzten Verwaltungen ihr Vorzugsrecht nimmt. Drittens: Was Zufall und Kontrolle erkaufen, ist das Wissen, ob die Milliarden wirken. Ohne dieses Wissen ist das Programm ein Blindflug, der beim ersten PISA-Rückschlag medial zerfleischt wird und dann ganz fällt — auch für die, die noch nicht an der Reihe waren. Der Bundesrechnungshof hat dem DigitalPakt 1.0 2022 exakt das Fehlen dieser Wirkungskontrolle vorgehalten [15]. Ein Programm, das strukturelle Vernunft beansprucht, baut sie von Anfang an ein, statt sie sich vorhalten zu lassen.

Diese Evidenz-Architektur trägt eine Spannung in sich, die sie nicht auflösen kann — und die der Essay deshalb offen deklariert, statt sie wegzuversprechen. Die erste methodisch belastbare Auswertung liegt frühestens 36 Monate nach Rollout-Start — bei realistischem Rollout-Start 2027/28 also 2030/31. Die nächste Bundestagswahl liegt spätestens 2029. Eine neue Bundesregierung entscheidet 2029/30 über die Fortsetzung, Schrumpfung oder Neuarchitektur eines laufenden 40-Milliarden-Programms — ohne eine einzige Wartelisten-Auswertung gesehen zu haben. Wer 2027 bewilligt, sieht die Evidenz nie; wer sie 2030/31 bekommt, hat das Programm nicht beschlossen.

Das ist der irreduzible Preis: Keine verfassungsfeste Bindung der Folgelegislatur an die Frühsignale existiert. Ein Bundestag kann den nächsten nicht binden; jede Selbstbindung über die Legislaturgrenze ist durch einfache Mehrheit auflösbar. Diese Architektur kann die Kontinuierungsentscheidung 2029 nicht erzwingen — und ein Essay, der das Gegenteil behauptete, lieferte dem Verfassungsrechtler genau den Bruch, den dieser Crashtest sonst nicht findet. Ein rationaler Nachfolger kann das Programm 2029 vor der ersten belastbaren Auswertung kappen oder schrumpfen. Das bleibt offen.

Was sich konstruieren lässt, ist nicht die Bindung, sondern die Verschiebung der Begründungslast — und auch dieser Hebel hält nur, wenn sein Auslöser derselben Disziplin folgt wie jede andere Schwelle im Programm. Das Errichtungsgesetz beziehungsweise die Verwaltungsvereinbarung legt eine Fortführungsregel mit umgekehrter Vorgabe fest: Liegt zum Entscheidungsfenster ein positives Implementierungstreue-Frühsignal vor, läuft das Programm automatisch in die nächste Förderperiode fort. Der Auslöser ist dabei nicht frei auslegbar, sondern an denselben Vorab-Sperr-Mechanismus gekoppelt wie M-A, M-B und die 36-Monats-Schwelle: Bedingung b ist keine Nulllinie („nicht-negatives Kompetenz-Delta"), sondern eine extern verankerte Frühsignal-Mindest-Effektstärke, abgeleitet aus derselben EEF-/Vergleichsprogramm-Referenz [30] wie die Versagens-Schwelle — dieser Wert wird von der Wissenschaftlichen Bewertungskommission vor Programmstart festgelegt und veröffentlicht. Bedingung a (Implementierungstreue) trägt die analoge, vorab veröffentlichte und gesperrte Schwelle. Beide Schwellen werden von der Wissenschaftlichen Bewertungskommission vor Rollout-Start veröffentlicht und gesperrt und sind gegen spätere Umdefinition durch denselben zweistufigen Enforcer geschützt wie alle anderen Schwellen — justiziable Normverankerung des bestimmbaren Maßstabs (hier die an der EEF-Referenz [30] ausgerichtete Frühsignal-Mindest-Effektstärke) primär, BRH-Gegenzeichnung sekundär. Ob die BRH-Gegenzeichnung als sekundärer, nicht mehr lasttragender Enforcer in einer Art-104c-Vereinbarung verwaltungsrechtlich zulässig ist, bleibt eine offene, vor Programmstart gutachterlich zu klärende Rechtsfrage. Ein Abbruch oder eine Schrumpfung ist weiterhin möglich — aber er erfordert dann einen aktiven Parlamentsbeschluss, der ein vorab gesperrtes, extern verankertes Frühsignal ausdrücklich widerlegt, nicht nur die Behauptung, „nicht-negativ" sei kein Erfolg. Der Unterschied ist prozedural, nicht material: Heute ist der Abbruch der stille Default — das Programm läuft aus, indem die Mittel im Haushalt schlicht nicht mehr eingestellt werden, ohne dass irgendjemand das begründen muss. Unter der Fortführungsregel kehrt sich die Last um: Nicht der Fortführer muss das Programm verteidigen, sondern der Abbrecher muss seinen Abbruch gegen das öffentlich ausgewiesene Frühsignal rechtfertigen. Die Last liegt objektiv beim Abbrecher; sie wandert nicht mehr stillschweigend zum schwächeren Akteur, der Fortführung will.

Dieser Hebel bindet nichts. Eine einfache Mehrheit kann die Fortführungsregel jederzeit kippen — sie ist kein verfassungsrechtlicher Zwang, sondern eine Umkehr der politischen Beweislast. Und ob eine solche Default-Continuation-Klausel innerhalb einer Art-104c-Verwaltungsvereinbarung verwaltungs- und haushaltsrechtlich überhaupt zulässig konstruiert werden kann, ist offen — eine Rechtsfrage zur Zulässigkeit einer Default-Continuation-Klausel in einer Art-104c-Vereinbarung, die vor Programmstart gutachterlich zu klären ist. Das ist die Grenze: der maximal erreichbare Teil-Mechanismus, nicht die Lösung. Was er nicht kann, trägt das Programm offen — was er kann, baut es von Anfang an ein.

Das geschieht auf zwei Wegen, die das randomisierte Design nicht aufweichen. Erstens liefert der Wartelisten-Kontrollarm bereits bei 12 bis 18 Monaten valide Zwischensignale — keine endgültige Kausalaussage, explizit als vorläufig gelabelt, aber valide genug für eine evidenzbasierte Kontinuierungsentscheidung unter Vorbehalt. Drei Frühindikatoren, die dieselbe Kontrollarm-Struktur liefert: (a) Implementierungstreue — ist das Programm tatsächlich an den geförderten Schulen angekommen, oder werden formal abgehakte Konzepte ohne Substanz produziert? Das ist das DigitalPakt-1.0-Muster [16], und es ist erkennbar, bevor ein einziger VERA-Jahrgang ausgewertet ist. (b) Früher Kompetenz-Delta der geförderten Schulen gegen die Kontrollgruppe, gemessen an VERA-Vorläufer-Diagnostik oder standardisierten Lernstandserhebungen — kein Kausalnachweis, aber das Trendsignal zwischen „Programm bewegt gar nichts" und „Programm bewegt etwas, 36 Monate für Belastbarkeit nötig" ist bei 12 bis 18 Monaten bereits unterscheidbar. (c) Anwesenheit und Retention an geförderten Schulen im Vergleich zur Kontrollgruppe — Frühindikator für Schulabbruch-Dynamik unter demselben Gymnasium auf beiden Seiten der Kontrollgrenze. Diese drei Signale entscheiden das Versagensurteil nicht — dafür sind die 36 Monate da. Was sie leisten: die Kontinuierungsentscheidung der Folgelegislatur auf eine evidenzbasierte Grundlage stellen, die ohne Aufweichen des Designs verfügbar ist.

Zweitens ist die gestaffelte Rollout-Architektur selbst von Tag eins als Wirkungskontrolle auditierbar. Der Bundesrechnungshof hat dem DigitalPakt 1.0 vorgeworfen, dass kein Kontrollmechanismus existiert [15]. Hier existiert der Kontrollmechanismus — der randomisierte Wartelisten-Kontrollarm — ab dem ersten Rollout-Tag und ist sofort öffentlich nachvollziehbar. Ein BRH-Vorabaudit findet nicht „Wirkungskontrolle fehlt", sondern „Wirkungskontrolle ist eingebaut und läuft — die Ergebnisse folgen nach 36 Monaten." Die Architektur ist BRH-fest, bevor das erste Ergebnis ausgewiesen wird.

Und die Konzentrations-These wird damit von einem tragenden Pfeiler zu einem prüfbaren Parameter. Ob das kompensierbare Gefälle sich in Bremen, Berlin und Sachsen-Anhalt konzentriert oder gleichmäßiger verteilt ist, wird vor dem Rollout gegen die schulscharfen IQB-Bildungstrend-Länderdaten [29] geprüft, nicht im Nachhinein behauptet. Vor allem aber: Die Wartelisten-Kontrolle misst die tatsächliche Wirkung auf die Teilnehmer unabhängig davon, wie das Gefälle bundesweit verteilt ist. Selbst wenn die Konzentrations-These teilweise falsch ist, bleibt der Wirkungsnachweis intakt — er hängt nicht mehr an ihr.

Eingriff 2 — Quereinsteiger-Formalisierung als Hauptmaßnahme, Kapazitätsaudit als Wegweiser

Pipeline-Analyse: Die Daten sind eindeutig. Destatis N041/2024 [27] weist aus: Studienanfänger Lehramt 2023 — 46.400, Zehnjahresvergleich: −2,1 Prozent, nahezu stabil. Absolventen Lehramt 2023 — 28.900, Zehnjahresvergleich: −10,5 Prozent. Stabile Anfänger, crashende Absolventen. Das Rohr leckt nicht am Eingang — es leckt in der Mitte oder am Ende der Pipeline.

Diese Diagnose hat eine direkte Konsequenz für die Interventionshierarchie: Eine primäre Maßnahme, die mehr Studienplätze bereitstellt, füllt ein Rohr das strukturell anderswo leckt. Die Leute kommen rein — sie kommen nur nicht raus. Fünf mögliche Verlustkanäle kommen infrage: (1) Studienabbruch, (2) Referendariats-Deckelung durch Länder, (3) früher Berufsaustritt, (4) frühe Teilzeitentscheidung, (5) — und nur als letzter Kandidat, dem der amtliche Befund a priori widerspricht — Studienplatzmangel. Gegen jeden dieser Kanäle wirkt ein anderer Hebel. Eine Primärintervention die auf Kanal (5) zielt, bevor das Audit die Kanaldiagnose geliefert hat, ist Planungsroutine ohne Evidenzbasis.

Die Hauptmaßnahme: Die strukturelle Konsequenz lautet, die Quereinsteiger-Spur nicht als Notfallpflaster zu verwalten, sondern als zweite reguläre Spur zu formalisieren. Das ist der einzige Eingriff, der unabhängig davon wirkt, wo in der Pipeline das Leck liegt: Er erschließt qualifiziertes Personal außerhalb der leckenden Pipeline — unmittelbar, ohne einen diagnostischen Vorlauf abzuwarten. Die heutige Realität — 10,5 Prozent aller Lehrkräfte unterrichten bereits ohne Lehramtsprüfung [9] — ist verdeckte Praxis. Das Ziel: formalisieren statt kaschieren.

Qualifikationsarchitektur: Quereinsteiger erhalten im Einstiegsjahr E10/E11 (TVöD/TV-L) mit explizit befristetem Laufbahnstatus “Lehramtsstudium im Dienst” — nicht als Parallelkarriere, sondern als Durchgangsphase. Der Upgrade auf E13 erfolgt nach dem ersten berufsbegleitenden Staatsexamen, das in einem institutionell gesicherten Zeitfenster (typischerweise drei bis fünf Jahre) abgelegt wird. Voraussetzung: pädagogische Mindestqualifikation (vorgeschaltetes Master-Modul), nicht Lehramtsprüfung. Das Modell deklariert die zweite Spur nicht als gleichwertig zur regulären Ausbildung, sondern als befristete Einstiegsphase mit definiertem Qualifizierungsziel. Das ist GEW-zumutbar: Es stellt keine strukturelle Deprofessionalisierung dar, sondern eine Einqualifizierung. Der Philologenverband schützt primär Gymnasial-Lehrerstellen — der Quereinsteiger-Pfad trifft strukturell die Primarstufe und Sekundarstufe I, wo seine Marktmacht am geringsten ist. Der dbb-Beamtenbund sichert das Laufbahnrecht; das Modell greift es nicht an, weil der Quereinsteiger-Status als Durchgangsstatus definiert ist, nicht als Parallelstruktur zum Beamtenlaufbahnrecht.

Gegenargument (Tarif): „E13 für gleiche Arbeit — das ist vor jedem Arbeitsgericht einklagbar." Antwort: Nur wenn man gleiche Arbeit und gleiche Qualifikation vermengt. Im befristeten Laufbahnstatus ist die Qualifikation formal unterschiedlich — der Quereinsteiger ist im Qualifizierungsprozess. Das NRW-Seiteneinsteiger-Modell (OBAS-Qualifizierungsverfahren) praktiziert diese Besoldungsdifferenzierung seit Jahren ohne bekannte arbeitsrechtliche Auseinandersetzung.

Das System-Integratoren-Modell: Die politische Belastbarkeit des Quereinsteiger-Pfads steht und fällt mit der Kooperationsbereitschaft der Bestandslehrkräfte. Die Lösung: Bestandslehrkräfte werden nicht zu passiven Duldenden gemacht, sondern zu aktiven System-Integratoren mit eigenem Skin in the Game — in zwei Zeithorizonten.

Kurzfristig — Deputats-Umschichtung: Bestandslehrkräfte, die das Mentoring übernehmen, erhalten eine Umschichtung von drei Unterrichtsstunden pro Woche auf Mentoring-Stunden — maximal zwei simultane Mentees. Die Gesamtdeputation bleibt identisch: kein Unterrichtsausfall, kein Haushaltsmehraufwand, kein Munitionsdepot für Finanzministerium oder Opposition. Unterrichtsvorbereitung für drei Stunden entfällt; die formale Last sinkt spürbar.

Rechtliche Grundlage der Deputats-Umschichtung: Die Maßnahme ist Verordnungsrecht, nicht Tarifrecht. Gemäß § 44 TV-L richten sich die Arbeitszeiten von Tarifbeschäftigten nach den beamtenrechtlichen Arbeitszeitbestimmungen des jeweiligen Landes. Die Vergabe von Anrechnungsstunden (für Schulleitungsaufgaben, Sammlungsleitung oder Mentoring) erfolgt durch Änderung der Landesarbeitszeitverordnung per ministeriellem Erlass — ohne Neuverhandlung des TV-L. Die GEW hat kein tarifliches Streikrecht gegen diese Entscheidung. Kultusministerien können die System-Integratoren-Anrechnungsstunden unilateral einführen.

Langfristig — kumulativer Laufbahnpfad: Länder, die Bestandslehrkräften nach erfolgreicher Qualifizierung von zwei Quereinsteigern bis zum berufsbegleitenden Staatsexamen eine Höherstufung auf A14/E14 einräumen, erhalten erhöhte Mittelzuweisung aus einer dafür geschaffenen Verwaltungsvereinbarung Lehrkräfte-Kapazität (Art. 104c GG, Bund↔Länder direkt) — bewusst nicht aus dem Hochschulpakt (zur Begründung siehe unten). Der Trigger ist das Staatsexamen-Bestehen des Mentees: unmanipulierbar, weil der Mentee selbst das Examen ablegen muss.

Das Zwischensignal — Mentoring-Qualität vor dem Staatsexamen: Zwischen der Dokumentation der Deputats-Umschichtung (Frühsignal) und dem berufsbegleitenden Staatsexamen des Mentees (Spätsignal, oft erst nach vier bis fünf Jahren) klafft ein Fenster, in dem formale Compliance und tatsächliche Mentoring-Qualität auseinanderfallen können: Der Quereinsteiger hat einen Mentor auf dem Papier — was er inhaltlich bekommt, misst kein Dokument. Genau dieses Fenster — formal abgehakte Konzepte ohne echten Entwicklungsprozess — hat den DigitalPakt 1.0 scheitern lassen [16]. Deshalb wird die Mentoring-Qualität bei etwa 24 Monaten an einem Signal gemessen, das der Mentor nicht selbst produzieren kann: dem Ergebnis der ersten berufsbegleitenden Teil- oder Modulprüfung des Mentees oder — wo eine solche Prüfung fehlt — einer externen Unterrichtspraxis-Evaluation des Mentees nach dem Prüfkatalog der Wissenschaftlichen Bewertungskommission, der für Eingriff 3 aufgebaut wird. Das Signal ist mentee- und prüfungsseitig, nicht mentorseitig: Es ist durch formale Dokumentation strukturell nicht erfüllbar. Der kumulative Laufbahn-Token ist an dieses Zwischensignal teilgekoppelt, nicht allein an das terminale Staatsexamen — schlechtes Mentoring hat damit eine Konsequenz vor 2032, nicht erst danach.

Gegenargument (Mentee-Abbruch): „Der Mentor hat Zeit investiert, der Mentee bricht ab — der Laufbahn-Token ist weg." Antwort: Die investierte Zeit ist durch die Deputats-Umschichtung bereits kompensiert. Er verliert den Token für diesen Durchlauf und kann den nächsten Mentee annehmen; der Kumulationscounter läuft weiter. Das erzeugt das richtige Anreizsignal: Mentoring als Absitz-Zeit lohnt sich strukturell nicht.

Ursachen-Audit als Wegweiser für konditionale Sub-Instrumente: Das Ursachen-Audit (BMBF, Grundlage: Destatis-Absolventen-Anfänger-Zeitreihe, KMK-Referendariatsstatistik, Lehrkräfte-Verbleibsstudien) weist für jedes Land den dominanten Verlustkanal nach. Das Audit informiert drei konditionale Sub-Instrumente — parallel zur laufenden Quereinsteiger-Spur, nicht als deren Voraussetzung:

Sub-Instrument A — Studienplatzmangel als dominanter Verlustkanal: Mittel für Studienplatzerweiterung über den Hochschulpakt-Mechanismus — die einzige der hier genannten Konditionierungen, die im Hochschulpakt richtig aufgehoben ist, weil sie den Hochschulen selbst zugutekommt. Länder, die nicht aufstocken, verlieren Bundesmittel für andere Hochschulthemen. Dieses Sub-Instrument tritt nur in Kraft, wenn das Audit Studienplatzmangel als dominanten Verlustkanal identifiziert — was der amtliche Befund (stabile Studienanfänger, crashende Absolventen) a priori unwahrscheinlich macht, aber nicht ausschließt.

Sub-Instrument B — Referendariats-Flaschenhals als dominanter Verlustkanal: Mittel für Referendariatskapazitäten (zusätzliche Ausbildungsseminare, strukturierte Mentorenmodelle für Referendare). Länder, die Referendarsplätze strukturell deckeln, erhalten keine Bundesmittel für die Kapazitätsoffensive.

Sub-Instrument C — Berufsflucht als dominanter Verlustkanal: Mittel für Arbeitsbedingungen-Reform (Rückkehrgarantien für Aussteiger, Deputatsmodelle, Teilzeit-Umbau-Anreize). Die Teilzeitquote von 42,3 Prozent [10] ist nicht nur Symptom — sie ist auch Hebel: Wer Vollzeit zurückholt, schließt einen Teil der Lücke ohne neue Pipeline-Investition.

Warum zwei getrennte Vehikel — und nicht der Hochschulpakt für alles: Die Versuchung wäre, den ganzen fiskalischen Druck über den Hochschulpakt zu leiten, das etablierte Gravitations-Instrument. Das wäre ein taktischer Fehler. Der Hochschulpakt ist das Instrument der Hochschulen; seine institutionelle Betreiberin, die Hochschulrektorenkonferenz, hat ein legitimes und vitales Interesse daran, dass seine Mittel den Hochschulen zugutekommen — und nicht als Hebel für Besoldungsreformen in der Primarstufe zweckentfremdet werden. Eine Verwaltungsvereinbarung, die Hochschulpakt-Mittel an A14 für Grundschullehrkräfte knüpft, aktiviert die HRK als institutionellen Gegenspieler und lädt die Zweckentfremdungs-Klage geradezu ein. Deshalb die Trennung: Was den Hochschulen dient — die Studienplatzerweiterung in Sub-Instrument A — bleibt im Hochschulpakt und ist HRK-konform. Was die Primarstufen-Besoldung betrifft — der kumulative Laufbahnpfad und seine geografische Bedingung — läuft über die eigenständige Verwaltungsvereinbarung Lehrkräfte-Kapazität. Dieselbe Gravitations-Logik (Bundesgeld, konditioniert), aber ohne den HRK-Widerstand und ohne den Vorwurf, einen Topf für einen fremden Zweck zu kapern.

Verfassungsrechtliche Grundlage: Besoldungsrecht ist seit der Föderalismusreform 2006 ausschließlich Landesrecht (Art. 74 GG). Der Bund kann keinen Besoldungsanspruch schaffen — er kann eine Förderungs-Bedingung schaffen. Fiskalische Gravitation, kein Mandat. Das schließt eine jahrzehntealte Laufbahnungerechtigkeit zwischen dem gymnasialen und dem Primarstufenpfad für jene Länder, die teilnehmen — und macht das Modell GEW-positiv: Die Gewerkschaft kann den Laufbahnpfad als eigenständigen Verhandlungserfolg gegenüber Länderfinanzministerien kommunizieren, unabhängig vom Quereinsteiger-Streit.

Die geografische Grenze des Instruments: Länder, die A14 für Primarstufenlehrkräfte aus haushaltspolitischen Gründen blockieren, erhalten diese Mehrallokation aus der Verwaltungsvereinbarung Lehrkräfte-Kapazität nicht. Das trifft das Modell dort am härtesten, wo der Lehrermangel am drückendsten ist. Das ist die ehrliche Reichweite dieses Instruments.

Das strategische Kalkül: Das Modell spaltet die Allianz der Veto-Spieler. Die GEW fordert A14-Zugang für Primar- und Sek-I-Lehrkräfte seit Jahren. Die Bundesförderungs-Bedingung gibt ihr ein fiskalisches Argument gegenüber Länderfinanzministerien, das sie ohne diesen Mechanismus nicht hätte. Wer das Mentoring ablehnt, blockiert den Laufbahnaufstieg seiner eigenen Kernklientel und verzichtet auf Bundesmittel. Wer es akzeptiert, legitimiert die Quereinsteiger-Spur.

Eingriff 3 — Prozessreform-Voraussetzung für DigitalPakt 2.0

Die strukturelle Konsequenz lautet: Die 2,5 Milliarden Bundesmittel des DigitalPakt 2.0 werden in drei Tranchen ausgezahlt. Jede Tranche ist an einen nicht-papierbasierten Meilenstein gebunden — nicht an ein “dokumentiertes Konzept” (das ist das Scheiternsmuster des DigitalPakt 1.0, in dem technisch-pädagogische Einsatzkonzepte formal abgehakt wurden um an Gelder zu gelangen [16]), sondern an verifizierten Outcome.

Das Tranchen-Modell ist nicht nur ein Wirkungskontroll-Instrument — es ist die direkte Antwort auf den Akteur, der das DigitalPakt-1.0-Muster erst ermöglicht hat. Kultusministerien sind formal Kooperationspartner in jeder Verwaltungsvereinbarung. Wer die Verwaltungsvereinbarung unterschreibt, die Konzepte genehmigt und die Schulberichte entgegennimmt, hat institutionell Zugang zu beiden Hebeln: der Genehmigung und der Vernebelung. Jede Auditierbarkeitsanforderung schneidet diesen Spielraum zurück — deshalb ist Compliance-Theater der rationale Output, wenn Tranchen an selbst produzierte Dokumente gebunden sind. Das Tranchen-Modell schließt diesen Kanal: Tranche 2 prüft nicht das Konzept, das das Kultusministerium selbst zertifiziert hat, sondern Fortbildungsabschlüsse nach einem bundesweit anerkannten Standard; Tranche 3 prüft nicht die Selbstauskunft der Schule, sondern VERA-Peer-Ergebnis und externes Audit.

Tranche 1 (30 Prozent): Amtlich beglaubigter Lehrplan-Nachweis durch das Landesschulministerium — nicht schulintern produziert und damit nicht schulseitig gameable. Nachweis: Amtliche Genehmigung der Lehrplan-Anpassung für die geförderten Schulen, gezeichnet vom Schulministerium, veröffentlicht im Amtsblatt.

Tranche 2 (40 Prozent): Belegte Lehrerfortbildungsabschlüsse nach bundesweit anerkanntem Standard (KMK-Äquivalent), pro geförderter Schule nachgewiesen. Stichprobenartige Prüfung durch zertifizierte externe Wirtschaftsprüfer nach dem Bewertungskommissions-Prüfkatalog.

Tranche 3 (30 Prozent) — Dualer Schlüssel: Auszahlung erfordert zwei simultane Nachweise. Beide müssen positiv sein.

Schlüssel A — VERA-Trend gegen Peer-Group: Signifikante positive Abweichung des VERA-Ergebnisses der geförderten Schulen vom Peer-Group-Durchschnitt strukturell vergleichbarer Schulen — frühestens 24 Monate nach Auszahlung Tranche 1. Die Peer-Group ist nach gleichem Sozialindex-Band und vergleichbarer demografischer Zusammensetzung (nach NRW-Modell [18]) definiert. Eine Schule kann ihre eigene historische Baseline nicht durch Performancezurückhaltung in den Referenzjahren drücken: Wenn die ganze Peer-Kohorte zurückhält, ist das Ziel für alle gleich schwer. Wenn nur sie selbst zurückhält, fällt sie in der Peer-Vergleichsgruppe zurück statt vorwärts.

Schlüssel B — Unterrichtspraxis-Audit: Positives Ergebnis einer zertifizierten externen Unterrichtspraxis-Evaluation nach dem Prüfkatalog der Wissenschaftlichen Bewertungskommission. Der Prüfkatalog bewertet nicht Testergebnisse, sondern die strukturelle Integration digitaler Werkzeuge in didaktische Sequenzen — dokumentiert in Lehrplanentwurf, Unterrichtsnachschau und Schülerarbeitsergebnissen.

Prüfkatalog-Governance: Die Wissenschaftliche Bewertungskommission (Art. 91b Abs. 2 GG, administrativ angebunden an DIPF und IQB [31]) hat normative Alleinhoheit beim Katalog-Inhalt: Länderministerien, Schulverbände und EdTech-Anbieter haben Konsultationsrecht, kein Veto-Recht. Alle eingegangenen Konsultationsbeiträge und die Reaktionen der Kommission darauf werden veröffentlicht — Regulatory Capture wird durch Transparenz administrierbar gemacht, nicht durch Ausschluss der Stakeholder. Der Katalog unterliegt einer Revisionspflicht alle drei Jahre, ausgelöst durch die Kommission, geprüft durch den BRH auf Vereinbarkeit mit den Programmzielen. Kein Stakeholder kann eine Revision blockieren.

Die Goodhart-Logik des dualen Schlüssels: Teaching-to-the-Test (VERA-Drilling ohne didaktischen Umbau) besteht Schlüssel A, scheitert an Schlüssel B. Konzepttheater (formal dokumentierte Pläne ohne tatsächliche Praxisänderung) besteht Schlüssel B, scheitert an VERA. Die Peer-Group-Baseline schließt zusätzlich das Baseline-Gaming: Wer die eigene historische Performance zurückhält, verliert im Peer-Vergleich Boden.

Prüfarchitektur: Die Wissenschaftliche Bewertungskommission legt den Prüfkatalog für alle drei Meilensteine fest. Der Bundesrechnungshof zertifiziert WP-Gesellschaften zur Meilenstein-Prüfung und prüft die Einhaltung des Katalogs durch die zertifizierten WP — keine Normhoheit, aber volle Prüfhoheit. Die zertifizierten WP prüfen nach fixem Schema ohne Ermessen — kein Mandats-Anreiz, weil der Prüfkatalog nicht verhandelbar ist. Die Landesrechnungshöfe prüfen stichprobenartig die WP-Prüfungen nach. Vier Ebenen: Katalog-Hoheit bei der Bewertungskommission, Zertifizierung und Auditierung beim BRH, Fläche bei zertifizierten WP, Kontrolle beim Landesrechnungshof. Das entspricht der bewährten EU-Strukturfonds-Prüfarchitektur.

Die Begründung für das Tranchen-Modell ist amtlich. Der Bundesrechnungshof hat 2022 festgestellt, dass die Wirkungskontrolle des DigitalPakt 1.0 fehlt: Der Bund hat Hardware finanziert, weil Art. 104c GG ihm nur Investitionsförderung erlaubt — laufende Kosten wie Lehrerfortbildung, Curricula-Entwicklung und Software-Lizenzen bleiben Ländersache und wurden nicht synchron reformiert [15].

Conway’s Law im Klartext: Wer analoge Prozesse digitalisiert, hat hinterher digitalisierte analoge Prozesse. Die ICILS-Studie 2023 (veröffentlicht November 2024) dokumentiert das Muster für Deutschland mit harten Zahlen: Die regelmäßige Nutzung digitaler Medien durch Lehrkräfte stieg von 23 Prozent (2018) auf 70 Prozent (2023) — gleichzeitig sank der Kompetenz-Score der Achtklässler um 16 Punkte (auf 502). 40 Prozent der Jugendlichen erreichen nur noch die untersten beiden Kompetenzstufen [23]. Die wissenschaftliche Leiterin der Studie, Prof. Dr. Birgit Eickelmann, formuliert es präzise: „Der Weg von mehr technischer Ausstattung zu mehr digitalen Kompetenzen ist kein Automatismus." [23]

Das ist Korrelation, keine bewiesene Kausalkette — der globale Covid-Lernrückstand verbietet monokausale Schlüsse. Aber die strukturelle Logik hält: Ausstattung ohne Prozessreform verteilt Unterrichtszeit um, ohne dass die didaktische Tiefenstruktur mitwächst. Der Vergleichsfall stützt das Argument von der anderen Seite: Dänemark liegt bei ICILS 2023 in der internationalen Spitzengruppe — nicht durch mehr Hardware, sondern weil die Technologie-Einführung strukturell an Lehrplan-Reformen und die Lehrkräfteausbildung gekoppelt war [23]. Das ist exakt die Form, die das Tranchen-Modell erzwingt.

Gegenargument: „Bedingungsverknüpfung ist Eingriff in die Bildungshoheit." Antwort: Bundesmittel sind freiwillige Leistung des Bundes. Bedingungen für freiwillige Leistungen sind verfassungskonform. Die Länder können die Bedingungen ablehnen — sie verlieren dann das Geld. Vgl. EU-Strukturfonds-Logik.

Eingriff 4 — Ganztags-Realismus: Stufenmodell statt Rechtsanspruch ins Leere

Die strukturelle Konsequenz lautet: Der pauschale Rechtsanspruch ab 1.8.2026 wird durch ein Stufenmodell mit harten Triggern ersetzt. Das ist eine Änderung von § 24 Abs. 2 SGB VIII durch Bundesgesetz [3]. Das Ganztagsförderungsgesetz 2021 kennt keine Härtefall- oder Aufschubklausel; der Anspruch ist absolut, einklagbar, und führt bei Nichterfüllung direkt zu Amtshaftungs- und Schadensersatzansprüchen der Eltern (§ 839 BGB i.V.m. Art. 34 GG). Wer das Stufenmodell will, muss den Bundestag durch.

Das Timing-Problem: Eine Änderung von § 24 Abs. 2 SGB VIII ist ein Zustimmungsgesetz — der Bundesrat ist beteiligt. Selbst im Eilverfahren dauert das Gesetzgebungsverfahren erfahrungsgemäß mindestens drei Monate. Der Rechtsanspruch tritt am 1. August 2026 in Kraft. Das Stufenmodell ist realpolitisch ein Thema für die nächste Legislaturperiode, nicht für den Stichtag.

Übergangsarchitektur für 2026/27 — und ihre Grenzen: Bis das Stufenmodell gesetzlich steht, braucht es eine Schadensminimierungs-Architektur für die unvermeidliche Haftungswelle. Ein Länderfonds — gespeist aus Bundesgeldern nach Art. 104c GG — übernimmt die kommunale Haftungsfreistellung für Amtshaftungsansprüche aus der Nichterfüllung des Ganztagsanspruchs.

Diese Übergangsarchitektur löst das Kapazitätsproblem nicht. Sie ist keine strukturelle Lösung — sie ist Schadensminimierung unter dem Druck eines sich abzeichnenden Systemversagens. Das Moral-Hazard-Problem ist real: Kommunen, die wissen dass ihre Haftung gedeckt ist, haben weniger Anreiz, die Kapazitäten tatsächlich zu schaffen. Es gibt dafür keine elegante Antwort. Die Wahl liegt zwischen zwei schlechten Optionen: die schwächsten Kommunen unkontrolliert in die erste Haftungswelle laufen lassen — und damit die Familien treffen, die bereits in unterversorgten Bezirken leben — oder die Haftung strukturiert abfedern mit dem bekannten Moral-Hazard-Nachteil. Dieser Text wählt das zweite und benennt den Preis: Der Länderfonds ist eine Verwaltung der Nichtlieferung, kein Ende der Nichtlieferung.

Die ursprünglich vorgesehene Bedingung — Haftungsfreistellung nur für Kommunen mit positivem WP-Testat nach dem Prüfkatalog der Wissenschaftlichen Bewertungskommission für Schulraumaudits — kann für August 2026 institutionell nicht greifen. Der Prüfkatalog für Schulraumaudits existiert nicht. Die Zertifizierung von WP-Gesellschaften für Schulraumaudits existiert nicht. Beides kann in den verbleibenden Wochen nicht aufgebaut werden.

Der naheliegende Ersatz — Haftungsfreistellung nur für Kommunen, die ihre zugewiesenen Mittel nachweislich abgerufen haben — wäre ein Fehler, und zwar ein gefährlicher. Der Mittelabruf-Nachweis korreliert mit Verwaltungskapazität, nicht mit Bedarf. Eine Kommune mit funktionierendem Förderapparat ruft Mittel fließend ab; eine Bezirksverwaltung, die seit Jahren an der Untergrenze der Funktionsfähigkeit operiert, kann genau diesen Nachweis strukturell schlechter liefern — und in deren Schulbezirken sitzen die Kinder, für die Ganztag am dringendsten wäre. Ein output-gated Schutzkriterium schützt damit die Kommunen, die es am wenigsten brauchen, und exponiert die, deren fehlender Mittelabruf selbst das Symptom struktureller Handlungsunfähigkeit ist. Das ist inverse Selektion: die Kapazitätssortiermaschine, die dieser Essay an anderer Stelle diagnostiziert, in die Schutzarchitektur hineinkopiert.

Die Übergangsarchitektur dreht das Kriterium deshalb von output-gated auf bedarfs-gated. Fehlender Mittelabruf disqualifiziert nicht automatisch, sondern löst eine diagnostische Gabelung aus, gegründet auf einen objektiven, bereits vorhandenen Indikator — den Haushaltsnotlage-Status der Kommunalaufsicht in Verbindung mit dem Sozialindex-Band, beides ohne neuen Prüfkatalog administrierbar:

Handlungsfähig, aber untätig (kein Notlage-Status, niedriges Belastungsband): keine Haftungsfreistellung, sondern Zwangshilfe — die Planungshoheit Schulbau geht für den Zeitraum an Kreis oder Land über.
Strukturell handlungsunfähig (dokumentierte Haushaltsnotlage, hohes Belastungsband): Haftungsfreistellung plus administrative Amtshilfe — Kreis oder Land übernimmt Antragstellung und Mittelabruf stellvertretend. Der Schutz wird nicht am Verwaltungsoutput der Kommune gemessen, also nicht an genau dem, was versagt.

Das löst die inverse Selektion — aber es hat ein eigenes Residuum: Die Amtshilfe braucht Kapazität bei Kreis oder Land, und in den strukturschwächsten Regionen ist auch diese Ebene angespannt. Das Substitutionsprinzip verschiebt das Kapazitätsproblem nach oben, es löst es nicht auf. Wo Kreis und Land selbst überfordert sind, bleibt eine Lücke, die nur Bundes-Verwaltungskapazität — eine temporäre, regional eingesetzte Task-Force — schließen könnte. Das ist der teuerste, aber einzige verbleibende Hebel.

Das Stufenmodell selbst: Kommunen, die nachweislich weniger als 80 Prozent der Bedarfsplätze stellen können, erhalten einen zweijährigen Aufschub — gekoppelt an ein verbindliches Bauoffensiv-Programm mit Typengenehmigung für Schulbauten (vgl. Essay 2: Wohnen, Typengenehmigung). Der Aufschub greift nur unter doppeltem Schlüssel: Erstens Kapazitätsnachweis über die amtliche Schulbaustatistik (Raumbuch, Quadratmeter pro Kind) und die Lehrer-/Erzieher-Stellenmeldung. Zweitens Mittelabfluss-Nachweis: Die Kommune muss belegen, dass sie ihre zugewiesenen Bundes- und Landesmittel vollständig abgerufen und investiert hat — oder, wo sie dazu strukturell nicht in der Lage war, dass die Amtshilfe nach Kreis/Land gegriffen hat. Wer handlungsfähig ist und dennoch kein Geld abruft, erhält keinen Aufschub, sondern rutscht in ein Zwangshilfe-Verfahren — die Planungshoheit Schulbau geht für den Aufschubzeitraum an den Kreis oder das Land über.

Das Stufenmodell und die Implementierungsakteure: Das Stufenmodell hält Kommunen für den Kapazitätsnachweis verantwortlich — verfassungsrechtlich korrekt, weil Kommunen die Gewährleistungsträger des Ganztagsanspruchs sind. Die Kapazität liefern in der Praxis aber mehrheitlich freie Träger der Jugendhilfe: Caritas, AWO, Diakonie und DRK haben gemäß § 4 SGB VIII Vorrangprinzip bei der Erbringung von Jugendhilfeleistungen. Wenn ein freier Träger strukturell kein pädagogisches Fachpersonal findet, erfüllt die Kommune ihren Kapazitätsnachweis nicht — auch wenn sie alle Mittel abgerufen und die Ausschreibung vollständig durchgeführt hat. Die Sanktion trifft dann den falschen Akteur.

Deshalb unterscheidet das Stufenmodell drei statt zwei Szenarien bei ausbleibendem Kapazitätsnachweis:

Kommune finanziert und hat ausgeschrieben, freier Träger findet kein Personal (nachgewiesen durch öffentliche Ausschreibungsdokumentation plus dokumentierter Träger-Absagegrund): verlängerter Aufschub plus administrative Brücke — die Kommunalaufsicht auf Kreisebene moderiert einen strukturierten Dialog zwischen Träger, Kommune und Länder-Fachbehörde. Kein Zwangshilfe-Verfahren gegen die Kommune, die das Kapazitätsproblem nicht verursacht hat.
Handlungsfähig, aber untätig (kein Notlage-Status, Mittel nicht abgerufen, keine Ausschreibung): Zwangshilfe — Planungshoheit Schulbau geht an Kreis oder Land.
Strukturell handlungsunfähig (Haushaltsnotlage plus hohes Belastungsband): Haftungsfreistellung plus administrative Amtshilfe.

Der allgemeine Fachkräftemangel im Erziehungsbereich, der den Träger-Kapazitätsmangel antreibt, ist nur begrenzt innerhalb dieses Stufenmodells lösbar — er ist ein Arbeitsmarkt- und Migrationsthema, das dort adressiert wird (vgl. Essay 1: Migration). Was das Stufenmodell leisten kann: den Aufschub für das Träger-Kapazitätsmangel-Szenario verlängern, solange der dokumentierte Mangel fortbesteht (jährliche Überprüfung durch Kommunalaufsicht), statt eine Sanktion zu verhängen, die keine Kapazität schafft.

Der entscheidende Schutz liegt im Lokalitätsprinzip: Die 80-Prozent-Quote wird nicht gesamt-kommunal berechnet, sondern pro Schulbezirk oder maximal 15 Minuten Transportzeit für Grundschulkinder. Erreicht eine Kommune die Quote im Ortsteil nur durch Zwangs-Bustransfer in die Kernstadt, gilt die Quote für diesen Ortsteil als nicht erfüllt.

Das ist nicht abstrakt. Der Verfasser dieses Essays lebt in Eppingen-Rohrbach (Landkreis Heilbronn), einem Ortsteil dessen Grundschule um 12 Uhr endet und in dem eine kommunale Aufsicht bis 14 Uhr existiert. Wer Ganztag will, fährt mit dem Linienbus in die Kernstadt. Das gilt rechtlich als Anspruchserfüllung — und ist es de facto nicht. Ohne Lokalitätsprinzip beschleunigt das Stufenmodell diese Vermeidungs-Architektur, statt sie zu überwinden.

Das ist ein politisch unangenehmer Schritt: Der Staat gesteht ein, dass er ein Versprechen das er gegeben hat, nicht zum Stichtag halten kann. Aber ein einklagbarer Anspruch ins Leere zerstört das Vertrauen in die Vertragstreue des Staates mehr als ein transparent benannter Aufschub.

Gegenargument 1: „Politischer Wortbruch — der Anspruch ist gesetzlich kodifiziert." Antwort: Der Anspruch ist kodifiziert, die Infrastruktur ist nicht geliefert. Beide Tatsachen sind real. Wer die zweite ignoriert, bricht das Versprechen erst recht — nur unkontrolliert, mit juristischer Eskalation und kommunaler Überforderung.

Gegenargument 2: „Die Modifikation des Ganztagsförderungsgesetzes ist politischer Selbstmord." Antwort: Korrekt. Das Stufenmodell erfordert die Bereitschaft der Regierung, politisches Kapital auszugeben, um eine architektonische Lüge der Vorgängerregierung zu korrigieren. Das ist politisch teuer. Aber die Alternative — sehenden Auges in die massenhafte Amtshaftung und kommunale Überforderung zu laufen — ist am Ende teurer.

Eingriff 5 — Schulpsychologische Versorgung als bundesweiter Mindeststandard

Die strukturelle Konsequenz lautet: Zwei differenzierte Versorgungsquoten werden bundesweit als Mindeststandard gesetzt — und mit einer Finanzierungsarchitektur unterlegt, die das Verfassungsrecht nicht ignoriert, sondern nutzt. Erstens approbierte Schulpsychologen für Diagnostik, Krisenintervention und Therapieplanung — Mindestquote 1:3.000 (Second-Level-Support). Zweitens psychosoziale Erstanlaufstellen — Beratungslehrkräfte und Schulsozialarbeit — Mindestquote 1:1.500 (First-Level-Support). Die Erreichung beider Quoten ist in einer Legislaturperiode nicht möglich, in zwei realistisch.

Die Finanzierungsarchitektur folgt derselben Gravitationslogik wie Eingriff 1 und 2. Art. 104c GG erlaubt dem Bund Investitionsförderung — nicht die Finanzierung laufender Personalkosten. Das ist die Lehre, die dieser Essay selbst aus dem DigitalPakt 1.0 zieht: Der Bundesrechnungshof hat 2022 festgehalten, dass Hardware geht, Lehrerfortbildung und Software-Lizenzen aber Ländersache sind [15]. Schulpsychologen- und Schulsozialarbeiter-Stellen sind Beamte oder Tarifbeschäftigte der Länder und Kommunen — ihre Gehälter sind laufende Personalkosten, keine Investitionen in Bildungsinfrastruktur. Eine Finanzierungsarchitektur, die diesen Unterschied ignoriert, wiederholt exakt den verfassungsrechtlichen Graben, den dieser Essay als Todesursache des DigitalPakts benennt.

Deshalb: Der Bund gewährt eine degressive Anschubfinanzierung — Ersteinrichtung der Stellen, Ausstattung der schulpsychologischen Dienste, Erstqualifizierung des Personals, digitale Diagnostikinfrastruktur. Das ist Investition im Sinne des Art. 104c GG: einmalig, kapitalintensiv, nicht reproduzierend. Diese Anschubfinanzierung ist Förderbedingung: Die Länder verpflichten sich per Verwaltungsvereinbarung, die laufenden Personalkosten dauerhaft selbst zu tragen, sobald die Stellen durch die Bundesanschubfinanzierung etabliert sind. Das ist derselbe Mechanismus wie die degressive Bundesbeteiligung in Eingriff 1 und die Verwaltungsvereinbarung Lehrkräfte-Kapazität in Eingriff 2 — fiskalische Gravitation statt verfassungswidriges Mandat.

Der Preis dieses Konstrukts: Länder, die die laufenden Personalkosten langfristig nicht tragen, werden die Versorgungsquoten nicht halten. Der Bund kann anschubfinanzieren — er kann nicht dauerhaft für Personal bezahlen, das Länder einstellen und beschäftigen müssen. Die Lücke zwischen ambitioniertem Standard und dauerhafter Landeshaushalts-Realität ist real. Dieses Konstrukt macht sie transparent; es schließt sie nicht.

Die heutige Realität — vom Berufsverband Deutscher Psychologinnen und Psychologen (BDP) erhoben — ist ein Bundesdurchschnitt von 1:5.218 mit dramatischer Föderalismus-Spreizung: Bayern erreicht 1:3.162 als Bestwert, aber stark durch integrierte Beratungslehrkräfte gestützt; Sachsen-Anhalt 1:9.670 als Schlusslicht [20]. Die international empfohlene BDP-Richtquote für approbierte Schulpsychologie liegt bei 1:1.000. Kein einziges Bundesland erreicht sie [20].

Die Differenzierung in First- und Second-Level ist nicht akademisch: Sie ist die einzige Architektur, die die föderalen Definitionsspielräume schließt. Bayerns Mischmodell wird in der heutigen aggregierten Bundesquote als Erfolg ausgewiesen, obwohl es die zwei Versorgungsebenen vermischt. Mit getrennten Quoten erfüllt Bayern die First-Level-Mindestquote weitgehend und muss bei Second-Level (1:3.000 approbiert) gezielt aufstocken. Sachsen-Anhalt muss beide Ebenen erreichen, ohne dass eine „Beratungslehrkraft mit Zwei-Wochen-Zertifikat" die approbierte Lücke kosmetisch füllen kann.

Die Begründung ist nicht ergänzend, sondern zentral: Die UNICEF-Befunde zum mentalen Wohlbefinden (Platz 30/37) und zur Fähigkeit, Freunde zu schließen (Platz 41/42) [7] sind keine Begleiterscheinung des Bildungssystems — sie sind eine eigenständige strukturelle Lücke. Die Südkorea-Warnung des Reports — Platz 3 bei Bildungskompetenzen, Platz 34 beim mentalen Wohlbefinden, höchste Jugend-Suizidrate im Vergleich — zeigt, dass Leistung ohne Wohlbefinden kein Reformziel ist [21]. Das Deutsche Schulbarometer 2026 weist aus, dass sich rund 25 Prozent aller Schüler psychisch belastet fühlen [22].

Gegenargument 1: „Das ist Aufgabe der Länder." Antwort: Die Daseinsvorsorge-Argumentation trägt. Wenn 31 Prozent der 15-Jährigen es schwer finden, Freunde zu schließen, ist das nicht mehr Schulpsychologie — das ist gesellschaftliche Infrastruktur. Die Finanzierungsarchitektur respektiert dabei das Verfassungsrecht: Der Bund setzt den Standard und finanziert den Aufbau über die Anschubfinanzierung nach Art. 104c GG; die Länder tragen den dauerhaften Betrieb — dieselbe Gravitations-Logik, die für Eingriff 1 und 2 gilt.

Gegenargument 2: „Die Differenzierung erhöht die Bürokratie." Antwort: Die einheitliche Quote ist die Goodhart-Falle. Klamme Landesregierungen würden Lehrkräfte mit Kurzzertifikat zu „Beratungslehrkräften" deklarieren, um die Quote auf dem Papier zu erfüllen. Die Differenzierung in First- und Second-Level ist die einzige fälschungssichere Architektur.

Die Schnittstellen — woraus dieses Essay schöpft

Bildung ist nicht autonom. Die strukturellen Eingriffe greifen in andere Felder:

Bildung → Wohnen: Schulsegregation reproduziert Hauspreise. Reform Bildungssystem ohne Reform Wohnungsmarkt halbiert die Wirkung. (vgl. Essay 2)
Bildung → Digitale Verwaltung: DigitalPakt 2.0 wiederholt das OZG-Muster, wenn Prozessreform nicht vorgeschaltet wird. Der BRH-Befund zum DigitalPakt 1.0 ist die Bildungs-Variante des OZG-Befundes. (vgl. Essay 4)
Bildung → Migration: Integration durch Bildung ist nur möglich, wenn die Grundschule pädagogisch handlungsfähig ist. 35.000 fehlende Lehrkräfte machen Sprachförderung zur Fiktion. Fachkräftemangel bei freien Trägern der Jugendhilfe ist ein Arbeitsmarktthema das dort adressiert wird. (vgl. Essay 1)
Bildung → Rente: Die demografische Verschiebung trifft Bildung und Rente gleichzeitig: weniger Schüler, weniger Lehrer-Nachwuchs. (vgl. Essay 3)

Messkriterien

Maßnahme	Messkriterium	Zeithorizont	Umkehrbedingung (Circuit Breaker)
Skalierung Startchancen-Programm	Reduktion des kompensierbaren Schul-Funktionsanteils der Kompetenzlücke arm/reich (heute Gesamtlücke: 44 pp; adressierbarer Korridor: 12–16 pp) bei gleichzeitiger Stabilisierung oder Steigerung des absoluten Kompetenz-Scores der oberen 50 %; operationalisiert als VERA-Kompetenzlücke zwischen Sozialindex-Stufen 7–9 vs. 1–3 (teilnehmerland-gewichtet), Basisjahr kalibriert vor Rollout-Start per VERA-Berichtspflicht	Bis 2030: Gesamtlücke < 30 pp (teilnehmerland-gewichtet) als konditionales technisches Maximum (nur bei nahezu vollständiger Schließung des kompensierbaren Korridors) UND Gesamt-Score stabil oder besser	Wenn 2028 Mittel nicht den Sozialindex-Schulen zugeflossen (Coverage < 80 % berechtigter Schulen bei nachweislich unvollständigem Mittelabfluss) → sofortige Aktivierung Rückforderungsregel für das investierende Land; Pflichtausschreibung Wirksamkeitsaudit durch Bewertungskommission + BRH; Moratorium für neue Bundesmittel bis Audit-Abschluss. Wenn Mittel nachweislich vollständig abgeflossen und investiert, VERA-Kompetenzlücke (Sozialindex-Extrembänder, teilnehmerland-gewichtet, kalibriertes Basisjahr) aber nicht signifikant gesunken → kein Mittelentzug, sondern verpflichtende BRH-Feststellung (§ 99 BHO) mit öffentlichem Feststellungsprotokoll: Der kompensierbare Korridor ist erschöpft; das systemische Residuum (Gymnasium-Sortierung) ist erreicht. Das Protokoll wird dem Bundestag zugeleitet und veröffentlicht — politische Exposition des Befundes, kein Rechtszwang zur Systemreform. Auslösung der Strukturdebatte über den Sekundäreffekt (Gymnasium-Sortierung) auf politischer Ebene. Wenn VERA-Lücke sich schließt, aber VERA-Gesamt-Score sinkt → Bewertungskommission + BRH triggern Sonderprüfung; unabhängige BMBF-Wissenschaftskommission liefert Befund binnen 3 Monaten; Eskalation: Förderstopp für das investierende Land bis Audit-Abschluss
VERA-Berichtspflicht und Basisjahr-Kalibrierung	Jährliche Meldung pseudonymisierter schulscharfer VERA-Rohdaten nach Sozialindex-Band aller teilnehmenden Länder an IQB und Wissenschaftliche Bewertungskommission; Basisjahr-Kalibrierung der VERA-Kompetenzlücke (Sozialindex-Extrembänder) vor erstem Messzeitpunkt	Erstmeldung Schuljahr 2026/27 (Basisjahr); laufend jährlich	Wenn Land Daten nicht meldet → Moratorium nächste Mitteltranche bis Nachmeldung; BMBF veröffentlicht Compliance-Liste meldender Länder jährlich
Startchancen — Programmversagens-Schwelle (Governance)	Schwellenwert durch die Wissenschaftliche Bewertungskommission (Art. 91b Abs. 2 GG, bei DIPF/IQB) vorab festgelegt, veröffentlicht und gesperrt	Vor Rollout-Start — Bedingung für Auszahlung Tranche 1	Wenn kein veröffentlichter, gesperrter Schwellenwert vor Rollout-Start → Tranche 1 wird nicht ausgezahlt; Programm nicht startfähig. Wenn Schwellenwert nachträglich ohne den zweistufigen Revisionsmechanismus geändert — primär das öffentliche, gerichtlich überprüfbare Normänderungsverfahren (gesetzliche Norm/Rechtsverordnung, die den bestimmbaren Maßstab — EEF-ausgerichtete Mindest-Effektstärke — selbst festschreibt, Kommission beziffert nur technisch), sekundär BRH-Gegenzeichnung als zusätzliche Sicherung, soweit zulässig — → gerichtliche Überprüfbarkeit + BRH-Normenkontrolle; Schwellenwert gilt auf Vorwert gesperrt bis Revisionsmechanismus durchlaufen. Fällt die BRH-Gegenzeichnung weg, bleibt die Revision an den justiziablen Normsetzungsweg gebunden (Single Point aufgelöst)
Evidenz-Architektur — Plan B Operationalisierbarkeits-Bedingung	Power-Analyse durch Wissenschaftliche Bewertungskommission: bundesweit gepooltes PSM/IPTW detektiert extern verankerte Mindest-Effektstärke bei ≥ 80 % statistischer Power — diese Annahme ist vor Rollout durch die Kommission zu rechnen; das Power-Gate sichert sie ab	Vor Rollout-Start — Voraussetzung für Gültigkeit Plan B	Wenn Power-Analyse negativ → Plan B ungültig als Evaluierungsarchitektur; Programm ohne Plan-A-Clearance (positives Art.-3-GG-Gutachten) nicht startfähig
Startchancen — Evidenz-Architektur (Zwischensignal 12–18 Monate)	Drei Frühindikatoren aus Wartelisten-Kontrollarm: (a) Implementierungstreue (Anteil geförderter Schulen mit nachweisbarem Programm-Einsatz, nicht formal abgehakt), (b) früher Kompetenz-Delta geförderte vs. Kontroll-Schulen (VERA-Vorläufer-Diagnostik, explizit vorläufig — kein Versagensurteil), (c) Anwesenheits-/Retentions-Delta geförderte vs. Kontroll-Schulen	Erhebung bei 12–18 Monaten nach Rollout-Start (≈ 2029, vor politischem Entscheidungsfenster)	Wenn Implementierungstreue < 60 % (gemessen an Anteil geförderter Schulen mit nachweisbarem Programm-Einsatz) → verpflichtende Nachsteuerung durch Länder-Schulbehörde binnen 3 Monaten; Moratorium neue Mitteltranchen für Schulen ohne Nachweis bis Korrektur dokumentiert. Das Zwischensignal triggert kein Programmversagens-Urteil — das bleibt dem 36-Monats-Kontrollarm-Befund reserviert
Startchancen — Fortführungsregel über die Legislaturgrenze (Begründungslast-Umkehr)	Gesetzlich/vereinbarungsrechtlich vorab festgelegte Default-Continuation: Bei positivem Implementierungstreue-Frühsignal läuft das Programm automatisch in die zweite Förderperiode fort. Der Auslöser ist vorab veröffentlicht und gesperrt: Bedingung `a` (Implementierungstreue) als vorab-gesperrte Schwelle, Bedingung `b` als extern verankerte EEF-Frühsignal-Mindest-Effektstärke [30] statt Nulllinie — dieser Wert wird von der Wissenschaftlichen Bewertungskommission vor Programmstart festgelegt und veröffentlicht. Beide von der Bewertungskommission vor Rollout-Start veröffentlicht/gesperrt, gegen Umdefinition durch einen zweistufigen Enforcer geschützt: primär Verankerung in veröffentlichter gesetzlicher Norm/Rechtsverordnung, die den bestimmbaren Maßstab selbst festschreibt (an der EEF-Referenz [30] ausgerichtete Frühsignal-Mindest-Effektstärke, Kommission beziffert nur technisch — wesentliche Entscheidung beim Gesetzgeber, Art. 80 GG; Revision nur über das öffentliche, gerichtlich überprüfbare Normänderungsverfahren), sekundär BRH-Gegenzeichnung als zusätzliche Sicherung, soweit zulässig (Kommission setzt Norm, BRH prüft) — ob die BRH-Gegenzeichnungs-Rolle als sekundärer, nicht mehr lasttragender Enforcer verwaltungsrechtlich zulässig ist, und ob die Delegations-Zulässigkeit der gesetzlichen Schwellen-Normverankerung als primärer Enforcer trägt (Bestimmtheitsgebot, Wesentlichkeitstheorie, Art. 80 GG; durch die gesetzliche Verankerung des Maßstabs gemildert), sind offene Rechtsfragen, die vor Programmstart gutachterlich zu klären sind. Ein Abbruch erfordert einen aktiven, gegen das vorab gesperrte, extern verankerte Frühsignal begründeten Parlamentsbeschluss — auch die verwaltungs- und haushaltsrechtliche Zulässigkeit einer Default-Continuation-Klausel in einer Art-104c-Vereinbarung ist dabei vor Programmstart gutachterlich zu klären	Vor Rollout-Start in Kraft; Prüfung zum Entscheidungsfenster (≈ 2029)	Auslöser: Wissenschaftliche Bewertungskommission stellt zum Entscheidungsfenster fest, ob die vorab festgelegte Fortführungsregel mit ihren vorab veröffentlichten, gesperrten Schwellen `a` und `b` in Kraft ist. Träger: Gesetzgeber/BMBF; Bewertungskommission setzt Norm, BRH zeichnet Revisionen gegen. Eskalation: Fehlt die Fortführungsregel oder ihre vorab gesperrten Schwellen zum Entscheidungsfenster → das Programm ist nicht in die zweite Förderperiode startfähig; die erste Förderperiode wird von Beginn an als terminiert ausgewiesen, damit kein Akteur eine nicht bestehende Dauerverpflichtung unterstellt. Wird die Schwelle `a`/`b` nachträglich ohne das öffentliche, gerichtlich überprüfbare Normänderungsverfahren (primärer Enforcer; BRH-Gegenzeichnung als sekundäre Sicherung) geändert → gerichtliche Überprüfbarkeit + BRH-Normenkontrolle; Schwelle gilt auf Vorwert gesperrt bis Revisionsmechanismus durchlaufen. Fällt die BRH-Gegenzeichnung verwaltungsrechtlich weg, bleibt die Revision an den justiziablen Normsetzungsweg gebunden — der Single Point ist aufgelöst. Grenze (deklariert): Die Regel bindet die Folgelegislatur nicht — eine einfache Mehrheit kann sie kippen; sie verschiebt die Begründungslast vom Fortführer auf den Abbrecher, sie erzwingt die Fortführung nicht (R-001)
Startchancen — Evidenz-Architektur (gestaffelter Rollout)	Differenz im Kompetenz-Zuwachs zwischen geförderten Schulen und Wartelisten-Kontrollgruppe (gleiches Sozialindex-Band, randomisierte Aufnahmereihenfolge), gemessen gegen eine vorab extern verankerte Mindest-Effektstärke vergleichbarer Kompensationsprogramme [30]	Erste Auswertung 36 Monate nach Rollout-Start	Programmversagens-Schwelle: Wenn die Differenz nicht signifikant ist ODER unter der Mindest-Effektstärke liegt → das Programm gilt als gescheitert (nicht das Strukturresiduum, da die Kontrolle unter demselben Gymnasium sitzt); BRH + BMBF lösen Gesamtaudit der Programmarchitektur aus; Neukonzeption oder Einstellung binnen 12 Monaten. Wenn die randomisierte Aufnahmereihenfolge unterlaufen wird (Vorzug für antragsstarke Träger) → Rückforderungsregel und Wiederherstellung der Randomisierung
Skalierung Startchancen-Programm	Anteil Sozialindex-Stufe-7-bis-9-Schulen mit Bundesförderung (NRW-Skala)	Ab 2027 jährlich: ≥ 95 %	Wenn 2027 < 80 % Coverage ODER Land modifiziert den Sozialindex-Algorithmus ohne Zustimmung der Bewertungskommission → Rückforderungsregel greift sofort
Schulabbrecher-Quote (Re-Ziel 2008)	Quote der Schüler ohne Hauptschulabschluss (heute: ca. 7 %, Destatis 2023 — neuer Höchststand)	Bis 2032: ≤ 4 % (Dresden-Ziel, ursprünglich für 2015)	Wenn die Quote bis 2030 nicht unter 5,5 % zurückgefallen ist (Stand 2013/14 [14], Halbweg zum Dresden-Ziel von 4 %) → Bundes-Sonderprogramm Schulabbrecher mit Direktförderung über Länder
Lehramts-Kapazitätsoffensive	Lücke zwischen Stellenausschreibungen und Lehramtsabsolventen pro Jahr (heute: ca. 8.200)	Bis 2030: < 3.000	Wenn 2028 Lücke > 5.000 → Quereinsteiger-Sondergesetz mit pädagogischem Crash-Master
Lehramts-Kapazitätsoffensive	Anteil Lehrkräfte ohne Lehramtsprüfung (heute: 10,5 %)	Bis 2032: < 5 %	Wenn 2030 > 12 % → BMBF triggert Prüfauftrag binnen 30 Tagen; KMK beschließt Berufsbild-Revision binnen 6 Monaten; Eskalation: Mittelsperre aus der Verwaltungsvereinbarung Lehrkräfte-Kapazität für das Land ohne Beschluss bis Beschluss vorliegt
System-Integratoren-Modell	Anteil Quereinsteiger im aktiven Mentoring (Deputats-Umschichtung dokumentiert)	Ab 2028: ≥ 80 % aller aktiven Quereinsteiger in Einqualifizierungsphase	Wenn 2028 < 50 % → BMBF-Monitoring triggert; Kultusministerien beschließen Anpassung Mentoring-Anreizstruktur binnen 6 Monaten; Eskalation: Mehrallokations-Rückbehalt (Verwaltungsvereinbarung Lehrkräfte-Kapazität) bis Revision beschlossen
System-Integratoren-Modell (Zwischensignal Mentoring-Qualität)	Anteil Mentees mit bestandener erster berufsbegleitender Teil-/Modulprüfung ODER positivem externem Unterrichtspraxis-Audit nach dem Prüfkatalog der Bewertungskommission — mentee-/prüfungsseitig erhoben, nicht mentorseitig dokumentierbar	Bei ~24 Monaten (≈ 2030): ≥ 70 %	Wenn < 50 % → BMBF triggert Prüfung der Mentoring-Qualität binnen 30 Tagen; Kultusministerien beschließen Nachsteuerung der Mentoren-Auswahl und -Qualifikation binnen 6 Monaten; Eskalation: Aussetzung des kumulativen Laufbahn-Tokens für die betroffene Kohorte bis Nachsteuerung greift
System-Integratoren-Modell	Anteil Quereinsteiger die berufsbegleitendes Staatsexamen erfolgreich ablegen (Abschlussquote)	Bis 2032: ≥ 70 % aller Quereinsteiger aus dem ersten Aufnahmejahrgang	Wenn 2032 < 50 % → Strukturrevision Einqualifizierungspfad; Überprüfung ob Mentoring-Qualität oder Ausbildungstiefe das Bottleneck ist
DigitalPakt-Tranchierung (Tranche 1)	Anteil Länder mit amtlich beglaubigtem Lehrplan-Nachweis (Schulministerium, Amtsblatt) vor Auszahlung Tranche 1	Bis 2027: 100 %	Wenn 2027 < 75 % → Stopp Tranche 1 für säumige Länder; Reallokation der Mittel an Länder mit Nachweis
DigitalPakt-Tranchierung (Tranche 2)	Anteil geförderter Schulen mit belegten KMK-äquivalenten Lehrerfortbildungsabschlüssen	Bis 2028: ≥ 80 %	Wenn 2028 < 60 % → BRH + BMBF triggern gemeinsam; KMK beschließt Anpassung der Förderkriterien binnen 4 Monaten; Eskalation: Tranche-2-Stopp für säumige Länder bis Beschluss und Umsetzungsplan vorliegen
DigitalPakt-Tranchierung (Tranche 3)	Dualer Schlüssel: (A) Signifikante positive Abweichung VERA-Ergebnis vom Peer-Group-Durchschnitt strukturell vergleichbarer Schulen (gleiches Sozialindex-Band, NRW-Modell) UND (B) positives Unterrichtspraxis-Audit nach dem Prüfkatalog der Bewertungskommission — beide Schlüssel müssen gleichzeitig positiv sein	Frühestens 2029 (24 Monate nach Tranche 1): nachweisbarer Trend	Wenn 2029 kein positiver dualer Schlüssel (A und B gemeinsam) → Streichung Tranche 3 für die jeweilige Schule; Gesamtaudit der Programmarchitektur
Ganztags-Realismus	Anteil Schulbezirke mit erfülltem Rechtsanspruch (Lokalitätsprinzip, 15-Min-Transportgrenze; heute: ca. 75 % auf Kommunalbasis, schulbezirksgenau niedriger) — nach Sozialindex-Band disaggregiert ausgewiesen	Bis 2030: ≥ 95 % in jedem Belastungsband, nicht nur im Aggregat	Wenn 2028 < 85 % im Aggregat ODER < 75 % in einem der oberen Belastungsbänder → Bundesbauprogramm Schulinfrastruktur mit Typengenehmigung, priorisiert nach Belastungsband. Übergangs-Haftungsschutz ist bedarfs-gated (Haushaltsnotlage-Status + Sozialindex-Band), nicht output-gated (Mittelabruf); strukturell handlungsunfähige Kommunen erhalten Freistellung plus Amtshilfe durch Kreis/Land. Träger-Gabelung: Wo Quota-Verfehlung auf dokumentierten Träger-Kapazitätsmangel zurückführbar ist (öffentliche Ausschreibung + Träger-Absagegrund nachgewiesen) → verlängerter Aufschub plus administrative Brücke (Kreis moderiert Träger-Land-Dialog) statt Zwangshilfe gegen die Kommune
Schulpsychologische Versorgung (Second-Level)	Versorgungsquote approbierte Schulpsychologen (heute: ca. 1:5.218 Bundesschnitt, aggregiert)	Bis 2030: 1:3.000	Wenn 2028 > 1:4.000 → Aktivierung beschleunigter Anschub-Tranche; BMBF veröffentlicht Länder-Compliance-Report: welche Länder haben die Förderbedingung (dokumentierte Eigenverpflichtung laufende Personalkosten) erfüllt? Länder ohne dokumentierte Eigenverpflichtung erhalten keine weiteren Anschub-Tranchen
Schulpsychologische Versorgung (First-Level)	Versorgungsquote Beratungslehrkräfte + Schulsozialarbeit	Bis 2030: 1:1.500	Wenn 2028 > 1:2.500 → Aktivierung beschleunigter Anschub-Tranche; BMBF Compliance-Report Förderbedingung; Länder ohne dokumentierte Eigenverpflichtung laufende Kosten erhalten keine weiteren Anschub-Tranchen
Bildungsausgaben-Allokation (Re-Ziel 2008)	Öffentliche Bildungsausgaben pro Grundschüler im Verhältnis zum OECD-Durchschnitt (heute: am OECD-Durchschnitt, Spreizung zu Tertiär überdurchschnittlich)	Bis 2030: Spreizung Primar/Tertiär auf OECD-Durchschnitt reduziert	Wenn 2028 Spreizung unverändert → Bildungsfinanzgipfel als politisches Signal (KMK + Bundesregierung); BRH-Feststellungsprotokoll (§ 99 BHO) über die Spreizungs-Persistenz; konditionierte Mittelumschichtungs-Bedingung für Folgejahre aus der Verwaltungsvereinbarung Startchancen. Wenn Allokation zulasten beruflicher Bildung (Dual) umgeschichtet wird statt aus allgemeinem Haushalt → Interventionspflicht
Gesamtindikator (UNICEF)	Anteil 15-Jähriger mit Mindestkompetenzen Lesen/Mathe in Teilnehmerländern (heute: 60 % Deutschland-weit) (teilnehmerland-gewichtet)	Bis 2030: ≥ 75 % (teilnehmerland-gewichtet)	Erwartungspfad: 60 % (2025) → 75 % (2030), Halbzeitwert 2028 ≈ 67–68 %. Auslöser bei Stagnation, nicht erst bei Verschlechterung: Wenn 2028 < 67 % (Erwartungspfad verfehlt) → BRH und BMBF lösen verpflichtendes Architektur-Audit der Förderstruktur aus; Stufe 1: politischer Bund-Länder-Bildungsgipfel (KMK + Bundesregierung) binnen 6 Monaten — öffentliche Feststellung des Befundes, BRH-Feststellungsprotokoll (§ 99 BHO) mit Zuleitung an Bundestag; Stufe 2: wenn 6 Monate nach Gipfel kein strukturelles Ergebnis vorliegt: Mittelsperre für neue Programm-Tranchen + BRH-Veröffentlichungspflicht. Die Mittel fließen während des Architektur-Audits und bis zur Stufe-2-Auslösung ungekürzt an die Schulen weiter. Gestoppt und umgebaut wird die unwirksame Förderarchitektur, nicht die Förderung der Schüler — kein Einfrieren von Schulmitteln als Reaktion auf Untererfüllung. Kopplung Gesamtindikator/Spreizung: Wenn 2030 Gesamt ≥ 75 % aber Kompetenzlücke arm/reich ≥ 40 pp → kein Systemerfolg; verpflichtende BRH-Feststellung (§ 99 BHO) mit öffentlichem Feststellungsprotokoll: 75 %-Ziel wurde durch Mittelschicht-Lift erreicht, nicht durch Schließung der Unterseite; Auslösung der Strukturdebatte über den Sekundäreffekt (Gymnasium-Sortierung) auf politischer Ebene — dasselbe Signal wie beim Startchancen-Stagnationsfall. Symmetrische, vorab-gesperrte Aggregat-Schwelle (M-A → M-A0 → M-B): Verfehlt das teilnehmerland-gewichtete Aggregat-Ziel 2030 seinen Erwartungspfad, entscheidet nicht die Auslegung des Betreibers über „Versagen" vs. „Residuum", sondern ein dreistufiger vorab gesperrter Test. M-A (Innenwirkung): Haben die geförderten Schulen aggregiert ihre Wartelisten-Kontrolle um die extern verankerte EEF-Mindest-Effektstärke [30] geschlagen? Nein → Programmversagen (kein Residuum); die Ausreden „Gymnasium-Residuum / Bayern-BW-Opt-out / unterer Korridorrand" sind an diesem gesperrten Test versperrt; BRH + BMBF lösen das Gesamtaudit der Förderstruktur aus. M-A0 (Reichweite-Gate, M-B vorgeschaltet): Nur wenn M-A bestanden — hat die Förderung mengenmäßig genug der berechtigten Sozialindex-Schüler erreicht, dass Innenwirkung × Reichweite das Aggregat-Ziel rechnerisch tragen könnte? Mindest-Reichweite-Anteil vorab gesperrt, an IQB-Bildungstrend-Verteilung [29] verankert. M-A bestanden, M-A0 nicht → Skalierungsversagen — eine eigene, von Programmversagen und systemischem Residuum getrennte Kategorie; Opt-out-/Gymnasium-/Bayern-BW-Ausreden gesperrt; BRH + BMBF lösen das Audit aus (Frage: warum zu wenige Berechtigte erreicht). Begrifflich getrennt vom Mittelfluss-Coverage-Kriterium (Mittelabfluss < 80 % → Rückforderung): M-A0 misst erreichte Schüler-/Schulmenge, nicht Mittelabfluss. M-B (systemisches Residuum): Nur wenn M-A und M-A0 bestanden, das Aggregat aber dennoch unter Pfad → „systemisches Residuum / Opt-out" zulässig, und zwar nur bis zur vorab quantifizierten, an IQB-Bildungstrend-Länderdaten [29] verankerten Opt-out-Decke (Anteil des kompensierbaren Gefälles außerhalb Bayern/BW). Erwartungspfad, EEF-Mindest-Effektstärke, M-A0-Reichweite-Anteil und Opt-out-Decke werden von der Bewertungskommission vor Rollout-Start veröffentlicht und gesperrt festgelegt; Revisionsschutz zweistufig — primär Verankerung in veröffentlichter gesetzlicher Norm/Rechtsverordnung, die den bestimmbaren Maßstab selbst festschreibt (an der EEF-Referenz [30] ausgerichtete Mindest-Effektstärke, Kommission beziffert nur technisch — wesentliche Entscheidung beim Gesetzgeber, Art. 80 GG; Revision nur über das öffentliche, gerichtlich überprüfbare Normänderungsverfahren), sekundär BRH-Gegenzeichnung als zusätzliche Sicherung, soweit zulässig; fällt die BRH-Rolle weg, bleibt die Revision an den justiziablen Normsetzungsweg gebunden (Single Point aufgelöst) — ob die Delegations-Zulässigkeit der gesetzlichen Schwellen-Normverankerung trägt (Bestimmtheitsgebot, Wesentlichkeitstheorie, Art. 80 GG; durch die gesetzliche Verankerung des Maßstabs gemildert, weil der wesentliche Maßstab im Gesetz steht), ist eine offene Rechtsfrage, die vor Programmstart gutachterlich zu klären ist
Gesamtindikator (UNICEF)	Anteil 15-Jähriger mit hoher Lebenszufriedenheit (heute: 68 %)	Bis 2030: ≥ 78 %	Wenn 2028 keine Verbesserung → Lehrplan- und Belastungs-Audit
UNICEF-Monitoring-Signal (National)	UNICEF-Ranking-Position Deutschland: Bildungskompetenzen (heute: Platz 34/41) und Wohlbefinden (heute: Platz 30/37) — kein Programm-Ziel (Bayern/BW im UNICEF-Ranking eingeschlossen; voraussichtlich außerhalb des Programms). Monitoring-Funktion: reflektiert die Gesamtsituation Deutschlands, nicht die Programmwirkung der Teilnehmerländer	Erhebung 2030 (nächste UNICEF Report Card)	Wenn 2030 teilnehmerland-gewichtetes Programm-Messziel erreicht (< 30 pp Spreizung / ≥ 75 % Mindestkompetenzen), UNICEF-Ranking Deutschland aber unverändert oder schlechter: kein Programmversagen — deklarierter Preis der Opt-out-Struktur (Bayern/BW). BRH dokumentiert die Lücke zwischen Programmerfolg und nationalem UNICEF-Signal öffentlich — Transparenz-Pflicht, kein Handlungsauftrag. Die Lesart „deklarierter Opt-out-Preis" gilt nur, wenn die vorab-gesperrten M-A- und M-A0-Tests bestanden sind (M-A: geförderte Schulen schlagen aggregiert ihre Wartelisten-Kontrolle um die EEF-Mindest-Effektstärke [30]; M-A0/Reichweite-Gate: die Förderung hat den vorab gesperrten Mindest-Reichweite-Anteil der berechtigten Schüler erreicht, IQB-Bildungstrend-verankert [29]) und nur bis zur vorab quantifizierten Opt-out-Decke (IQB-Bildungstrend-verankert [29]). Ist M-A nicht bestanden, ist ein schlechtes nationales Signal kein Opt-out-Residuum, sondern Programmversagen; ist M-A bestanden, M-A0 aber nicht, ist es Skalierungsversagen — in beiden Fällen ist die Opt-out-Erklärung gesperrt. Wenn 2030 UNICEF-Ranking verschlechtert sich und teilnehmerland-gewichtetes Ziel verfehlt → kombiniertes Systemversagen; beide Signale lösen gemeinsam das verpflichtende Gesamtaudit der Förderstruktur aus

Das Gesamtziel: Deutschland kehrt im UNICEF-Ranking aus der unteren Hälfte zurück in die obere Hälfte — bei Bildungskompetenzen aus Platz 34 in die Top 20, beim mentalen Wohlbefinden aus Platz 30 in die Top 20. Das klingt nach wenig. Es ist eine strukturelle Korrektur, die zwei Legislaturperioden dauern wird.

Die Wiederaufnahme der 2008er Zielwerte (Schulabbrecher 4 %, Allokation der Bildungsausgaben zur Primarstufe auf OECD-Standard) ist nicht Nostalgie: Wenn ein Versprechen 2008 als das Richtige beschlossen wurde und 2026 immer noch das Richtige ist, muss man es entweder erfüllen oder es zurücknehmen. Das Vermessene-Nicht-Erfüllen ist die schlechteste der drei Optionen.

Der Stammtisch-Satz

“40 von 100 Fünfzehnjährigen können kein einfaches Rechnen — weil der Bund zwar das Geld hat, aber keine Macht, und die Länder zwar die Macht haben, aber kein Geld.”

(Vorgänger-Kandidaten: v1.6 “Wir leisten uns 16 Bildungsministerien — und ein Land, in dem nur 60 von 100 Fünfzehnjährigen rechnen können.” — verworfen, weil „16 Bildungsministerien" die föderale Anzahl als Ursache rahmt und Zentralisierungsthese transportiert. v1.12: “Wenn die einen das Geld haben und die anderen die Macht, wird am Ende nur über Zuständigkeiten gestritten statt unterrichtet. Das Ergebnis: 40 von 100 Fünfzehnjährigen scheitern schon am einfachen Rechnen.” — verworfen, weil zwei Sätze (Methodenanforderung: ein Satz) und abstrakte Pronomen ohne konkretes Bild am Einstieg. Der aktuelle Satz trägt die Kausalstruktur als Antithese: Bild zuerst, Mechanismus dahinter, Zentralisierungs-Trigger vermieden.)

Quellenverzeichnis

[1] Bundesregierung / Bundeskanzlerin Angela Merkel: Rede zum Dresdner Bildungsgipfel, 22. Oktober 2008. Dokumentiert in: Bundeszentrale für politische Bildung; aktuelle-sozialpolitik.de: „Das Versprechen eines Aufstiegs durch Bildung in der Bildungsrepublik Deutschland" (2018); Deutscher Bundestag, Plenarprotokoll 16/168 — https://dserver.bundestag.de/btp/16/16168.pdf (Primärbeleg; BPB und aktuelle-sozialpolitik.de optional als Sekundärbelege).

[2] Gemeinsame Wissenschaftskonferenz (GWK Bonn): Qualifizierungsinitiative für Deutschland — Umsetzungsbericht 2013. Definiert die fünf amtlichen Zielwerte des Dresdner Bildungsgipfels 2008. — https://www.gwk-bonn.de/fileadmin/Redaktion/Dokumente/Papers/Qualifizierungsinitiative-Umsetzungsbericht-2013.pdf

[3] BMBFSFJ: Rechtsanspruch Ganztagsbetreuung Grundschule ab Schuljahr 2026/27 (zunächst Klasse 1, jährliche Erweiterung). Ganztagsförderungsgesetz 2021, BGBl. I 2021 Nr. 47. — https://www.bmbfsfj.bund.de/bmbfsfj/themen/bildung/schule/ganztagsschulen-und-ganztagsbetreuung — Primärbeleg: § 24 SGB VIII — https://www.gesetze-im-internet.de/sgb_8/__24.html (Rechtsanspruch Ganztagsförderung).

[4] BMBF: DigitalPakt Schule 2.0 (2026–2030) — 5 Mrd. € Gesamtvolumen (je 2,5 Mrd. Bund/Länder); 29.400 Schulen erreicht durch DigitalPakt 1.0. — https://www.bmbfsfj.bund.de/bmbfsfj/themen/bildung/schule/digitalpakt-schule-275098

[5] UNICEF Innocenti Research Centre: Report Card 20 (Mai 2026) — Gesamtranking Kinderwohl: Deutschland Platz 25/37. — https://www.unicef.org/innocenti/reports/report-card-20 — PDF: https://www.unicef.org/innocenti/media/8521/file/UNICEF-Innocenti-Report-Card-20-2026.pdf — Deutsche PM: https://www.unicef.de/informieren/aktuelles/presse/-/unicef-studie-kindeswohl-2026/397376

[6] UNICEF Innocenti Research Centre: Report Card 20 (Mai 2026) — Bildungskompetenzen: Deutschland Platz 34/41; 60 % Mindestkompetenz; 44 Prozentpunkte Einkommensspreizung; Schulsegregationsindex 0,25. — [vgl. [5]]

[7] UNICEF Innocenti Research Centre: Report Card 20 (Mai 2026) — Mentales Wohlbefinden: Platz 30/37; Freundschaften: Platz 41/42 (69 %). — [vgl. [5]]

[8] KMK: Lehrkräftemangel 2025/26 — rund 35.000 fehlende Lehrkräfte. — https://www.kmk.org/dokumentation-statistik/statistik/schulstatistik/lehrkraefteeinstellungsbedarf-und-angebot.html

[9] KMK (Februar 2026): 22.500 Neuabsolventen vs. 30.700 Stellen-Bedarf 2026; NRW 8.800 unbesetzte Stellen Dezember 2025; 10,5 % aller Lehrkräfte ohne Lehramtsprüfung. — [vgl. [8]] — Dok. 2/2024: https://www.kmk.org/fileadmin/Dateien/pdf/Statistik/Dokumentationen/Dok_2_Bericht_LEB_LEA_2024.pdf

[10] Statistisches Bundesamt (Destatis): Lehrkräfte 2025/26 — Teilzeitquote 42,3 % (höchster Stand seit 10 Jahren); Lehramtsabsolventen 2014–2024: 33.300 → 30.600 (–8 %). — Pressemitteilung Nr. 445/2025: https://www.destatis.de/DE/Presse/Pressemitteilungen/2025/12/PD25_445_21711.html — Zur Pipeline-Diagnose (Studienanfänger vs. Absolventen 2023) vgl. [27].

[11] VBE-Umfrage (Forsa, September–Oktober 2025, veröffentlicht Januar 2026): Ganztagsanspruch — bundesweit 65.000 fehlende Plätze; 25 % der Schulleitungen können Anspruch nicht erfüllen; Haupthindernisse: Räume (74 %), Fachpersonal (67 %). — ZDF: https://www.zdfheute.de/politik/deutschland/grundschulen-ganztagsbetreuung-rechtsanspruch-umfrage-vbe-100.html — VBE BW: https://www.vbe-bw.de/meldung/vbe-umfrage-zur-ganztagsbetreuung-rechtsanspruch-ist-kein-freifahrtschein-fuer-fehlende-qualitaet/ VBE Bundesverband Pressemitteilungen: https://www.vbe.de/presse

[12] DigitalPakt 2.0 — Timeline und Beschluss: Eckpunkte in gemeinsamer Grundsatzerklärung BMBF/KMK vom 13. Dezember 2024 — https://www.bmftr.bund.de/SharedDocs/Kurzmeldungen/DE/2024/12/Digitalpakt.html ; finale politische Einigung der Bildungsministerkonferenz vom 18. Dezember 2025 (Berlin), Förderbeginn 1. Januar 2026, Laufzeit bis Ende 2030 (Projekte teils bis 2032) — https://www.schulministerium.nrw/presse/pressemitteilungen/digitalpakt-20-kommt-18-12-2025 . Die Aussage „keine Bedingungsverknüpfung mit Lehrplan- oder Prozessreform" ist analytische Lesart der Erklärungen, keine wörtlich zitierte Negativaussage.

[13] Definitionsgrundlage: Bildungsbericht 2010 / GWK — Das 7%-Ziel des Dresdner Bildungsgipfels 2008 war auf den OECD-Standard kalibriert, also auf Bildungsgesamtausgaben (öffentliche Haushalte plus private Investitionen der Wirtschaft und Haushalte). Ist-Werte 2024: Statistisches Bundesamt (Destatis), Pressemitteilung Nr. 445/2025 — https://www.destatis.de/DE/Presse/Pressemitteilungen/2025/12/PD25_445_21711.html — öffentliche Bildungsausgaben rund 198 Mrd. Euro (4,6 % des BIP); Bildungsausgaben gesamt ca. 6,4–6,5 % des BIP. Allokations-Schieflage: OECD Education at a Glance 2024 (EAG 2024), Kapitel C1 — OECD-Schnitt 11.900 USD pro Primarschüler / 20.500 USD pro Tertiär-Student; Deutschland Tertiär im obersten OECD-Quintil, Primar am OECD-Durchschnitt — https://www.oecd.org/en/publications/education-at-a-glance-2024_c00cad36-en.html

[14] Schulabbrecher-Quote (Schüler ohne Hauptschulabschluss) — Trendlinie mit drei Stützpunkten: 5,5 % (2013/14) — pedocs/Maaz, Abgänger ohne Abschluss — https://www.pedocs.de/volltexte/2018/15516/pdf/Abgaenger_ohne_Abschluss_04_Maaz_A.pdf ; 6,2 % (2021, ~47.500) — Statistisches Bundesamt (Destatis), Zahl der Woche PD23_27 — https://www.destatis.de/DE/Presse/Pressemitteilungen/Zahl-der-Woche/2023/PD23_27_p002.html (dieser Beleg ist der 2021-Wert, nicht 7 %); rund 7,0 % (Schuljahr 2023/24, ~62.000), 2024/25 > 64.000 — neuer Höchststand — correctiv, 20. Mai 2026 (Ebene-3/SEKUNDÄR) — https://correctiv.org/aktuelles/bildung/2026/05/20/neuer-hoechststand-bei-schulabgaengern-ohne-abschluss/ (exakte Destatis-Primärfundstelle Schulabgänger ohne Hauptschulabschluss 2023/24 wird im Quellenaudit nachgetragen). Förderschul-Vorbehalt: etwa die Hälfte der Betroffenen sind Förderschüler, die ihren Bildungsgang planmäßig ohne Hauptschulabschluss beenden; der Anteil ist über die Zeit etwa konstant, der Anstieg trägt das Delta. — Ungelernten-Quote: 18,8 % (20- bis 34-Jährige ohne Berufsabschluss, ~2,76 Mio.) — Berufsbildungsbericht 2026, BMBFSFJ (Primärquelle; exakte Fundstelle im Berufsbildungsbericht 2026 für die 18,8 % wird im Quellenaudit nachgetragen). Apples-to-apples: 18,1 % für 20–29 J. (Statista 2021, Ebene-3); BIBB-Datenreport 20–25 J.: 14,4 %, 25–30 J.: 9,2 %. In jeder dieser Abgrenzungen liegt die Quote über dem 2008er-Ausgangswert — die Richtung des Deltas (Anstieg statt Halbierung) ist abgrenzungsrobust.

[15] Bundesrechnungshof: Steuerung und Wirkungskontrolle des DigitalPakts Schule (Prüfbericht nach § 88 Abs. 2 BHO, 2022). Wörtlich: „ungeklärt und nicht belegt […], ob sich durch die Bundesbeteiligung die erhofften Erfolge beim digitalen Lernen einstellen". — PDF: https://www.bundesrechnungshof.de/SharedDocs/Downloads/DE/Berichte/2022/steuerung-wirkungskontrolle-digitalpaktschule.pdf — Volltext: https://www.bundesrechnungshof.de/SharedDocs/Downloads/DE/Berichte/2022/massnahmen-digitalpakt-schule-volltext.pdf

[16] InterVal GmbH / Prof. Dr. Birgit Eickelmann (im Auftrag des BMBF): Evaluation des DigitalPakt Schule 2019–2024 — Zwischenbericht (Dezember 2024). Befunde: tPEK formal abgehakt; Endgeräte teilweise monatelang unausgepackt mangels Support. — Projektseite: https://interval-berlin.de/projekte/evaluation-des-digitalpakt-schule-2019-2024/ — Zwischenbericht PDF: https://www.digitalpaktschule.de/img/Evaluation%20DigitalPakt%20Schule_Zwischenbericht.pdf

[17] Art. 104c GG (Stand: Novelle 2019) — Bund kann Finanzhilfen für gesamtstaatlich bedeutsame Investitionen zur Steigerung der Leistungsfähigkeit der kommunalen Bildungsinfrastruktur gewähren — den Ländern. Eine Direktauszahlung an Kommunen unter Umgehung der Länder verletzt das Mischverwaltungsverbot des Art. 104a Abs. 1 GG. — WD 8 - 3000 - 054/20 (Wissenschaftliche Dienste des Bundestages, 14.09.2020) — https://www.bundestag.de/resource/blob/803690/6cf3759738e56865f9b397609e2e6120/WD-8-054-20-pdf-data.pdf

[18] Ruhr-Universität Bochum / Sozialwissenschaftliche Datenanalyse: Sozialindex für Schulen (NRW-Modell) — schulscharfe Approximation über Wohnbezirke der Schüler, gewichtet mit Arbeitslosigkeitsdaten der Bundesagentur für Arbeit. 9 Belastungsstufen. — ZEFIR-Band 14 (Schräpler/QUA-LiS, RUB) — https://www.zefir.ruhr-uni-bochum.de/zefir/mam/images/band_14_konstruktion_des_sozialindex_f%C3%BCr_schulen_in_nordrhein-westfalen.pdf ; Landtag NRW MMV17-3933 — https://www.landtag.nrw.de/portal/WWW/dokumentenarchiv/Dokument/MMV17-3933.pdf

[19] BMBFSFJ: Verwaltungsvereinbarung Startchancen-Programm (2024). Bund-Länder-Programm; Gesamtvolumen 20 Mrd. Euro / 10 Jahre / ca. 4.000 Schulen; Schuljahr 2024/25 Start; Mittelfluss Bund → Länder → Schulträger; Zweckbindung dokumentiert. — https://www.bmbfsfj.bund.de/bmbfsfj/themen/bildung/schule/startchancen-programm-274440

[20] Berufsverband Deutscher Psychologinnen und Psychologen (BDP): Versorgungszahlen Schulpsychologie 2024 — Bundesdurchschnitt 1:5.218; Bayern 1:3.162 (Bestwert); Sachsen-Anhalt 1:9.670 (Schlusslicht); BDP-Richtquote international: 1:1.000. — BDP-Sektion Schulpsychologie, Versorgungszahlen 2024 — https://www.bdp-verband.de/fileadmin/user_upload/BDP/verband/Untergliederungen/Sektionen/Schulpsychologie/PDF/2024_versorgungszahlen.pdf (Werte 1:5.218 / 1:3.162 / 1:9.670 als 2024-Stand bestätigt).

[21] UNICEF Innocenti Research Centre: Report Card 20 (Mai 2026) — Südkorea: Platz 3 Bildungskompetenzen, Platz 34/37 mentales Wohlbefinden; Jugend-Suizidrate 11,1/100.000 (höchste im Vergleich). — [vgl. [5]]

[22] Robert Bosch Stiftung: Deutsches Schulbarometer (März 2026) — rund 25 % der Schülerinnen und Schüler fühlen sich psychisch belastet. — https://www.bosch-stiftung.de/en/press/2026/03/german-school-barometer-mental-health-strain-among-children-and-adolescents-rising — Schulportal: https://deutsches-schulportal.de/bildungswesen/deutsches-schulbarometer-schuelerbefragung-2026-die-wichtigsten-ergebnisse/

[23] ICILS 2023 (International Computer and Information Literacy Study, veröffentlicht November 2024; wissenschaftliche Leitung Deutschland: Prof. Dr. Birgit Eickelmann, Universität Paderborn). Kerndaten Deutschland: Lehrkräfte-Nutzung digitaler Medien 2018 → 2023: 23 % auf 70 %; Kompetenz-Score Achtklässler –16 Punkte (502); 40 % unterste beiden Kompetenzstufen. Eickelmann-Zitat: „Der Weg von mehr technischer Ausstattung zu mehr digitalen Kompetenzen ist kein Automatismus." Internationale Spitzengruppe: Republik Korea, Tschechien, Dänemark, Chinese Taipei. — BMFTR PM 12.11.2024: https://www.bmftr.bund.de/SharedDocs/Pressemitteilungen/DE/2024/11/111124-ICILS.html — Uni Paderborn: https://kw.uni-paderborn.de/institut-fuer-erziehungswissenschaft/arbeitsbereiche/schulpaedagogik/forschungsprojekte/icils-2023

[24] KMK: Reform der Kultusministerkonferenz 2024 — Einführung der Zwei-Drittel-Mehrheit für Stellungnahmen, Empfehlungen und Berichte; Einstimmigkeit weiterhin für bildungspolitische Kernbeschlüsse. — https://kmk.org/aktuelles/artikelansicht/reform-der-kultusministerkonferenz.html — Ergänzend: Schulportal: https://deutsches-schulportal.de/bildungswesen/kmk-reform-eine-neue-struktur-aber-noch-kein-durchbruch/

[25] Gemeinsame Wissenschaftskonferenz (GWK): Hochschulpakt 2020 — Umsetzungsbericht 2013. Enthält Bayerns Beteiligung und Mittelerhalt. Hinweis zur Analogie-Grenze: Der Hochschulpakt vergütete Studienplatzausbau, den die Länder im eigenen Interesse ohnehin betrieben — die Übertragbarkeit auf bedingungsverknüpfte Homogenisierungsprogramme (Sozialindex) ist deshalb nur eingeschränkt gegeben. — https://www.gwk-bonn.de/fileadmin/Redaktion/Dokumente/Papers/GWK-Heft-43-Hochschulpakt-Umsetzung-2013.pdf

[26] GEW — Gewerkschaft Erziehung und Wissenschaft: Mitgliederzahl (Stand 31.12.2025): 274.532. — Über uns: https://www.gew.de/ueber-uns — Ergänzend: news4teachers.de: https://www.news4teachers.de/2026/01/mitgliederzahl-gewerkschaft-erziehung-und-wissenschaft-waechst-ein-bisschen/

[27] Statistisches Bundesamt (Destatis): Pressemitteilung Nr. N041/2024 (20. August 2024) — Studienanfänger Lehramt 2023: 46.400 (Zehnjahresvergleich: −2,1 %); Absolventen Lehramt 2023: 28.900 (Zehnjahresvergleich: −10,5 %). Grundlage der Pipeline-Diagnose in Eingriff 2: stabile Anfänger, crashende Absolventen — empirischer Beleg, dass der Engpass nicht an der Hochschulkapazität liegt. — https://www.destatis.de/DE/Presse/Pressemitteilungen/2024/08/PD24_N041_21.html

[28] Raymond Boudon: Education, Opportunity, and Social Inequality. Changing Prospects in Western Society (Wiley, 1974) — Begründung der Unterscheidung zwischen primären Herkunftseffekten (kompetenzbezogen, vor/außerhalb der Schule entstehend) und sekundären Herkunftseffekten (entscheidungs- und sortierungsbezogen, institutionell verstärkt). Deutsche Rezeption u. a.: Rolf Becker / Wolfgang Lauterbach (Hrsg.): Bildung als Privileg (mehrere Auflagen, VS Verlag); Kai Maaz et al. zur sekundären Disparität beim Gymnasialübergang. — Die Anwendung der Boudon-Unterscheidung auf die konkreten Korridore der 44-Prozentpunkt-Spreizung in diesem Essay ist eine systemische Schätzung des Verfassers, kein aus diesen Quellen direkt entnommener Effektwert. — Verlag/Ort/Jahr bestätigt: John Wiley & Sons, New York 1974; Volltext: https://archive.org/details/educationopportu0000boud . Die deutsche Rezeption (Becker/Lauterbach, Maaz) bleibt als Sekundärbeleg.

[29] IQB-Bildungstrend (Institut zur Qualitätsentwicklung im Bildungswesen, Humboldt-Universität zu Berlin) — länder- bzw. schulscharfe Kompetenzdaten zur Überprüfung der Bildungsstandards. Grundlage für (a) die Vorab-Prüfung der Konzentrations-These (Verteilung des kompensierbaren Gefälles über die Länder) und (b) die Peer-Group-Bänderung des gestaffelten Rollouts. Das IQB kooperiert mit dem DIPF (Leibniz-Institut für Bildungsforschung und Bildungsinformation) und ist vorgesehene administrative Anbindung der Wissenschaftlichen Bewertungskommission [31]. — IQB-Bildungstrend Primarstufe 2021 (IQB, HU Berlin, Leitung Stanat) — https://www.iqb.hu-berlin.de/de/schule/primarstufe/bildungstrend/2021/ . Die Verfügbarkeit schulscharfer Mikrodaten (FDZ am IQB) für Kontrollarm-Bildung/VERA-Disaggregation bleibt als Implementierungsvorbehalt benannt (kein Quellenmangel, sondern Datenzugangsfrage).

[30] Externe Effektstärken-Referenz für die Programmversagens-Schwelle: wissenschaftliche Begleitforschung des laufenden Startchancen-Programms (BMBFSFJ / wiss. Konsortium); NRW-Sozialindex-Wirksamkeitsforschung; international: Education Endowment Foundation (EEF) Teaching & Learning Toolkit und Pupil-Premium-Evaluationen (England) als Referenz für erreichbare Effektstärken kompensatorischer Schulförderung. Der Referenzkorridor ist belegbar: EEF Teaching & Learning Toolkit, Strang „Small group tuition" (+4 Monate Lernfortschritt; d ≈ 0,10–0,15 als plausibler Referenzkorridor) — https://educationendowmentfoundation.org.uk/education-evidence/teaching-learning-toolkit/small-group-tuition . Der exakte Schwellenwert ist dagegen kein zitierbarer Wert — er wird von der Wissenschaftlichen Bewertungskommission vor Programmstart festgelegt und veröffentlicht, an dieser EEF-Referenz ausgerichtet, nicht aus der essay-eigenen Spreizungs-Dekomposition abgeleitet.

[31] Art. 91b Abs. 2 GG — Rechtsgrundlage für die Wissenschaftliche Bewertungskommission: „Bund und Länder können auf Grund von Vereinbarungen zur Feststellung der Leistungsfähigkeit des Bildungswesens im internationalen Vergleich und bei diesbezüglichen Berichten und Empfehlungen zusammenwirken." Grundlage für eine per Verwaltungsvereinbarung eingerichtete ständige wissenschaftliche Kommission ohne eigenständige Behördengründung. Vorgesehene Anbindung: DIPF — Leibniz-Institut für Bildungsforschung und Bildungsinformation (Frankfurt/Berlin), in Kooperation mit dem IQB. Analoge Konstruktion: Gemeinsame Wissenschaftskonferenz (GWK Bonn). Ob Art. 91b Abs. 2 GG als alleinige Grundlage der Bewertungskommission trägt oder eine eigenständige Bund-Länder-Vereinbarung nach Art. 91b Abs. 1 GG erforderlich ist, ist eine verwaltungsrechtliche Frage, die vor Programmstart gutachterlich zu klären ist.

Bildung: Die Sortiermaschine

Erster Entwurf — vor dem Crashtest. Zeigt die architektonischen Lücken, die in der gehärteten Version behoben oder offen deklariert wurden.