Das stimmbürgerliche Donnerwort vom 3. März 2024 wird noch lange nachhallen – nicht zuletzt auch deshalb, weil der Scheck, den man sich hier grosszügig selbst ausgestellt hat, ja noch nicht gedeckt ist. Aber auch die Ursachen des Entscheids müssen noch gründlich untersucht werden. Wie wichtig waren die soziodemografischen Umstände und die politischen Haltungen für den Entscheid? Welche Rolle spielten die Argumente? Die Befragungen im Vorfeld und Nachgang gaben bereits einen ersten Eindruck davon und die gründliche VOX-Analyse des Urnengangs wird das Bild dann in einigen Wochen noch abrunden. Auch in diesem Fall wird freilich die «Wahrheit», wie in den (Sozial-)Wissenschaften doch zumeist, nicht einer einzigen Quelle kristallklar entsprudeln, sondern jenes Residuum stilisierter Fakten sein, die dem Selektionsprozess, einem argumentativen «survival of the fittest» standzuhalten vermögen.

Befragungen sind wichtige Interpretationshilfen – aber auch die Resultatdaten sind aufschlussreich

Die Erkenntnisse der Demoskopie werden zweifelsohne zentral sein. Doch auch die Resultatdaten der Abstimmung sind ein Mosaikstein, der zu einem vollständigen Bild beitragen kann. Es handelt sich zwar «nur» um Aggregatdaten keine Individualdaten wie in den Befragungen: Die Stimmzettel sind anonymisiert, und entsprechend können auch nur Stimmentotale, bzw. Zustimmungsanteile auf Gemeindeebene ausgewertet werden. Aber die Resultate werden schweizweit in tausenden von Abstimmungslokalen genauestens erfasst. In einem gewissen Sinne sind diese Daten the truth & nothing but the truth: Sie sind die Entscheidung selbst, nicht eine Reaktion auf einen Fragenstimulus.[1]

Genau darin liegt aber auch ihre Beschränkung: Die Abstimmungsresultate dokumentieren den Volksentscheid – ihr Zweck ist nicht die Förderung sozialwissenschaftlichen Erkenntnisgewinns über dessen Ursachen. Sie sind zwar räumlich hochaufgelöst. Doch spiegelt dies die administrativen Strukturen, die leider dort besonders kleinräumig sind, wo ohnehin wenige Menschen leben. Wegen des Stimmgeheimnisses wird im Zählprozess sorgfältig verwischt, wer wie abstimmte. Personenmerkmale können deshalb nicht mit dem Entscheid verknüpft werden, sondern nur ebenso aggregierte, die sich auf jene Kollektive beziehen, für welche die Resultate ermittelt wurden: Im besten Falle sind dies die Gemeinden.[2]

Nun aber zur Analyse des konkreten AHV13-Entscheids. In diesem ersten Beitrag geht es um die Frage, wovon die Zustimmung abhing, in einem zweiten um die Erklärung der Zustimmungsentwicklung seit 2016 als über eine sehr ähnliche Initiative, die AHVplus abgestimmt wurde.

Deutschschweiz und Romandie - zwei verschiedene Welten

Bei der Modellierung der Zustimmung muss ein zentrales Faktum berücksichtigt werden. Zwar gab es keinen Röstigraben im engeren Sinne - die AHV13 war in allen drei grossen Sprachregionen mehrheitsfähig. Aber der Zustimmungsunterschied zwischen der Romandie und der Deutschschweiz[3] (inklusive dem romanischsprachigen Gebiet in GR), auf die wir uns hier konzentrieren, war mit 23%-Punkten massiv:

ahv13 map jaant sprareg

Die Karte zeigt, dass ein starker Zustimmungsgradient genau mit der Sprachgrenze zusammenfällt. In den zweisprachigen Kantonen FR und VS ist das sehr deutlich erkennbar – und wenn man genau hinsieht, ist die Zustimmung sogar in Mont-Tramelan und Rebévelier, den winzigen, gemäss BFS deutschsprachigen Exklaven im ansonsten französischsprachigen Jura bernois deutlich tiefer als in ihrer Umgebung.[4] Ein rudimentäres Regressionsmodell der Zustimmung zur AHV13, das nur auf die sprachregionale Zugehörigkeit einer Gemeinde abstellt, «erklärt» bereits hohe 61% der Varianz der Gemeinderesultate.

Folgende Überlegung mag diesen Sachverhalt illustrieren. Versucht man die Gemeinden aufgrund ihres Abstimmungsresultats einer der beiden Sprachregionen zuzuordnen so liegt der optimal «diskriminierende» Schwellenwert bei einem Ja-Stimmenanteil von etwa 66%. Nur 2% der Gemeinden in der Deutschschweiz haben einen höheren Ja-Stimmenanteil, nur 5% derjenigen in der Romandie einen tieferen – was impliziert, dass 93% der Gemeinden allein aufgrund ihres Abstimmungsresultats der richtigen Sprachregion zugeteilt werden können. Da es sich bei den fehlklassierten Gemeinden überwiegend um kleinere Einheiten handelt, wurden in diesen «überlappenden» Gebieten sogar nur 4% der Stimmen abgegeben.

Allein schon wegen dieses Niveauunterschieds müssen die beiden grossen Sprachgebiete separat modelliert, oder was letztlich mehr oder weniger aufs selbe hinausläuft, als Interaktionsterm in ein Gesamtmodell eingebaut werden. Dabei zeigt sich nämlich auch, dass es interessante Unterscheide zwischen den Landesteilen gibt.

Ein simples Modell zur «Erklärung» der Zustimmung zur AHV13

Mein Modell ist bewusst sparsam gehalten. Es berücksichtigt einerseits die (partei-)-politische Ausrichtung der Gemeinden mit dem Wähleranteil dreier wichtiger national flächendeckend vertretener Parteien in den letzten Nationalratswahlen: der SVP, der FDP und der SP[5]. Andererseits sind zwei wichtige und auch angesichts der Debatte und der Befragungsresultate interessierende soziodemographische Einflussgrössen berücksichtigt, für die auf Gemeindeebene gute Daten verfügbar sind: Der Anteil der Anteil der 65-jährigen und älteren an den Stimmberechtigten aus der STATPOP und die medianen Reineinkommen aller Steuerpflichtigen, welche die ESTV zur Verfügung stellt.[6] Schliesslich kann man bei dieser Abstimmung auch noch einen Mobilisierungseffekt vermuten. Die terminspezifische Mobilisierung ergibt sich, wenn man von der AHV13-Beteiligung die langjährige Durchschnittsbeteiligung gemeindeweise abzieht. Das ist notwendig, weil zwischen den Gemeinden langfristig ziemlich konstante Niveauunterscheide in der Partizipation bestehen, die vor allem mit ihrer Soziodemografie zu tun haben.

Die folgende Grafik zeigt die Zusammenhänge zwischen diesen Einflussgrössen und dem Ja-Stimmenanteil zur AHV13 in modellhafter Abstraktion:[7]

Politische Haltungen waren von grosser Bedeutung

In beiden Sprachregionen ist der Wähleranteil der SP ganz klar der wichtigste Einflussfaktor: Je höher er ist, desto höher die Zustimmung zur AHV13. In der Deutschschweiz hat er aber einen deutlich grösseren Einfluss, der Gradient ist ausgeprägter, das Vertrauensintervall enger. Die obige grafische Darstellung kann etwa so interpretiert werden: Eine Erhöhung des Wähleranteils der SP um 10 Prozentpunkte erhöht die Zustimmung ceteris paribus um etwa 8 Prozentpunkte, in der Romandie ist das Verhältnis 1:4, der Gradient also nur etwa halb so steil. Selbst wenn ein ökologischer Fehlschluss nie ganz ausgeschlossen werden kann: Auch die Gemeinderesultate spiegeln so die hohe Zustimmung zur Initiative unter der SP-Wählerschaft, die auch Befragungen ausweisen. In derjenigen von LeeWas für 20-Minuten/Tamedia betrug die Zustimmung unter den Anhängern der grössten Linkspartei mit 82% – und stimmt so sogar mit einer naiven Interpretation des (deutschschweizerischen) Parameterwerts ziemlich genau zusammen. Dieser Zusammenhang ist übrigens bereits im bivariaten Streudiagramm augenfällig:

ahv13 sp

Umgekehrt ist ein hoher Wähleranteil der FDP, jener Partei, unter deren Anhängern sich gemäss den Befragungen am meisten Gegner fanden mit einer tieferen Zustimmung verbunden – in der Romandie allerdings sehr viel ausgeprägter als in der Deutschschweiz, wo der Gradient deutlich kleiner war. Dies steht im Einklang mit der Tatsache, dass die FDP-Anhängerschaft die Initiative mit 38% Ja-Anteil gemäss leewas relativ deutlich abgelehnt hat. Bei der SVP schliesslich besteht in der Romandie kein aussagekräftiger Zusammenhang. In der Deutschschweiz ist er leicht positiv, was mit dem Befragungsbefund einer leichten (55%) Befürwortermehrheit der Initiative unter den Sympathisanten dieser Partei kompatibel ist. Vor allem in der Deutschschweiz gibt es zudem Evidenz für einen Mobilisierungseffekt. Je stärker die Beteiligung gegenüber dem langjährigen Mittel erhöht war, desto höher war die Zustimmung: Die Initiative scheint so - angesichts des Resultats plausiblerweise - mehr Befürworter als Gegner an die Urne gelockt zu haben.

Einkommenssituation und Altersstruktur als Einflussgrössen?

Was sagt unser Modell zu den beiden soziodemografischen Einflussgrössen, der Einkommenssituation und der Altersstruktur? In «ärmeren» Gemeinden war die Zustimmung zur Initiative tendenziell klar höher als in «reichen». Auch die Befragungen zeigen, dass die Zustimmung bei Personen mit geringem Einkommen am höchsten war. Die Daten zur Einkommenssituation beziehen sich auf alle (ordentlichen) Steuerpflichtigen der Gemeinden (und sind zudem bereits vier Jahre alt) – der Konnex zu den Abstimmungsteilnehmern ist also, gelinde gesagt, eher lose. Dennoch ist auch dieser Zusammenhang im bivariaten Streudiagramm recht offensichtlich:

Und schliesslich noch die Altersstruktur, der Anteil der Personen im Rentenalter an den Stimmberechtigten: Hatte sie einen Einfluss? In der Romandie gibt es eigentlich keinen Zusammenhang mit der Zustimmung zur AHV13. Die Gerade im Effect-Plot verläuft mehr oder weniger horizontal und das Vertrauensintervall ist sehr breit.[8] In der Deutschschweiz gibt es hingegen Evidenz dafür, dass in Gemeinden mit einem hohen Anteil von Stimmberechtigten im Rentenalter die Zustimmung etwas höher war als in «jungen». Angesichts des Befunds der  LeeWas-Nachbefragung, in der die über 65-Jährigen einer 13. AHV-Rente der Initiative grossmehrheitlich (78%) zustimmten, mag diese etwas «laue» Evidenz überraschen. Auch im bivariaten Streudiagramm ist übrigens ein Zusammenhang zwischen den beiden Grössen keineswegs augenfällig:

ahv13 ant65

Fazit

Insgesamt überraschen die Resultate dieser statischen Modellierung der Zustimmung zur AHV13 in den Gemeinden nicht, denn sie stimmen – beruhigenderweise- mit den Befunden der Demoskopie zumindest in ihren groben Zügen überein, Befunde, die angesichts des Gegenstands der Abstimmung auch sehr plausibel sind. Der Elefant im Raum sind die gewaltigen sprachregionalen Niveauunterschiede, die wir in unserem Modell einfach als gegeben hinnehmen: Die verwendete Kategorienvariable «erklärt» ja letztlich nichts – sie ist bloss eine sehr mächtiges Proxy, das die Einflüsse «richtiger» Variablen bündelt. Vorschläge, am liebsten gleich zusammen mit einem Messkonzept, werden gerne entgegengenommen! Es wäre übrigens auch interessant, die Befragungsresualtate getrennt nach diesem Merkmal auszuwerten.   

Weil der Bezug der Aggregatsmessgrössen zu jener Gruppe von Stimmberechtigten, die am Sonntag teilnahm, unterschiedlich stark ist (hoch etwa bei den Parteiwähleranteilen, die vor wenigen Monaten «gemessen» wurden, deutlich schwächer bei der Soziodemografie) sind die Effektstärken zudem nicht «tel quel» als Bedeutungshierarchie zu interpretieren. Die Zusammenhänge auf Aggregatsebene sind in meiner Erfahrung fast immer stärker mit politischen als mit soziodemographischen Variablen. Auch wenn man dies in Rechnung stellt, ist der Einfluss der Altersstruktur recht schwach – aber dieser Thematik geht ein nächster Beitrag auf diesem Kanal noch vertieft nach. Stay tuned!

Anmerkungen

[1] Das ist nicht dasselbe – so ist etwa der Anteil der selbstdeklarierten Partizipanten in Befragungen regelmässig weit höher ist als in Wirklichkeit, was bei der Gewichtung meist berücksichtigt wird (siehe dazu Sciarini & Goldberg 2016).

[2] Dabei muss opportunistisch mit den existierenden Datenbeständen vorliebgenommen werden. Primäre Quelle ist dabei das Bundesamt für Statistik, das reiches Datenmaterial, zumal aus dem seit 2010 bestehenden Registersystem auf Gemeindeebene zum teil fein granuliert frei und in guter Qualität zugänglich macht. Nur ausnahmsweise beziehen sich diese Daten allerdings auf die gleiche Personengruppe, die den Abstimmungsentscheid ge­troffen hat. Bisweilen ist der Bezug relativ eng – am stärksten dann, wenn gleichzeitige oder zeitnahe politische Entscheide verwendet werden; bereits schwächer ist er, wenn man solche aus der Vergangenheit – z.B. Abstimmungs- und Wahlresultate – beizieht. Noch entfernter ist der Bezug üblicherweise bei soziodemografischen Indikatoren. Wenn man Glück hat, kann man sie auf die Stimmberechtigten, bzw. die erwachsene Bevölkerung mit Schweizer Staatsbürgerschaft, beziehen, meist aber handelt es sich um die Gemeindebevölkerung insgesamt, also auch Personen, etwa Ausländer, die gar nicht stimmberechtigt sind. Viele Daten aus den Registern sind seit 2010 jährlich verfügbar – meist aber mit einem lag von ein bis zwei Jahren. Auch der zeitliche Bezug ist so häufig unscharf.

[3] Die Sprachgebietszuordnung stammt vom BFS, ihr Zustandekommen ist hier beschrieben.

[4] Für die eindrückliche Abruptheit des Zustimmungsgradienten bei manchen Vorlagen siehe auch Zweimüller 2018.

[5] Der Wähleranteil der Mitte ist national sehr linksschief verteilt, was ihn als Regressor eher ungeeignet macht. Hinzu kommt natürlich, dass die Wähleranteile aller Parteien zusammen 100 ergeben: sie sind nicht unabhängig voneinander – die design matrix der Regression wäre nicht vollrangig, wenn alle Parteien einbezogen würden, und je näher man diesem Zustand kommt, desto eher handelt man sich Probleme ein.

[6] Die STATPOP, die Registererhebung zur Bevölkerungsstruktur liefert die Angaben zur Altersstruktur der 18-Jährigen und älteren Personen mit schweizerischer Staatsbürgerschaft per 31.12.2022. Daten zu den Reineinkommen stammen aus der Bundessteuerstatistik der ESTV (auch jene Pflichtigen die keine Bundessteuer bezahlen, sind enthalten) für das Steuerjahr 2020. Bei der Adaptation auf den aktuellen Gemeindestand - eines der praktischen Probleme tief unten im Maschinenraum, die bei derartigen Aggregatdatenanalysen immer wieder gelöst werden müssen - wurden mit den Steuerpflichtigen gewichtete Mittelwerte der fusionierten Gemeinden verwendet. 

[7] Das Regressionsmodell wurden mit der Zahl der gültigen Stimmen in den Gemeinden gewichtet. Die Gemeinden in den fünf Majorzwahlkreisen (UR, GL, NW, OW, AI, AR) mit nur einem Mandat wurden weggelassen, weil dort die Wähleranteile der Nationalratswahlen oft verzerrt sind – z. B. weil eine Partei gar keine Kandidatur aufstellt, oder beliebte, unbestrittene Bisherige sehr viele Stimmen machen, die dann in den homogenisierten Daten des BFS ihrer Partei zugeschrieben werden (Mehr dazu in meinem Beitrag zur Berechnung der nationalen Parteistärken). Die diskutierten Resultate sind gegenüber unterschiedlichen Modellspezifikationen robust – so kommt substanziell etwa dasselbe heraus, wenn man anstelle des Anteils der 65+ das Durchschnittsalter der Stimmberechtigten einsetzt: Die beiden Grössen korrelieren auch sehr ausgeprägt. Geschätzt wurde eine Spezifikation, in der alle anderen Grössen mit der Sprachregion interagieren – ihre Parameter können also in der Romandie und der Deutschschweiz unterschiedlich sein, was aus der Übersichtsgrafik, einem sogenannten Effect-Plot (Fox & Weisberg 2018) auch hervorgeht. Dieses Modell erklärt 84% der Varianz der Ja-Stimmenanteile (R2). Splittet man das sample sprachregional, so sind die Parameter der beiden Modelle natürlich dieselben, das R2 des Modells für die Deutschschweiz beträgt dann 58%, jenes für die Romandie 62%.  Sie sind also erheblich tiefer als jenes des Gesamtmodells, was auf die Bedeutung des Interaktionsterms hinweist.

[8] Oder statistisch gesprochen: Die Hypothese, dass der Parameter 0 ist, kann nicht verworfen werden.