ARIMAX setzt sich aus drei Wortbestandteilen zusammen: ARI, MA und X.
ARI steht für ein autoregressives dynamisches Modell. Das bedeutet, dass eine Beziehung zwischen einer abhängigen und mehreren unabhängigen Variablen untersucht werden kann, auch wenn sich der Zusammenhang über die Zeit ändert. MA steht für gleitendes Mittel. Ein gleitendes Mittel unterteilt eine Messreihe in mehrere Fenster, für die ein Mittelwert gebildet wird, anstatt einfach nur den Mittelwert einer gesamten Messreihe zu betrachten. Das ist zum Beispiel bei zyklischen Verläufen oder bei starken Schwankungen wichtig, wenn der allgemeine Mittelwert nicht mehr die kurzfristige Entwicklung widerspiegeln kann. Und das X steht für “exogene Variable“. Das bedeutet, dass die Erklärungsmacht von einem oder mehreren äußeren Einflüssen untersucht werden kann. Wenn man also eine Vermutung hat, von welcher Größe eine Messreihe abhängen könnte, dann kann man testen, ob dies tatsächlich so ist und an Hand der Erkenntnis Prognosen wagen. Als exogene Größe kann in der politischen Ökonomie zum Beispiel die Mehrwertrate angenommen werden, da diese nicht von anderen Größen, sondern vom Stand der Klassenkämpfe und dem Klassenbewusssein abhängt (Näheres hier).
Die ARIMAX-Methode analysiert Messreihen in ihrem zeitlichen Verlauf. Hier kann sie zwei Dinge leisten: zum einen kann sie den Zusammenhang zwischen den verschiedenen Größen klären, was nützlich sein kann, um die Ursachen von Trends oder Schwankungen in der Zeitreihe zu verstehen. Und sie kann zumindest kurzfristig einen Trend voraussagen.
Ein ARIMAX-Modell kann mathematisch wie folgt dargestellt werden:
Yt = α + β1X1t + β2X2t + … + βkXkt + φ1Yt-1 + φ2Yt-2 + … + φpYt-p + εt
wo Yt die abhängige Zeitreihe ist, α ist der Konstante Term, X1t, X2t, …, Xkt sind die k exogenen Variablen, φ1, φ2, …, φp sind die Parameter der autoregressiven Komponente, εt ist der Fehlerterm und p ist die Ordnung der autoregressiven Komponente. Die Schätzung der Parameter eines ARIMAX-Modells erfolgt durch Maximum-Likelihood-Schätzung, bei der die Parameter so angepasst werden, dass sie die Wahrscheinlichkeit maximieren, dass das beobachtete Muster der Daten mit dem Modell übereinstimmt. Das muss man aber nicht alles wissen, um die Methode anwenden zu können.
Möchte man mit Hilfe der ARIMAX-Methode eine Voraussage machen, muss man seinen Datensatz in Trainings- und Testdaten unterteilen. Trainingsdaten sind eine Teilmenge der ursprünglichen Daten, die verwendet werden, um die Parameter des Modells ermitteln. Testdaten sind die restlichen Daten, die nicht für das Training verwendet wurden und werden verwendet, um die Vorhersagegenauigkeit des Modells zu bewerten. Das Modell wird auf diese Daten angewendet und die Vorhersagen werden mit den tatsächlichen Werten verglichen, um die Leistung des Modells zu bewerten. Wenn die Vorhersagegenauigkeit des Modells auf den Testdaten hoch ist, deutet dies darauf hin, dass das Modell gut generalisiert und in der Lage ist, zukünftige Werte der Zeitreihe mit hoher Genauigkeit vorherzusagen. Es handelt sich also um ein einfaches Machine-Learning-Tool.
Beispiel: Organische Zusammensetzung des Kapitals und durchschnittliche Profitrate
Das Gesetz vom „tendenziellen Fall der Profitrate“ begründete Karl Marx bekanntlich damit, dass die Kapitalisten auf der Jagd nach Extraprofiten immer mehr Technik einsetzten, welche die wertbildendende menschliche Arbeitskraft verdrängt. Hat sich eine neue Produktionsweise eingebürgert, steige gesamtgesellschaftlich die organische Zusammensetzung, also sinke der Anteil an wertbildender menschlicher Arbeit und damit auch die Profitrate.
Nun liegt auf der Hand, dass sowohl innerhalb der marxistischen Annahmen einer idealtypischen kapitalistischen Gesellschaft als auch unter den Bedingungen einer realen Ökonomie, in welche der Staat und konkurrierende Volkswirtschaften eingreifen, viele andere Variablen die Profitrate beeinflussen. In realen Daten sieht das in etwa so aus:
Die Daten springen hin und her. Die lineare Regression, die hier als geradeliniger Trend eingezeichnet ist, ist bei der organischen Zusammensetzung problematisch, da diese erst in den letzten Jahren enorm angestiegen ist. Zudem ist zu fragen, ob nicht vielleicht die Mehrwertrate einfach gestiegen ist und dies den Fall der Profitrate besser erklären würde oder ob demographische Anomalien das Ergebnis beeinflussten. Die ARIMAX-Methode erlaubt es, zum einen, Alternativhypothesen auf ihre Erklärungsmacht recht einfach zu testen und zweitens eine Prognose auf Grund der jüngeren Entwicklung abzugeben, um daraus politische Rückschlüsse ziehen zu können. In diesem Blog bereits vorgestellt wurde die Überprüfung des Allgemeinen Gesetzes der kapitalistischen Akkumulation (Näheres hier).
Anwendbarkeit und Grenzen
Die ARIMAX-Methode ist kein Hexenwerk und keine Raketenphysik, sondern ein gutes Werkzeug, um Strukturen im Chaos der ökonomischen Daten zu identifizieren. Prinzipiell kann man das leicht selbst umsetzen, zum Beispiel mit dem Package „forecast“ im kostenlosen Programm R, aber auch mit Python, MATLAB, SPSS, etc.. Über die mathematischen Hintergründe muss man nicht viel wissen, sondern man sollte nur die einzelnen Schritte grob verstehen. Die Dokumentation des R-Packages reicht bei ein wenig Übung mit Datenanalyse aus. Ansonsten kann man sich mittlerweile den recht kurzen Code auch von OpenAI schreiben und erklären lassen.
Der große Vorteil der ARIMAX-Methodik ist, dass sie keine stationären Daten erfordert. Stationäre Daten haben einen konstanten Mittelwert oder eine konstante Varianz, was in der dynamischen kapitalistischen Ökonomie selten vorkommt. Die Methode kann durch eine zusätzliche Differenzierung und Integration Trends herausfiltern, auf deren Grundlage weitere Voraussagen oder Rückschlüsse getroffen werden. Bei mehreren exogenen Variablen lassen sich diese auch nach Einfluss ordnen.
Wie jedes nützliche Tool aus dem Handwerkskasten der Datenanalyse, gibt es einen Haken: die Daten selbst. Zum einen sind fast alle bürgerlichen Datensätze in Geldwerten erfasst, sodass zum Beispiel Arbeitswerte nicht so einfach zur Hand sind und erst über umstrittene Transformationsprozeduren generiert werden müssten. Auf der anderen Seite muss man die Daten für das jeweilige Datenanalyseprogramm passfertig gestalten, was sehr aufwendig werden kann, insbesondere, wenn man die Daten aus mehreren Datensätzen zusammenstellen muss.
Ein weiterer Nachteil, der in der marxistischen Analyse weniger relevant ist, dass ARIMAX-Modelle mitunter recht komplex und daher schwer zu interpretieren sein können, wenn man nicht weiß, wonach man sucht. Da Marx es sich jedoch im Gegensatz zu den bürgerlichen Ökonomen nicht so leicht gemacht hatte, und nur die nackte Empirie des Kapitalismus betrachten wollte, sondern dessen Zusammenhänge analysierte, wissen wir eigentlich wonach wir in den Daten suchen.
Zusammenfassung
Die ARIMAX-Methode ist eine unter vielen, welche die moderne Datenanalyse bereithält. Mittlerweile sind solche Methoden durch Open-Source-Programme, Videotutorials, frei verfügbare Datensätze und mittlerweile Chat GPT auch für interessierte Laien anwendbar. Der Haken sind eigentlich nur die Daten selbst. Man muss sie finden. Man muss sie aufbereiten. Man muss sie suchen und finden. Und sie müssen erstmal erhoben werden. Häufig muss man als Marxist viele Größen sogar selbst noch aggregieren, damit man sie analysieren kann. Ansonsten haben wir außeruniversitär so viele und so leicht zugreifbare Möglichkeiten wie nie zuvor. Im Baseball oder Football hat sich bereits eine große Analytics-Community herausgebildet, in der Menschen als Hobby ihren Lieblingssport statistisch untersuchen. Und auch die Bourgeoisie nutzt jenseits aller Unkenrufe von der Unplanbarkeit von Ökonomien diese Instrumente, um ihren Kapitalbedarf abschätzen zu können. Vielleicht wäre es Zeit, für eine ähnliche Community im Marxismus?