Maschine statt Mensch? Kann die Gesetzesanwendung auf Wahrscheinlichkeiten statt auf Subsumtion beruhen?

Neulich hatte ich mit meinen Kollegen Ludwig Schindler und David Wieland in einem Taxi auf der Fahrt zum Tax Tech Forum in München eine angeregte Diskussion.

Nehmen wir folgendes an:

Wir haben in einem Unternehmen pro Jahr eine sechs- bis siebenstellige Anzahl von einzelnen Geschäftsvorfällen, die umsatzsteuerlich zu bewerten sind. Die Buchhalter nehmen anhand von Eingangsrechnungen diese Bewertung vor und buchen mit dem entsprechenden Steuerkennzeichen. Die gute alte Welt also. Die Geschäftsvorfälle wiederholen sich, so dass es steuerlich gesehen gut 20 Hauptfälle (Ort, Leistung, Steuersatz) und einige Spezialsachverhalte gibt. Durch menschliche Fehler, jeder hat ja mal einen schlechten Tag, beträgt die Fehlerquote durchschnittlich 3 %.

Für diesen Prozess existiert teilweise eine gewisse Automatisierung wie etwa das Scannen und die Texterkennung von Papierrechnungen, der elektronische Datenaustausch (EDI) oder gar die elektronische Rechnung mittels ZUGFeRD. Auch bei diesen Prozessen treffen Menschen während bzw. bei Implementierung die Entscheidungen über die Rechtsfolge zu bestimmten Sachverhalten, die halb- bzw. vollautomatisch ausgeführt werden. Die Quote aufgrund menschlicher Fehler bei Durchführung des Prozesses oder der Implementierung reduziert sich auf angenommene 2 %.

Technisch denkbar und mittlerweile auch einsetzbar wäre Machine Learning. Mit den vorhandenen historischen Buchungsdaten (Rechnungsdaten, Buchungssätze, Buchungstexte, Steuerkennzeichen usw.) könnte ein Tool trainiert werden, welches algorithmische Muster und Gesetzmäßigkeiten erkennt. Nennen wir das Tool MALETO (Machine Learning Tool). MALETO könnte jedem Geschäftsvorfall die umsatzsteuerlich wahrscheinlichste Lösung zuordnen und für künftige Geschäftsvorfälle diese voraussagen. Je größer die Datenmenge, umso wahrscheinlicher wird das steuerlich richtige Ergebnis ausgegeben.  Nehmen wir an, dass nach einigem Training ob der Vielzahl der Datenpunkte von mehreren Jahren MALETO eine Fehlerquote von nur noch 1 % erreicht.

Die erste Einsatzmöglichkeit des Tools wäre die Analyse der Richtigkeit der Tätigkeit der Buchhalter. Man könnte also im Nachhinein prüfen, ob die von Menschen im halb- oder vollautomatisierten Prozess getroffenen Entscheidungen mit dem Ergebnis von MALETO übereinstimmen. Auch Anomalien in der gesamten Buchhaltung könnten identifiziert werden. Daran arbeiten einige Dienstleister und Unternehmen.

Was ist aber, wenn MALETO und kein Mensch künftig die umsatzsteuerlichen Entscheidungen trifft? Ökonomisch ist die Antwort aus meiner Sicht klar. Wenn MALETO eine geringere Fehlerquote als die Prozesse mit menschlichem Einsatz aufweist, wäre dieses Tool vorzuziehen. Auszunehmen sind dabei gänzlich neue Geschäftsmodelle, für die MALETO keine Trainingsdaten hat.

Aber wie sieht es rechtlich aus? Das Gesetz nimmt an, dass für die Frage der Besteuerung ein einzelner Lebenssachverhalt unter einen gesetzlichen Tatbestand subsumiert wird. Dies tat bisher immer ein Mensch. Bei umsatzsteuerlichen einfachen Sachverhalten sollte es üblicherweise keine Schwierigkeit mit der Auslegung von Tatbestand und Rechtsfolge geben. Das Umsatzsteuergesetz ordnet für die hier vorliegenden Fälle eine gebundene Entscheidung an. Wir haben also in den üblichen Geschäftsvorfällen einen einfachen Entscheidungsbaum, welcher ein Mensch in seiner Subsumtion durchläuft. So könnte auch ein Tool programmiert werden. Jedoch wird das auf Machine Learning beruhende MALETO nicht nach dem Entscheidungsbaum vorgehen, sondern rein nach mathematischen Wahrscheinlichkeiten aus den Trainingsdaten. Welche Entscheidung der Vergangenheit auf einen vorliegenden am besten passt, findet Anwendung. Dabei ist nachweislich eine Fehlerquote, wenn auch eine sehr kleine, vorhanden.

Würde MALETO durch die Finanzverwaltung und letztlich einen Richter anerkannt?

Man kann argumentieren, dass das Gesetz nur den Menschen als Rechtsanwender annimmt. Dieser wendet das Gesetz methodisch richtig nach dem vorgegebenen Entscheidungsbaum mittels Subsumierung an. Ein dabei auftretender menschlicher Fehler ist möglich, wird hingenommen und bei Entdecken durch den Steuerpflichtigen oder die Finanzverwaltung korrigiert. [Das Hinnehmen einer Fehlerquote erkennt man z.B. an den Ergebnissen der Examensklausuren für Bilanzbuchhalter, Steuerberater und Juristen. Auch weit weg von 100%iger Richtigkeit darf man in diesem Berufsstand arbeiten]. Ein Tool wie MALETO ist (bisher?) nicht als Anwender des Gesetzes vorgesehen. Denn MALETO greift eben nicht auf die vorgesehene Methodik bei Anwendung des Gesetzes zurück. Und bei MALETO ist (ziemlich) sicher, dass es keine 100%ige Richtigkeit erzielen wird.

Kommt es auf die Methodik oder auf das Ergebnis an?

Bei der Einzelbetrachtung eines Geschäftsvorfalls könnte ein Mensch 100% Richtigkeit erzielen, MALETO wohl nicht. Ein Richter wird deshalb bei seinem zu betrachtenden Einzelfall das Tool m.E. nicht anerkennen. Auch dann nicht, wenn MALETO auf Daten beruht, die aus früheren Subsumtionen von Menschen stammen. Der Weg – die angewandte Methodik – ist eben nicht der richtige.

Jedoch kommt MALETO statistisch bei einer Vielzahl von Fällen zu genaueren Ergebnissen als ein Mensch. Aus Sichtweise eines Tax Compliance Management Systems wäre die Anwendung von MALETO sinnvoller, wohl auch aus verwaltungsökonomischer Sicht. Und dies betrifft nicht nur die nachträgliche Analyse von Fehlern, sondern auch die originäre Gesetzesanwendung durch das Tool. Dafür müsste aber akzeptiert werden, dass der nichtmenschliche Rechtsanwender methodisch anders vorgeht und eine sehr hohe, aber keine 100%ige Treffsicherheit erzielt. Dies ist aus meiner Sicht derzeit nicht der Fall. Vielleicht denken wir in einigen Jahren anders und die Gesetze werden entsprechend angepasst.

Anhand der Länge des Textes sehen Sie, dass unsere Diskussion nicht im Taxi beendet war. Und sie soll auch nicht beendet sein, sondern gern von Ihnen weitergeführt werden.