KI-Bericht der Enquete-Kommission mit Relevanz für das Steuerrecht

Der knapp 800 Seiten starke Abschlussbericht der Enquete-Kommission zu den Potenzialen von Künstlicher Intelligenz (KI) und der damit verbundenen gesellschaftlichen Verantwortung bietet einen sehr detaillierten Überblick über die verschiedenen potentiellen und existierenden Anwendungsfelder von KI in unserer Gesellschaft und Wirtschaft. Auch aus der Perspektive der „Steuerleute“ enthält der Bericht lesenswerte Passagen.

Lernende KI-Systeme im Fokus des Abschlussberichts (Seite 48 ff.)

Regelbasierte KI-Systeme sind dadurch gekennzeichnet, dass das Verhalten vollständig durch Algorithmen von Menschen definiert ist (deterministischer Programmcode). Dazu gehören insbesondere sogenannte Expertensysteme und die ihnen zugrunde liegenden Wissensdatenbanken, weshalb das Verhalten des regelbasierten KI-Systems für den Menschen nachvollziehbar ist. Davon abzugrenzen sind die lernenden KI-Systeme, die im Fokus der Analyse der Enquete-Kommission stehen. Lernende KI-Systeme werden nur initial durch den Menschen konfiguriert. Mithilfe von Daten trainieren sie, wie ein Problem zu lösen ist. Durch kontinuierliches Lernen wird das Verhalten des Algorithmus verbessert. Das Systemverhalten ist hierbei für Menschen häufig schwer nachvollziehbar. Dies gilt insbesondere für Systeme des „Deep Learning“ mittels sogenannter neuronaler Netze, bei denen der menschliche Input bei der Vorverarbeitung und Vorstrukturierung von Daten vergleichsweise sehr reduziert ist. Die Strukturierung der Rohdaten ist Teil des Lernprozesses.

Nur regelbasierte KI-Systeme zulässig bei automatisierten Verwaltungsakten (Seite 76 f.)

Die zentrale Norm ist § 35a des Verwaltungsverfahrensgesetzes (VwVfG), wonach ein Verwaltungsakt vollständig automatisch erlassen werden kann, sofern dies durch Rechtsvorschrift zugelassen ist und weder ein Ermessen noch ein Beurteilungsspielraum besteht. Für das Steuerrecht wurde mit § 155 Abs. 4 AO eine Rechtsvorschrift im Zuge des Gesetzes zur Modernisierung des Besteuerungsverfahrens geschaffen, die einen vollmaschinellen Erlass von Steuerbescheiden ermöglicht, wenn kein Anlass für die Einzelfallprüfung besteht. Die Norm geht somit davon aus, dass nur regelbasierte Entscheidungen voll automatisiert werden dürfen und Abweichungen nicht automatisiert eingelesen, verarbeitet und bewertet werden dürfen (Seite 205,s.u.). Im Hinblick auf den Erlass des Steuerbescheids hat die Finanzbehörde keinen Ermessensspielraum, sie trifft aber grundsätzlich die Pflicht, die erklärten Daten des Steuerpflichtigen zu prüfen, um einen gleichmäßigen und gerechten Steuervollzug herzustellen (§ 88 Abs. 1 AO). In diesem Zusammenhang ist auch § 88 Abs. 5 AO zu nennen, wonach bei der Überprüfung der Steuerfälle durch die Finanzverwaltung automationsgestützte Systeme eingesetzt werden können. Im Kontext der Auswahl und Überprüfung der elektronisch deklarierten Steuerdaten kommt den Finanzbeamten ein Ermessen und ein Beurteilungsspielraum zu, weshalb eine vollmaschinelle Prüfung nach Maßgabe von § 35a VwVfG nicht rechtmäßig wäre.

Damit Gerichte die Ausübung eines Ermessens oder die Ausnutzung eines Beurteilungsspielraums durch die Verwaltung  überprüfen können, müssen sie die tragenden Erwägungen für die jeweilige Entscheidung kennen (sog. Rechtsweggarantie, Art. 19 Abs. 4 GG). Nach Auffassung der Enquete-Kommission können lernende KI-Systeme nicht für vollautomatisierte Ermessensentscheidungen und Fallbeurteilungen eingesetzt werden, weil das Verhalten bzw. die Entscheidungsfindung dieser Systeme – aus menschlicher Sicht betrachtet – gegenwärtig regelmäßig eine Black-Box sei. Eine gerichtliche Prüfung des Verwaltungshandelns nach Maßgabe von Art. 19 Abs. 4 GG wäre daher regelmäßig nicht möglich. Anders sei dies gleichwohl in Bezug auf die regelbasierten KI-Systeme (Expertensysteme), die in aller Regel einer gerichtlichen Prüfung unterzogen werden können. Eine Aussteuerung der Deklarationsfälle anhand von deterministischen Programmcodes und Entscheidungsbäumen, mit denen die deklarierten Daten bspw. mit Referenzdaten und externen Quellen (z.B. Rentenversicherung) abgeglichen werden, um hierüber eine Risikoklassifizierung nach § 88 Abs. 5 AO vorzunehmen, ist daher zulässig.

Praxiseinsatz von lernenden KI-Systemen in der Steuerverwaltung

Der Verfasser vermutet, dass die Finanzverwaltung für Zwecke der Bildung der Risikoklassen des Riskomanagementsystems im Sinne des § 88 Abs. 5 AO auch lernende KI-Systeme einsetzt, anhand derer je abstraktem Personenkreis bspw. Kombinationen von Werten oder Merkmalen sowie Schwellenwerte ermittelt werden, die als kritisch bzw. weniger kritisch einzustufen sind (s. auch frühere Blogbeitrag). Hierüber kann man nur spekulieren, weil Einzelheiten des Risikomanagementsystems der Finanzverwaltung grundsätzlich nicht veröffentlicht werden dürfen (§ 88 Abs. 5 Satz 4 AO). Dass die Finanzverwaltung KI-Systeme insbesondere zur Identifikation von „Steuersündern“ einsetzt, ist schon länger bekannt: Beispielsweise verwendet Hessen zur Untersuchung von Steuerstraftaten Deep Learning Algorithmen oder es werden Webcrawler von der Berliner Steuerverwaltung im Rahmen des E-Commerce eingesetzt (siehe hierzu auch den Blogbeitrag zu X-PIDER). Oder das Verfahren NEPOMUK, welches über neuronale Netztechnologie Karussellfälle identifiziert. Auch andere Behörden nutzen KI bereits als unterstützendes Instrument, bspw. die Polizei als Prognosesoftware zum Entlarven von Einbrechern (s. Link). Weitere Beispiele auch aus anderen Ländern enthält der KI-Bericht auf den Seiten 207 ff.

Lernende KI-Systeme erfüllen in der öffentlichen Verwaltung eine zunehmend bedeutende Unterstützungsfunktion, was gesetzlich bislang in Deutschland nicht geregelt ist. Dazu merkt die Enquete-Kommission an, dass dies im Hinblick auf den Vorbehalt des Gesetzes im Sinne des Art. 20 Abs. 3 GG kritisch sein kann, wenn der KI-Einsatz selbst eine spezifisch belastende Wirkung für die Adressatin oder den Adressaten entfaltet. Eine solche belastende Wirkung könnte etwa in der Einschränkung der Entscheidungsautonomie der Sachbearbeiterin oder des Sachbearbeiters liegen. Folgt der Sachbearbeiter typischerweise der Empfehlung des KI-Systems, desto eher käme dieser Empfehlung selbst eine belastende Wirkung zu.

Vormarsch der KI-Systeme

In der Steuerberatung werden lernende KI-Systeme für die Erstellung von Gutachten etc. erprobt und eingesetzt (s. Peper/Maschek/Volovskiy, Rethinking Tax, 5/2020, S. 7; Kirchhoff Ubg, 8/2019, S. 468). Unternehmen setzen Chat-Bots ein, die zunächst menschengestützt mit initialen FAQs bestückt und dann sukzessive maschinengestützt fortentwickelt werden. Zur Stabilisierung des Tax Compliance Management Systems werden sog. Continous Monitoring Lösungen eingesetzt, die mittels Prüflogiken Datenanomalien erkennen und die Abarbeitung der Findings durch maschinelles Lernen unterstützen (s. Risse, Der Betrieb, 30/2019, S. 1645).

 

Links:

KI-Abschlussbericht der Enquete Kommission

Predictive Policing: Prognosesoftware entlarvt Einbrecher

X-PIDER – Erfahrungen mit dem Web-Roboter der Finanzverwaltung

EDV-ABC Finanzämter Bayern