Elektrifizierung von Papier
Noch bevor alle Faxgeräte in den Amtsstuben oder Arztpraxen abgeschaltet sind, beschwerte sich das Mitglied einer Deutschen Landesregierung und Leiter eines Innovationslabors auf der Medienplattform LinkedIn darüber, wie sich das Dateiformat PDF schlecht eigne um Dokumente zu verwalten. Diese Aussage provozierte meinen heutigen Blogbeitrag als Beispiel für falsch verstandene Digitalisierung. Leider werde PDF immer noch häufig als Standardformat verwendet und somit seien viele Daten in der öffentlichen Verwaltung und Justiz hoffnungslos verloren, monierte der im digitalen Dschungel gefangene Autor. Es gäbe sogar Gesetze und Verordnungen, die explizit die Nutzung von PDF als rechtlich verbindliches Format vorschrieben, meinte er weiter. Dabei sei deren Verwendung für ihn keine echte Digitalisierung, sondern die Elektrifizierung von Papier und damit die Fortführung der Papierwelt auf dem Bildschirm.
Rückblende: Das Portable Document Format PDF wurde am 15. Juni 1993 von der Firma Adobe Inc. freigegeben und ist aus der heutigen Welt kaum mehr wegzudenken. Für uns «Alte» ist und bleibt es eine Revolution. Mit der Applikation lassen sich auf einfachste Weise Dokumente konvertieren und E-Bücher oder Formulare produzieren. Diese können von den Nutzern mittels kostenlosen Lesern angezeigt, ausgedruckt, kommentiert oder ausgetauscht werden.

Intelligente Dokumentenverarbeitung
PDF ist nicht gleich PDF und PDF ist erst recht keine Datenbank. Ein PDF kann durchaus strukturiert sein, wenn es ein Export aus einem Office, HTML, LaTex, InDesign oder Excel File ist. Wenn es hingegen aus einem eingescannten Dokument stammt braucht es Zwischenschritte, daraus mit einer Lösung wie jener von Acodis, respektive mittels künstlicher Intelligenz KI, strukturierte Daten zu gewinnen. Anstatt an dem Format PDF zu verzweifeln, lassen wir die Maschinen arbeiten, denn genau dafür sind Computer prädestiniert. Unendlich viele Dokumente sind so aufgebaut, 1000e Kilometer Akten müssen eingelesen werden und das geht nur indem Programme lernen, diese zu verstehen. Dass PDFs von Maschinen nicht weiter verarbeitet werden können stimmt deshalb nicht. Beispielsweise stellt die Google-Suche innert Millisekunden Zusammenfassungen aus PDF-Dokumenten zur Verfügung und KI-Applikationen wie ChatGPT oder Claude liefern detaillierte Textauswertungen von Informationen aus PDF-Unterlagen, inklusive Bildern.
Normierung als Wunschdenken
Das Zeitalter der Digitalisierung durch Erzeugung elektronischen Papiers muss enden. Lasst uns in das Datenzeitalter starten, schrieb der Autor des LinkedIn Beitrags und plädierte für die Einführung maschinenlesbarer Formate in der Verwaltung. Dabei vergass er ganz offensichtlich, ein PDF ist nicht einfach ein elektronisches Papierdokument ohne weiteren Anspruch. Das Format kann nicht leicht verändert werden, behält somit sein ursprünglich gedachtes Erscheinungsbild, inklusive Firmenlogo und Bildern. Kommunikation besteht bekanntlich nicht nur aus Text und Zahlen. Schriftgrössen, Bilder und Layout sprechen uns an, oder eben nicht. Sein Aufruf zu Ideen für «das» Datenformat mit dem die Vereinheitlichung gelingen kann, scheint aus der Zeit gefallen zu sein. Solange wir «Alten» noch Dokumente als Power-Point-Dateien, per Fax oder Schneckenpost versenden und in Anbetracht von Abertausenden, weltweit verfügbaren Applikationen, Formaten und Dutzenden von Betriebssystemen, bleibt jegliche «Normierung» ein Wunschdenken. Das ganze Internet-Universum ist eigentlich ein gewaltiger «Murks» schrieb Eduard Kaeser, Physiker und promovierter Philosoph, (Blog vom 28. November 2019: https://kompetenz60plus.ch/schnittstelle-jung-alt/) und die Technologie, unseren Köpfen entsprungen, wächst uns über den Kopf – buchstäblich. Für mich das beste Beispiel, wie diverseste Formate strukturiert und mittels Suche wiederauffindbar präsentiert werden können, sind die sozialen Medien, Plattformen auf die wir weltweit mit unterschiedlichster Hardware Zugang haben.

«Human-centric Computing», der Umgang mit generativen KI-Werkzeugen
Seit bald einem halben Jahrhundert nutzen wir täglich Computer, wobei die Maschinen unsere Arbeitsweise diktieren. Die Herausforderung ist nicht die Abbildung von Papierdokumenten, sondern wie wir die Kommunikation von bestehenden Konventionen weg zu allgemein verständlichen Formaten weiterentwickeln können. Anstatt nach immer neuen Regeln, Normen oder strukturierten Textdateien zu rufen, müssen wir die Applikationen dahingehend entwicklen, dass nicht wir sie, sondern sie uns verstehen. Die Forschung zur künstlichen Intelligenz geht genau in diese Richtung, auch wenn anfänglich noch nicht alles perfekt zu sein scheint. Für Benedict Evans (48), unabhängiger Analyst, geht die eigentliche Kernfrage zur Zukunft der generativen KI in zwei Richtungen. Entweder handelt es sich dabei um ein neues Allzwecktool, bei dem ein Produkt eines Unternehmens die Arbeit von Hunderten von Softwareprogrammen in Hunderten von Unternehmen erledigt, oder es handelt sich um eine generische Technologie, die Funktionen in Produkten von Hunderten oder Tausenden von Unternehmen ermöglicht. Dem Computer muss man sozusagen beibringen, mit diesen Formaten umzugehen wobei beispielsweise auf dem Fachgebiet «Document Recognition» in den letzten 10 Jahren enorme Fortschritte erzielt wurden. Die Forschung hat dabei das semantische maschinelle «Verständnis» von Musikalien, technischen Artikeln (inklusive mathematischer Formeln), Zeitungsseiten oder zuletzt technischen Zeichnungen auf ein Niveau gehoben, das andere Datenformate oder deren Erschliessung für den Computer unnötig machte. «Human-centric Computing», menschzentriertes Computing, sozusagen. Anstatt über die möglichen Jobverluste durch diese Technologie in Panik zu geraten, müssen wir befähigt werden zum effektiven, reflektierten und kompetenten Umgang mit generativen KI-Werkzeugen. Mit unserer Erfahrung und Weisheit leisten wir «Alten» einen wichtigen Beitrag in dieser Entwicklung.
Zur Not auch mit Papier und Bleistift
Der Zauber liegt darin, nicht ein Format zu verteufeln oder als Allheilmittel zu feiern, sondern bei der Publikation – wo immer sinnvoll – mehrere Formate zum Bezug anzubieten. Denn jede Digitalisierung MUSS unstrukturierte Daten verwenden können. Alles in Datenbanken mit Standardformaten etc umzuwandeln ist zwar der feuchte Traum jeder Software Schmiede und Beraters, aber am Thema vorbei. Wir sind ja gerade deshalb so langsam, weil wir immer warten bis sich ein Standard durchgesetzt hat, der dann 1000 mal diskutiert wird und von jeder Behörde in Eigenregie von der eigenen IT für teures Geld umgesetzt wird. Vielmehr sollten wir uns fragen, ob nicht langsam die Zeit gekommen ist, dass die Computer sich unserer Vorgehensweise anpassen, nicht umgekehrt. Papier und wie wir als Menschen denken sollte die Basis bilden, aber natürlich automatisch dank KI so umgewandelt werden, dass wir darauf aufbauende Dienste vollautomatisch und ohne manuelle Korrektur benützen können. Aber zur Not eben auch mit Papier und Bleistift, wenn die Infrastruktur versagt, sei es durch Hacks, Updates oder Stromausfälle.
kompetenz60plus.ch, das Netzwerk von kompetenten «Alten»
kompetenz60plus.ch ist ein Netzwerk von kompetenten Fachleuten. Erfahrene «Alte» unterstützen KMU’s und Start-ups bei der Umsetzung innovativer Ideen und bei Herausforderungen aller Art – auf Augenhöhe. Registrieren Sie Ihre Kompetenz ➔ hier kostenlos oder suchen Sie auf unserem Portal eine Fachperson mit geeigneter Kompetenz. Unkompliziert und zu moderaten Bedingungen. Kontaktieren Sie uns mit Ihren Interessen, Fragen und Anregungen, ganz unverbindlich, per Mail an werner@kompetenz60plus.ch. Danke!
Werner K. Rüegger, dipl. Arch. SIA AIA
Projektadministrator und Initiator

Ein Projekt «von uns. für uns.»
Web: kompetenz60plus.ch | Mail: werner@kompetenz60plus.ch |
Linkedin: kompetenz60plus.ch | facebook: kompetenz60plus
X: wernerkruegger | Instagram: wernerkruegger
