ARDOS PDF2XML
Legacy Data – ein beherrschbarer Albtraum
Ein riesiger Vorteil in der Luftfahrt sind sicherlich Flugzeugprogramme, die mehr als 40 Jahre laufen. Was für Verkäufer, Produktion, Ersatzteilwesen, Material-Support usw. ein Segen ist, bedeutet im Bereich der Pflege der Technischen Dokumentation aber oft einen "Albtraum"! Oftmals wurde die Technische Dokumentation vor zig Jahren bereits erstellt und seit der Erstellung ist viel passiert. Betriebssysteme haben sich mehrfach geändert, die Textverarbeitungssoftware gibt es entweder gar nicht mehr oder die damalige Version ist inkompatibel mit der aktuellen Version dieser Textverarbeitungssoftware, Source-Informationen können nicht mehr verarbeitet werden etc. Alles gute Gründe, die Dokumentation endlich auf das plattformunabhängige und revisionssichere XML-/SGML-Format umzustellen. Sicherlich werden neben den Produktions- und Ersatzteilthemen kaum Rückstellungen oder Budgets für solche alten Themen vorgehalten. Insofern ergibt sich immer der Bedarf einer auf minimalste Kosten ausgerichteten Migration solcher Legacy-Daten. Damit scheiden eine neuerliche Erstellung dieser Dokumentation oder eine Forschungsaufgabe a la „mit welcher Software kann ich denn nun meine Rohdaten aus dem Jahre xy bearbeiten“ definitiv aus. Auch uns begleitet seit Beginn unserer Dienstleistungsaktivitäten diese Migrations-Problematik, weshalb unser Software-Modul ARDOS PDF2XML entstanden ist.
Mit dem ARDOS PDF2XML-Modul haben wir eine einheitliche Schnittstelle geschaffen, um diese Legacy-Daten generisch von PDF in strukturierte Dokumentation – in unserem Fall sind dies ARDOS Author-XML kompatible Inhalte – zu wandeln. Zwar können wir im Prozess aus den PDF-Dokumenten nie ganz 100% der Struktur "retten" und es bedarf immer einer gewissen Nacharbeit dieser Migration. Aber immerhin erreichen wir eine Einsparung zwischen 60 und 90% gegenüber "klassischen" bzw. "satzweisen" Copy&Paste-Mechanismen. Sämtliche textuellen Inhalte befinden sich bereits in den vorgesehenen Elementen und ein Großteil der Struktur ist ebenfalls ordnungsgemäß organisiert. Ein Grund für unsere vage Einschätzung liegt immer in der Güte der vorliegenden Dokumentation, die in der Vergangenheit noch nicht in XML/SGML geschrieben wurde und somit ATA iSpec-Regeln/-Strukturen unterschiedlich gut umsetzt.
Die folgenden Videos zeigen die Arbeitsweise unseres ARDOS PDF2XML-Moduls. Selbst schwierige und nicht kopierbare Texte können damit migriert werden.