Wählen Sie die Sprache der Netzseite ...
Schriftgröße ändern

Abschlussbericht zur Erfassung der Trauungen der Heider-Register

Nach mehr als achtjähriger Arbeit konnten wir alle Traungen aus den Heider-Registern digitalisieren und in die Heiratsdatenbank der Familia Austria übernehmen. Aus diesem Anlass möchte ich einen zusammenfassenden Überblick über die geleistete Arbeit und einen kurzen Ausblick auf die nächste Aktivität im Rahmen unseres Heider-Projektes geben.

Die Trauungen von 96 Pfarren des Mühlviertels und des inneren Salzkammergutes wurden von Herrn Josef Heider in 107 Büchern auf insgesamt über 18.000 Seiten erfasst. Bei ca. 55 Zeilen je Seite sind das knapp 1 Million Zeilen, auf denen mehr als 206.000 Trauungen, mit über 907.000 Personen und mit Berufen und Orten nach Anfangsbuchstaben geordnet und, mit Schreibmaschine geschrieben, erfasst sind. Eine Beschreibung zum Heider-Index finden Sie unter Die Heider-Register

Das Projekt zur Erfassung dieser Daten in der FA-Heiratsdatenbank haben wir nach einer Machbarkeitsstudie im Mai 2010 begonnen. Obwohl die Struktur der Heiratsregister deutlich komplexer als jene der Taufen- bzw. der Sterberegister ist, haben wir entschieden, mit ihnen zu beginnen, da sie für die Familienforschung besonders wichtig sind. Das Projekt hat sich dann über die Jahre von einfachen Anfängen zu einer sehr komplexen Arbeit entwickelt. So durchliefen alle rund 18.000 Seiten bzw. knapp 1 Million Zeilen 10 verschiedene Verarbeitungsstufen. Der große Aufwand, der für die ordentliche Erfassung der Heider-Register notwendig ist, ist vermutlich nicht allgemein bekannt. Ich möchte daher hier einen Überblick über die durchgeführten Prozesse geben.

  1. Erfassen der Heirats-Register am Scanner im Oberösterreichischen Landesarchiv.
  2. Nachbearbeiten aller digitalisierten Seiten (Bilder): entzerren, zuschneiden, senkrecht ausrichten und mit sprechenden Dateinamen versehen, damit sie mit den Seitennummern der Heider-Register korrelieren.
  3. Automatische Schrifterkennung mit OCR-Programm und manuelle Korrektur von Umwandlungsfehlern. Neu auftauchende Namen und Berufe werden in ein Wörterbuch abgespeichert, damit sie beim nächsten Mal als gültig erkannt wurden. Dadurch entstand ein Verzeichnis von ca. 14.000 Vor- und Familiennamen, Ortsnamen und Berufen.
    Zeichen, bei denen der Erkennungsprozess des OCR-Programmes unsicher ist, werden farblich markiert und können schnell überprüft werden. Leider gibt es aber auch Fälle, bei denen das OCR-Programm keine Unsicherheit anzeigt und Zeichen dennoch falsch erkannt wurden. Manche Fälle sind erklärbar (z.B.: 3 und 8 oder B), manche wiederum völlig rätselhaft wie 31 statt 11. Mit der Zeit bekommt man ein Gefühl für solche Situationen und achtet besonders darauf, auch wenn die Zeichen vom OCR-Programm nicht farblich markiert wurden.
  4. Plausibilitätsprüfung und exakte spaltengerechte Aufteilung der Daten mit selbst entwickelten Programmen (bei langen Namen und Begriffen hat J. Heider aus Platzgründen oft in die Nachbarspalte hineingeschrieben, was korrigiert werden musste). Umwandlungsfehler vom OCR-Prozess, soweit sie nicht schon unter 3. manuell berichtigt wurden, wurden automatisch korrigiert (bei den alten Schreibmaschinen wurden z.B. für die Ziffern 0 und 1 die Buchstaben o und l verwendet). Daten wie Datum, Seitennummer, Buchnummer, Sortierfolge, Übereinstimmung von Dateinamen mit Heider-Registerseite, richtige Anfangsbuchstaben unter Berücksichtigung von Zusätzen wie de, von, etc. waren zu prüfen. Diese Prüfungen mussten mit fortschreitender Projektdauer an immer neue Erfassungsformen der Heider-Register angepasst werden. Als Beispiel sei hier die Seitennummer (pagina) des Originalbuches genannt. Diese kann in den Heider-Registern zur Gänze fehlen, oder in einer eigenen Spalte vor oder nach der Buchbezeichnung (tomus) oder erst in der nächsten Zeile unterhalb von tomus stehen oder in der Spalte der Eltern mit der Bezeichnung Seite oder S. angeführt sein. Alle diese unterschiedlichen Formen tauchten erst im Laufe des Projektfortschrittes auf, was eine ständige Anpassung der Prüfprogramme erforderlich machte. Diese Prüfprogramme mit einigen Hilfsprogrammen zur Manipulation der Daten und Seiten (Blättern, Suchen, Datenänderungen über alle Dateien einer Pfarre, das sind alle Seiten eines Buches) bestehen dzt. aus ca. 2.200 Programmzeilen. Bei meiner Arbeit war ich selbst immer wieder begeistert, wie auf Knopfdruck aus einer teilweise ziemlich ungeordneten Struktur mit in Nachbarspalten hinein laufenden Daten eine saubere und übersichtliche Spaltenaufteilung mit automatisch berichtigten Zeichen entsteht. Auf einer solchermaßen sauber aufbereiteten Buchseite sind Fehler optisch viel besser erkennbar.
    Traten bei der Prüfung Unklarheiten auf, die nicht zweifelsfrei korrigiert werden konnten, wurden sie als Kommentar vermerkt und im nächsten Verarbeitungsschritt aufgearbeitet.
  5. Überprüfung der aufgetauchten Unklarheiten bei den Heider-Registern. Zuerst wurden die zu prüfenden Matrikeleintragungen in die chronologische Reihenfolge der Originalbücher gebracht (sie waren ja zunächst noch nach Anfangsbuchstaben sortiert). Danach wurden die Matrikeleintragungen in den Originalbüchern gesucht und mit den Angaben von Heider verglichen bzw. korrigiert. Bei dieser Tätigkeit konnte ich mich immer nur wundern, wie Josef Heider mit den oft sehr schwer lesbaren Schriften der Originalmatrikeln diese riesige Arbeit bewältigen konnte.
  6. Aufteilung der von J. Heider in einer einzigen Spalte zusammengefassten Daten wie Namen, Beruf und Ort der Eltern oder, bei Witwen, Name, Ort und Beruf des verstorbenen Ehemannes in getrennte Spalten. Dafür hat Dr. Peter Haas ebenfalls eigene Programme mit über 1.300 Zeilen Programmcode entwickelt, und ca. 2.000 Berufe und 1.200 Vornamen gespeichert, um die unterschiedlichen Begriffe zu erkennen und den richtigen Spalten in unserer Heiratsdatenbank zuzuordnen.
  7. Manuelle Kontrolle des bisherigen Ergebnisses durch zeilenweisen Vergleich mit den Heider-Registern. Dazu konnten insgesamt 38 freiwillige Helfer, vorwiegend aus dem Raum OÖ gewonnen werden. Diese Prüfung war ein ganz wichtiger Prozessschritt, um eine hohe Qualität der Daten sicher zu stellen. Die neun fleißigsten Nachleser, die inkl. mit mir 74 % der Daten geprüft haben, möchte ich hier mit deren Erlaubnis in alphabetischer Reihenfolge anführen:

    * Doppelbauer August
    * Hauer Wolfgang 
    * Jarosch Robert, Ing.
    * Katzensteiner Günther
    * Kickinger Nadja
    * Lang Erich
    * Miesbauer Edwin, DI.
    * Pögl Franz 
    * Pribas Gerald, Mag.

    Mein besonderer Dank gilt aber auch jenen, die unter schwierigen persönlichen Umständen diese Arbeit auf sich genommen haben.

  8. Einarbeiten der Korrekturen und Zusammenführung der paarweisen Registereintragungen in eine einzelne Datenbankzeile mit ebenfalls von Dr. Peter Haas entwickelten Programmen. Dabei waren oft manuelle Eingriffe erforderlich, wenn z.B. statt der paarweisen Eintragungen drei Eintragungen je Brautpaar vorkamen oder nur eine Eintragung.
  9. Ergänzung der Daten mit Kronland, Staat, Buchtyp und Endkontrolle und in die für die Einspeisung in die Datenbank erforderliche Struktur bringen durch Frau Claudia Weck. Frau Claudia Weck ist für die Einspeisung in die verschiedenen Datenbanken zuständig. Dafür werden Daten aus unterschiedlichen Quellen und Archiven und damit in unterschiedlichen Formaten geliefert und müssen daher in unsere "Norm" gebracht und mit Zusatzinformationen versehen werden.
  10. Übernahme der Daten in die Heiratsdatenbank auf einen externen Server und damit Verfügbarmachung für die Öffentlichkeit.

Mit diesen Prozessen und den ausgefeilten Prüfprogrammen konnten wir eine hohe Datengenauigkeit erreichen, was unser oberstes Ziel war. Fehler und Unklarheiten in den Heider-Registern konnten dabei bereinigt werden. Wir können hoffen, dass sich die Anzahl der Fehler, die uns trotzdem unterlaufen sind oder nicht entdeckt wurden, durch die Berichtigungen der Heider-Registerdaten in etwa die Waage hält. Dzt. machen die Traungen der Heider-Register etwa ein Drittel aller Trauungen in der Heiratsdatenbank des Vereins der Familia Austria aus.

Die Digitalisierung der Heider-Register erfolgte für die Heiraten ausschließlich auf den Scannern des OÖ Landesarchivs. So oft wie möglich benutzte ich für die Hin- und Rückfahrt mein Fahrrad und ich schätze, dass ich dabei 1.000 bis 1.500 km zurückgelegt habe. Genaue Aufzeichnungen habe ich darüber nicht geführt. Mangels Aufzeichnungen ist auch der zeitliche Aufwand von Dr. Peter Haas und mir kaum abschätzbar. In meinem Fall waren es mehrere tausend Stunden.

Für den geordneten Ablauf des Projektes sorgte unser Präsident Günter Ofner. Herr Günter Ofner hat die rechtliche Vereinbarung mit dem Oberösterreichischen Landesarchiv getroffen, Nachleser gefunden und motiviert, die Zuteilung der zu prüfenden Dateien an die Nachleser vorgenommen und durch periodisches Nachfragen für eine zeitgerechte Rückmeldung geholfen. Ihm ist auch die Verleihung der Verdienstmedaille des Landes Oberösterreich durch Herrn Landeshauptmann Mag. Thomas Stelzer an Dr. Peter Haas und an mich zu verdanken, was für uns und unsere Angehörigen ein ganz besonders würdevolles Erlebnis im Linzer Landhaus war.

Verleihung der Verdienstmedaille des Landes OÖ an Dr. Peter Haas und Ing. Sepp Asanger
durch Landeshauptmann Mag. Thomas Stelzer im Steinernen Saal des Linzer Landhauses

Meinen Teil der Hochzeiten (bis inkl. Prozess 5.) habe ich im Mai 2016 abgeschlossen. Nach längerer Verschnaufpause habe ich mich den Taufen zugewandt. Dafür mussten und müssen noch immer die Prüfprogramme adaptiert werden, aber dieser Teil des Heider-Projektes hat nicht mehr die Komplexität der Heiraten und entsprechen weniger Verarbeitungsprozesse. Es ist daher zu hoffen, dass die Erfassung der Taufen trotz der erheblich größeren Datenmenge in einem ähnlichen zeitlichen Rahmen abgewickelt werden kann. Dzt. sind ca. 11% der Taufen bis zur weiteren Verarbeitung durch Dr. Peter Haas (ab Stufe 6.) fertig.

Das Scannen der original gebundenen Bücher mit den mittlerweile neuen Scannern im OÖLA ist leider extrem schwierig und führt bei den meist etwas gewölbten Buchseiten zu starken Verzerrungen, wodurch sie für den OCR-Prozess nicht mehr geeignet sind. Auf Anregung von Herrn Josef Weichenberger vom OÖLA werden die neu mit einem U-Profil aus Metall geklemmten Bücher wieder geöffnet, sodass die Buchseiten einzeln zum Einscannen vorliegen. Damit kann ich sie daheim auf meinem Flachbettscanner sehr bequem und wesentlich genauer einscannen. Das ist für mich eine enorme Arbeitsvereinfachung zumindest für die neu gebundenen Bücher, die nicht ganz die Hälfte der Taufregister ausmachen. Für dieses Entgegenkommen und ganz allgemein für die gute Zusammenarbeit mit dem OÖLA möchte ich hier ebenfalls danken. Herr Weichenberger teilte mir mit, wie sehr ihm der Zugriff auf unsere Datenbanken die Arbeit erleichtert, wenn externe Anfragen an des OÖLA gestellt werden.

Wegen des fast doppelten Umfanges der Taufregister mit über 33.000 Seiten werden die Ergebnisse der OCR Erkennung und unserer Prüfungen dzt. nicht mehr manuell durch freiwillige Nachleser geprüft. Sollten sich jedoch Personen bereitfinden, einzelne Pfarren zur manuellen Prüfung zu übernehmen, haben wir Vorsorge getroffen, dass dies auch dann möglich ist, wenn die Daten der Taufregister bereits in der FA Datenbank gespeichert sind. Es wird möglich sein, die Registerdaten je Buch sowohl in der Reihenfolge der Anfangsbuchstaben lt. Heider-Register und als auch chronologisch wie in den Originalbüchern zur Verfügung zu stellen. Damit könnten Nachleser die Daten entweder seitenweise mit den Heider-Registern vergleichen, oder chronologisch mit den Originalmatrikeln in matricula im Internet.

Die in unseren Datenbanken erfassten Heider-Register bieten noch Raum für zukünftige Ergänzungen:

  • Es wäre z.B. sehr hilfreich, bei den Matrikeln die Buchseiten der Originalbücher nachzutragen (sofern diese nummeriert wurden), da sie bei Heider oft fehlen.
  • Bei den nach Ortsteilen geführten Matrikelbüchern hat Josef Heider die Namen des Ortsteiles nicht erfasst. Wenn dann auch noch die Seitennummer des Matrikelbuches fehlt, erschwert das das Auffinden einer Eintragung im Originalbuch ganz erheblich, da man in aller Regel den Ortsteil nicht weiß, in dem eine Person, nach der man sucht, wohnte. Das Nachtragen der Ortsteile würde hier Abhilfe schaffen.
  • Da J. Heider die Namen vielfach der späteren Schreibweise angepasst hat, scheinen bei ihm die zugegebenermaßen oft abenteuerlichen originalen Schreibvarianten meistens nicht auf. Diese könnten zusätzlich erfasst werden, was beim Suchen in der Datenbank zu besseren Suchergebnissen führen würde. Alternativ könnte eine Automatik implementiert werden, die beim Suchen vordefinierte Variantennamen berücksichtigt.

Diese Punkte können Anregung sein für die Zeit „danach“ oder für Personen, die einen Beitrag zu unseren Datenbanken leisten wollen. Für uns als das Heider-Team hat die Weiterführung des Projektes mit den Tauf- und Sterberegistern Vorrang. Der Wert der Datenbank hängt neben der Qualität ganz wesentlich von seiner Vollständigkeit ab.

Ich möchte mich bei allen, die durch ihre freiwillige und unentgeltliche Arbeit zum erfolgreichen Abschluss dieses Teilprojektes beigetragen haben, ganz herzlich bedanken.

Linz im Februar 2019
Ing. Sepp Asanger