Last Updated on 14. Januar 2026 by Dein Coach
Praxisanleitung: PDF → Word → strukturierte Excel-Tabelle
In der Ahnenforschung begegnet man früher oder später einem Klassiker:
Ein umfangreicher Stammbaum liegt nur als PDF oder Textsammlung vor – oft nach Orten gegliedert, mit Einrückungen, Punkten, Kommentaren, aber ohne echte Tabellenstruktur.
Direkter Import in ein Ahnenprogramm ist damit unmöglich.
Dieser Artikel beschreibt einen bewährten, realistisch funktionierenden Workflow, der sich in der Praxis als stabil erwiesen hat.
1. Ausgangslage: Was solche Dokumente wirklich sind (und was nicht)
Viele dieser „Stammbäume“ sind technisch gesehen:
- Textuelle Familiensammlungen, keine Datenbanken
- nach Orten oder Linien gegliedert
- mit visueller Hierarchie (Punkte, Einrückungen, Absätze)
- mit Mischinhalten:
- Personen
- Ehepartner
- uneheliche Beziehungen
- Kommentare („keine Kinder“, „im Krieg gefallen“, „?“)
👉 Wichtig:
Das ist kein Tabellenproblem, sondern ein Strukturproblem.
2. Schritt 1: PDF → Word (sauber, nicht perfekt)
Für die erste Umwandlung hat sich bewährt:
Tool
- PDF24 (oder vergleichbares Offline-Tool)
Ziel
- Lesbarer Fließtext, nicht „schöne Formatierung“
- Absätze und Einrückungen sollen erhalten bleiben
- Tabellen, Schriftarten, Seitenlayout sind egal
Typische Fehler (normal!)
- Zeilenumbrüche an falschen Stellen
- Uneinheitliche Leerzeichen
- Sonderzeichen (*, †, geb., oo) uneinheitlich
👉 Nicht reparieren!
Diese Unschärfen sind später für GPT sogar hilfreich, um Muster zu erkennen.
3. Schritt 2: Word-Dokument bewusst nicht „aufräumen“
Ein häufiger Fehler ist, das Word-Dokument vorab zu stark zu glätten.
Nicht tun:
- Punkte entfernen
- Einrückungen vereinheitlichen
- Ehe-Zeilen mit Personen zusammenziehen
Denn:
- Punkte und Einrückungen = versteckte Daten
- sie enthalten die Generationslogik
Merksatz:
„Was für Menschen unsauber aussieht, ist für Strukturmodelle oft Gold.“
4. Schritt 3: Denkmodell vor der KI-Umwandlung (entscheidend)
Bevor GPT eingesetzt wird, muss klar sein:
Was soll entstehen?
Nicht „eine Excel-Tabelle“, sondern:
- eine normierte Personentabelle
- mit eindeutigen IDs
- mit Eltern-Kind-Beziehungen
- mit Partnern als eigene Datensätze
Ohne dieses Ziel produziert GPT zwar Tabellen – aber keine importierbaren Daten.
5. Bewährte Tabellenstruktur (Minimal-Standard)
Diese Felder haben sich in der Praxis bewährt:
| Feld | Zweck |
|---|---|
| ID | Eindeutig, maschinenlesbar |
| Aboville | Nachkommen-Nummerierung |
| Eltern_Aboville | Elternbezug |
| Rolle | Person / Ehepartner / Partner |
| Vorname(n) | getrennt |
| Nachname | aktuell |
| Geburtsname | „geb.“ |
| Geburt_Datum_roh | inkl. „ca.“, „um“, „März 1890“ |
| Geburt_Ort | roh |
| Tod_Datum_roh | roh |
| Tod_Ort | roh |
| Beruf/Status | alles nach Komma |
| Notiz | Kommentare |
| Sektion/Ort | Herkunft aus Dokument |
| Quelle | Dokumentname |
👉 Wichtig:
Datums-„Rohfelder“ bewusst nicht normalisieren – Ahnenprogramme können das später besser als Excel.
6. GPT richtig einsetzen: Was die KI gut kann (und was nicht)
GPT kann sehr gut:
- Hierarchien aus Einrückungen erkennen
- Ehe- und Kindbeziehungen trennen
- Namensbestandteile isolieren
- strukturierte Tabellen erzeugen
GPT kann nicht zuverlässig:
- historische Personen eindeutig identifizieren
- gleiche Namen automatisch zusammenführen
- unklare Beziehungen korrekt raten
👉 Deshalb:
GPT strukturiert – du entscheidest.
7. Funktionaler Prompt für Word → Excel (bewährt)
Der folgende Prompt ist absichtlich technisch und eindeutig formuliert.
Er zielt nicht auf „schöne Texte“, sondern auf Datenstruktur.
🔧 Beispiel-Prompt
Du erhältst ein genealogisches Word-Dokument mit Personenangaben, Einrückungen und Punktnotationen.
Aufgabe:
Wandle den Text in eine strukturierte Tabelle um.Regeln:
- Jede Person erhält eine eigene Zeile.
- Verwende Aboville-Nummerierung für Nachkommen, abgeleitet aus Einrückungen und Punktnotationen.
- Ehepartner und Partner sind eigene Datensätze, keine Felder.
- „oo“ = Ehe, „nicht oo“ = Partnerschaft ohne Ehe.
- „geb.“ ist der Geburtsname.
- Inhalte in Klammern (*, †, Taufe) werden in separate Rohfelder zerlegt.
- Datumsangaben nicht normalisieren, sondern als Text übernehmen.
- Kommentare wie „keine Kinder“, „im Krieg gefallen“ kommen ins Feld „Notiz“.
- Ortsüberschriften werden als Feld Sektion/Ort gespeichert.
Ausgabe:
Eine Tabelle mit folgenden Spalten:
ID, Aboville, Eltern_Aboville, Rolle, Vorname(n), Nachname, Geburtsname,
Geburt_Datum_roh, Geburt_Ort, Tod_Datum_roh, Tod_Ort,
Beruf/Status, Notiz, Sektion/Ort, Quelle.Verwende eindeutige IDs. Keine Interpretation fehlender Daten.
8. Fazit (ehrlich)
Dieser Workflow ersetzt keine Forschung.
Aber er:
- rettet historisches Material aus unbrauchbaren Formaten
- macht alte Sammlungen wieder bearbeitbar
- schafft eine saubere Grundlage für Ahnenblatt & Co.
Oder anders gesagt:
Ordnung ist keine Magie – sondern Vorarbeit.
Zur Arbeitsweise:
Ausgangspunkt war ein konkretes Praxisproblem, das ich im Dialog mit KI gelöst habe; die strukturierte Ausformulierung dieses Artikels erfolgte ebenfalls mit Unterstützung der KI und wurde veröffentlicht, damit auch andere davon profitieren können.
Hier geht es weiter:
Dann hier:
Einleitung zum Thema hier:
