Benutzerhandbuch

Reguläre Ausdrücke für das Extrahieren von Metadaten

Aktualisiert am

Erfahren Sie in diesem Artikel,

  • welche Regulären Ausdrücke beim Extrahieren von Informationen aus Dateinamen sinnvoll sind und
  • wie diese für verschiedene Beispiele ausgestattet sein sollen.

1. Einführung

Reguläre Ausdrücke können verwendet werden, um Metadaten direkt aus dem Dateinamen zu übernehmen. Enthält der Dateiname wiederkehrende Informationen, wie etwa Dimensionen, die Anzahl der Kopien oder den Anschnitt, können diese Werte automatisch erkannt und in die Metadaten des Motivs übernommen werden. Die extrahierten Informationen stehen anschließend an den entsprechenden Stellen in der Anwendung zur weiteren Verarbeitung bereit.

2. Suchen und Extrahieren

Wie überall gibt es auch bei Regulären Ausdrücken viele Wege, um an das Ziel zu gelangen. Hier finden Sie Beispiele, wie Sie Reguläre Ausdrücke zum Extrahieren von Metadaten definieren können.

Beispiel 1

Struktur des Dateinamens: Craft Beer Magenta 400x1000mm_#2000_B2

Folgende Informationen sind in diesem Dateinamen zu finden:

  • Die Datei hat eine Breite von 400 mm.
  • Die Datei hat eine Höhe von 1000 mm.
  • Von der Druckdatei sollen 2000 Kopien erstellt werden.
  • Die Datei soll einen Anschnitt von 2 mm haben.

Folgende Reguläre Ausdrücke können definiert werden, um das richtige Ergebnis zu erzielen:

\d{2,3}(?=x) – Suche nach der Breite des Motivs:

  • zwei- bis dreistellige Ziffern, die sich
  • vor einem x befinden.

\d{2,5}(?=m) – Suche nach der Höhe des Motivs:

  • zwei- bis fünfstellige Ziffern, die sich
  • sich vor einem m befinden.

(?<=#)\d{2,5} – Suche nach der Anzahl an Kopien:

  • zwei- bis fünfstellige Ziffern, die sich
  • nach einem # befinden.

(?<=B)\d{1,2} – Suche nach dem Anschnitt:

  • ein- bis zweistellige Ziffern, die sich
  • nach einem B befinden.

Beispiel 2

Struktur des Dateinamens: Filename_210x297mm_#200_P2_B5mm

Folgende Informationen sind in diesem Dateinamen zu finden:

  • »Filename« beschreibt den Dateinamen
  • Die Datei hat eine Breite von 210 mm.
  • Die Datei hat eine Höhe von 297 mm.
  • Von der Druckdatei sollten 200 Kopien erstellt werden.
  • Die Datei hat zwei Seiten.
  • Die Datei soll einen Anschnitt von 5 mm haben.

Folgende Reguläre Ausdrücke können definiert werden, um das richtige Ergebnis zu erzielen:

^[^_]+ – Suche nach dem Dateinamen

  • befindet sich am Beginn einer Zeichenkette,
  • enthält ein Zeichen außer einem Unterstrich (also bis zum ersten Unterstrich) und
  • kann aus einem oder mehreren Zeichen bestehen.

(?=_)\d{2,4} – Suche nach der Breite des Motivs:

  • zwei- bis vierstellige Ziffern, die sich
  • nach einem _ befinden.

(?=x)\d{2,5}(?=m) – Suche nach der Höhe des Motivs:

  • zwei- bis fünfstellige Ziffern, die sich
  • nach einem x sowie
  • vor einem m befinden.

(?=P)\d{1,4} – Suche nach der Seitenanzahl des Motivs:

  • ein- bis vierstellige Ziffern, die sich
  • nach einem P befinden.

(?=#)\d{2,5}(?=_) – Suche nach der Anzahl an Kopien:

  • zwei- bis fünfstellige Ziffern, die sich
  • nach einem # und
  • vor einem _ befinden.

(?=B)\d{1,4}(?=m) – Suche nach dem Erwarteten Anschnitt:

  • ein- bis vierstellige Ziffern, die sich
  • nach einem B und
  • vor einem m befinden.

Beispiel 3

Struktur des Dateinamens: 100100_210x297mm_#500_P5_B3mm_filename

Folgende Informationen sind in diesem Dateinamen zu finden:

  • Die Auftragsnummer, die als »Externe ID« geführt werden soll.
  • Die Datei hat eine Breite von 210 mm.
  • Die Datei hat eine Höhe von 297 mm.
  • Von der Druckdatei sollten 500 Kopien erstellt werden.
  • Die Datei hat fünf Seiten.
  • Die Datei soll einen Anschnitt von 3 mm haben.
  • Der Dateiname, der zur eindeutigen Kennzeichnung der Auftragsposition geführt werden soll.

^\d+ – Suche nach der Externen ID:

  • eine beliebige Ziffer, die
  • aus einer oder mehreren Stellen bestehen kann und
  • sich am Anfang der Zeichenkette befindet.

(?=_B)\d+ – Suche nach dem Erwarteten Anschnitt:

  • beliebige Ziffern, die
  • einmal oder mehrmals vorkommen können und
  • sich nach einem B befinden.

(?=_#)\d+ – Suche nach der Anzahl an Kopien:

  • beliebige Ziffern, die
  • einmal oder mehrmals vorkommen können und
  • die sich nach einem # befinden.

(?=_)\d+(?=x) – Suche nach der Breite des Motivs:

  • beliebige Ziffern, die
  • einmal oder mehrmals vorkommen können, die sich
  • nach einem _ und
  • vor einem x befinden.

(?=x)\d+(?=mm) – Suche nach der Höhe des Motivs:

  • beliebige Ziffern, die
  • einmal oder mehrmals vorkommen können, die sich
  • nach einem x und
  • vor einem mm befinden.

[^_]+$ – Suche nach dem Dateinamen:

  • beliebige Anzahl von Zeichen außer einem _ (also ab dem letzten Unterstrich), die sich
  • am Ende einer Zeichenkette befinden.

Artikel Update: Workflow 1.21.1 – 09/2025

Vorheriger Artikel Reguläre Ausdrücke für Korrekturen
Noch Fragen? Kontaktieren Sie uns!