Grundlagen des Annotationsfensters

Annotate Data for Object Detection

Erster Blick

Sie benötigen einen Computer mit einer Nvidia GPU, müssen CUDA, CUDNN installiert haben und das Fenster Module Downloader Window verwenden, um das AI-Bundle zu installieren.

Das Image Annotation Window von AugeLab Studio ermöglicht es, Bilder zu annotieren, indem Begrenzungsrahmen um Objekte gezeichnet und diesen spezifische Klassen zugewiesen werden.

Erste Schritte

Um das Image Annotation Window zu öffnen, navigieren Sie im oberen Menü zu AI Tools ➡️ Image Annotation.

Für die Bildannotation benötigen Sie zwei Dinge:

  1. Eine .class-Datei (Klassen-Datei)

  2. Einen Dataset-Ordner

Class File

Zum Beschriften Ihrer Daten benötigen Sie zunächst eine classes.names-Datei, eine einfache Textdatei mit der Endung .names. Eine normale Klassen-Datei sieht z. B. so aus:

Wenn Sie noch keine solche Datei haben, können Sie Ihre eigene über den Bereich Classes erstellen:

So erstellen Sie Ihre eigene Klassen-Datei:

  1. Geben Sie einen Klassennamen ein.

  2. Klicken Sie auf +, um die Klasse hinzuzufügen.

  3. Klicken Sie auf Save Classes (dritter Button) — danach können Sie einen Ordner auswählen.

Sie können - klicken, um unerwünschte Klassen zu entfernen.

Bildordner laden

Klicken Sie oben auf Open Folder und wählen Sie den Ordner, der alle Ihre Bilder enthält:

Nach dem Klick auf Open Folder öffnet sich ein Dialog, in dem Sie einen Ordner und eine Klassen-Datei auswählen:

Bild aus Liste auswählen: Nach dem Laden des Bildordners wird eine Liste der verfügbaren Bilder angezeigt. Klicken Sie auf ein Bild, um es für die Annotation auszuwählen.

Bilder annotieren

Das Annotieren von Bildern ist sehr einfach. Klicken Sie oben links an der gewünsch­ten Stelle des Objekts, ziehen Sie die Maus und lassen Sie los, wenn Sie fertig sind!

Annotation Window

Begrenzungsrahmen sollten eng um das Objekt liegen und nicht zu viel Hintergrund einschließen. Das hilft dem Modell, sich auf die relevanten Merkmale zu konzentrieren.

Verwendung des Dataset-Panel

Das Dataset-Panel bietet mehrere Funktionen:

  1. Filter-Funktion, mit der Sie Bilder nach Klassen filtern können:

    • All — Alle Bilder, mit und ohne Annotation.

    • Annotated — Bilder, die Annotationen haben.

    • Empty — Bilder ohne Annotationen, werden aber im Training berücksichtigt. Das bedeutet, nicht annotierte Objekte können das Training negativ beeinflussen.

    • Excluded — Bilder ohne Annotation-Datei; diese beeinflussen das Training überhaupt nicht.

  2. Search-Funktion zum Filtern von Bildern anhand ihrer Namen.

Videos annotieren

Sie können auch Videodateien annotieren, indem Sie oben im Fenster den Modus Video wählen:

Beim Wechsel in den Videomodus werden Sie nach einem Dateipfad gefragt. Nach Auswahl der Videodatei können Sie das Video wie einen Ordner annotieren!

Tools

Es gibt mehrere Werkzeuge im Annotation Tool, die Sie bei der Vorbereitung Ihres Datensatzes unterstützen:

Class Frequency Analysis

Klicken Sie auf Class Frequency Analysis, um zu analysieren und anzuzeigen, wie viele Vorkommen jeder Klasse in Ihrem Dataset vorhanden sind.

Das ist nützlich, um zu prüfen, ob Ihr Dataset ausgeglichen ist.

Augment Dataset

AugeLab Studio wendet automatisch Dataset-Augmentationen an. Augmentation ist der Prozess, künstlich ähnliche Daten zu erzeugen.

Dieses Thema wird ausführlich auf der Seite Augmenting Your Dataset behandelt.

🛠️ Troubleshooting AI Vision

Wenn Ihre AI-Modelle nicht wie erwartet arbeiten, verwenden Sie diese Schnelltipps, um die Leistung zu optimieren.

🚫 "It annotates nothing" (Keine Erkennungen)

Wenn die AI zu "schüchtern" ist, liegt das meist an Schwellenwerten oder Beschreibungstexten.

  • Lower Confidence: Verringern Sie den Confidence Threshold leicht.

  • Text Sensitivity: Bei Grounding DINO verringern Sie den Text Threshold, damit Wortübereinstimmungen weniger streng geprüft werden.

  • Seien Sie spezifisch: Statt "part" besser "silver metal bolt" oder "red plastic cap" verwenden. Beschreibungen sollten visuell sein.

  • Listen prüfen: Stellen Sie sicher, dass Ihre Klassenliste in den Node-Einstellungen geladen ist und nicht leer ist.

📦 "Too many wrong boxes" (Falsche Erkennungen)

Wenn der Bildschirm mit False Positives überfüllt ist, müssen Sie die Strenge erhöhen.

  • Raise Confidence: Erhöhen Sie den Confidence Threshold, um unsichere Treffer zu filtern.

  • Text Strictness: Erhöhen Sie den Text Threshold, um eine engere Übereinstimmung zwischen Bild und Prompt zu erzwingen.

  • Ambiguität reduzieren: Vermeiden Sie allgemeine Prompts wie "object" oder "item". Beschreiben Sie Farben oder Texturen deutlicher, wenn Schatten fälschlich als Teile erkannt werden.

❓ "YOLO model doesn't detect my class"

Standard-YOLO-Modelle sind auf bestimmte Datensätze vortrainiert.

  • COCO Standard: Basale YOLO-Modelle erkennen nur die 80 COCO-Kategorien. Ihre Labels müssen exakt übereinstimmen (z. B. person, cell phone, chair, bottle).

  • Spezielle Anforderungen: Wenn Sie etwas Spezifisches erkennen müssen (z. B. "scratched circuit board"), verwenden Sie ein Text-Prompt-Modell wie Grounding DINO oder trainieren Sie ein Custom YOLO-Modell.

🐌 "Processing is slow or laggy"

Vision-Modelle sind rechenintensiv.

  • Erstlauf-Verzögerung: Beim ersten Start kann es langsam sein, da Modelle heruntergeladen und im Speicher initialisiert werden.

  • Modellgröße: Grounding DINO Base und OWLv2 Large sind genau, aber "schwer". Probieren Sie eine "Tiny" oder "Small" Variante für mehr Geschwindigkeit.

  • Hardware: Stellen Sie sicher, dass AugeLab Ihre GPU verwendet. Große Modelle auf der CPU verursachen erhebliche Latenz.


💡 Noch Probleme?

Probieren Sie den AI Assistant in AugeLab Studio. Beschreiben Sie Ihre Kameraperspektive und wie die Boxen aktuell aussehen — oft schlägt er exakte Dezimalwerte für Ihre Schwellen vor.

Möchten Sie, dass ich ein "Threshold Cheat Sheet" erstelle, das genau erklärt, was Confidence vs. Text Threshold bewirken? (siehe: ./augment-dataset.md).

Preprocess Image

Das Preprocess Image-Tool ermöglicht es, Kontrast, Helligkeit und Gamma der im Fenster angezeigten Bilder anzupassen. Diese Funktion ist hilfreich bei sehr dunklen oder zu hellen Bildern.

Change Class Id

Das Tool Change Class Id erlaubt es, alle annotierten Instanzen einer Klasse in eine andere Klasse zu überführen.

Dieses Werkzeug ist nützlich beim Zusammenführen zweier unterschiedlicher Datasets.

Shortcuts and Help

Für Tastenkürzel und Hilfe klicken Sie auf die `Help`-Schaltfläche im oberen Menü.
  • D: Nächstes Bild oder Frame anzeigen.

  • A: Vorheriges Bild oder Frame anzeigen.

  • Shift + D: Um 10 Bilder/Frames vorwärts springen.

  • Shift + A: Um 10 Bilder/Frames rückwärts springen.

  • W: Klassenauswahl dekrementieren.

  • S: Klassenauswahl inkrementieren.

  • Shift + W: Klassenauswahl um 3 dekrementieren.

  • Shift + S: Klassenauswahl um 3 inkrementieren.

  • X: Letzte Bounding-Box entfernen.

  • Shift + C: Alle Annotationen löschen.

  • O: Leere Annotation-Datei hinzufügen oder Annotationen löschen.

  • P: Annotationen entfernen und Datei leeren.

  • M: Bild verschieben oder ausschließen (nur Folder Mode).

  • Shift + Delete: Bild und Annotation vom Computer entfernen (nur Folder Mode).

Training With Custom AI Object Detection Model

Zum Trainieren eines benutzerdefinierten Objekterkennungsmodells siehe bitte Object Detection Train.

Zuletzt aktualisiert

War das hilfreich?