Object Detection (D-FINE)

Dieser Funktionsblock führt eine Echtzeit-Objekterkennung auf Bildern mit einem konfigurierbaren D-FINE-Modell durch. Er ist für einfache visuelle Prüfungen und das Filtern erkannter Objekte ausgelegt und lässt Sie Geschwindigkeit und Genauigkeit über einfache UI-Steuerelemente ausbalancieren.

📥 Eingänge (sockets)

Image Das Bild, das Sie analysieren möchten. Akzeptiert Farbbilder oder Graustufenbilder.

📤 Ausgänge (sockets)

Result Annotiertes Bild mit Begrenzungsrahmen und Labels (wenn Draw Boxes aktiviert ist).

Boxes Liste der Bounding-Box-Koordinaten für jede Erkennung (Format: [x1,y1,x2,y2]).

Labels Liste der erkannten Klassennamen für jede Erkennung.

Scores Liste der Vertrauenswerte für jede Erkennung.

🕹️ Steuerungen

Model Wählen Sie die Modellgröße von D-FINE. Die Optionen tauschen Geschwindigkeit gegen Genauigkeit (z. B. Nano — am schnellsten, Small — ausgewogen, XLarge — höchste Genauigkeit).

Select Classes Wählen Sie die Objektklassen aus, die beibehalten werden sollen. Wenn keine ausgewählt sind, meldet der Block alle erkannten Klassen.

Draw Boxes Schaltet die Visualisierung der Bounding-Boxen und Labels im Ausgabebild ein/aus.

Score Thresh Legt die Konfidenzschwelle (0–100) fest, mit der Erkennungen gefiltert werden. Höhere Werte reduzieren schwache Erkennungen.

🎯 Funktionen

Verschiedene Modellgrößen für die Feinabstimmung von Geschwindigkeit und Genauigkeit über die Model-Einstellung.
Klassenfilterung, damit Sie nur Ergebnisse für die relevanten Klassen erhalten.
Optionale On-Image-Visualisierung über Draw Boxes mit klar farbkodierten Rahmen und Labels.
Ausgänge liefern sowohl visuelles Feedback (Result) als auch strukturierte Daten (Boxes, Labels, Scores) für die Weiterverarbeitung.

📝 So verwenden Sie es

Geben Sie ein Bild in den Image-Socket.
Wählen Sie ein Modell über Model, je nach Leistungsanforderung.
Optional: Wählen Sie über Select Classes bestimmte Klassen aus, um irrelevante Erkennungen zu reduzieren.
Stellen Sie Score Thresh ein, um Erkennungen mit zu geringer Konfidenz herauszufiltern.
Aktivieren Sie Draw Boxes, wenn Sie eine visuelle Vorschau im Result-Ausgang möchten.
Verwenden Sie die Ausgänge (Boxes, Labels, Scores), um weitere Logik oder Protokollierung zu steuern.

📊 Was passiert, wenn es ausgeführt wird

Beim Ausführen analysiert der Block das eingehende Bild und liefert: ein optional annotiertes Vorschaubild (Result), eine Liste von Bounding-Boxen (Boxes), die zugehörigen Klassennamen (Labels) und Konfidenzwerte (Scores), gefiltert nach gewählter Schwelle und ausgewählten Klassen.

💡 Tipps und Tricks

Zur visuellen Prüfung verbinden Sie den Result-Ausgang mit dem Show Image-Block, um Erkennungen in einem größeren Viewer anzusehen.
Bei sehr großen Eingabebildern fügen Sie vorab einen Image Resizer-Block ein, um die Inferenz zu beschleunigen und den Speicherbedarf zu senken.
Für kleine oder weit entfernte Objekte wählen Sie höhere Genauigkeitsmodelle über Model, beachten Sie jedoch langsamere Verarbeitung. Für Live- oder niedrige Latenz-Anwendungen bevorzugen Sie schnellere Modelle wie Nano oder Small.
Um die Erkennung auf einen Bereich zu konzentrieren, schneiden Sie das Eingabebild mit Image ROI Select oder Image ROI zu. Das reduziert Fehlalarme und beschleunigt die Erkennung.
Wenn Sie Erkennungen über mehrere Frames verfolgen möchten, senden Sie Boxes / Labels an Object_Detection_Tracker, um stabile IDs und Tracking-Historie zu erhalten.
Für klarere Visualisierungen oder Audit-Zwecke routen Sie Result in Draw Detections oder in Image Logger / Image Write, um annotierte Frames zu speichern.
Kombinieren Sie vorverarbeitende Blöcke wie Image Resizer, Blur oder Contrast, um die Stabilität der Erkennung bei schwierigen Lichtverhältnissen oder Rauschen zu verbessern.

🛠️ Fehlerbehebung

Keine Erkennungen: Verringern Sie Score Thresh leicht und stellen Sie sicher, dass die gewünschte Klasse in Select Classes enthalten ist. Überprüfen Sie außerdem, ob das Eingabebild klar und scharf ist.
Viele Fehlalarme: Erhöhen Sie Score Thresh und beschränken Sie Select Classes auf die relevanten Klassen. Ein Zuschnitt des Interessengebiets mit Image ROI Select hilft ebenfalls.
Langsame Performance oder hoher Speicherverbrauch: Wählen Sie ein kleineres Model, reduzieren Sie die Bildgröße mit Image Resizer oder deaktivieren Sie die Visualisierung (Draw Boxes).
Inkonsistente Erkennungen über Frames: Nutzen Sie Object_Detection_Tracker, um Ergebnisse zu stabilisieren und persistente IDs zu erhalten.

Wenn Sie Ergebnisse für eine spätere Überprüfung sichern möchten, verbinden Sie Boxes/Labels/Scores mit Logging- oder Export-Blöcken wie Image Logger, Image Write oder CSV Export.

VorherigeObject Detection - Custom (CPU)NächsteOCR (EasyOCR)

Zuletzt aktualisiert vor 2 Tagen

War das hilfreich?