OCR

Dieser Funktionsblock nutzt die Technologie der optischen Zeichenerkennung (OCR), um Text aus Bildern zu erkennen und zu extrahieren. Er kann automatisch verschiedene Texteinstellungen handhaben und Ergebnisse visuell anzeigen.

📥 Eingänge

Image Das Eingangsbild, aus dem Sie Text erkennen möchten.

📤 Ausgänge

Result Das Ausgabebild, das den erkannten Text zusammen mit den Begrenzungsrahmen anzeigt.

Whole Text Ein einzelner String, der den gesamten erkannten Text enthält, der aus dem Bild extrahiert wurde.

Texts Eine Liste der einzelnen Textelemente, die im Bild erkannt wurden.

Boxes Eine Liste der Begrenzungsrahmen um jede erkannte Textregion.

🕹️ Steuerungen

Auto Rotation Ein Kontrollkästchen, das die Verwendung der automatischen Rotation aktiviert, um Text zu lesen, der möglicherweise auf dem Kopf steht.

Show Texts Ein Kontrollkästchen, das das Anzeigen des erkannten Textes über jedem Begrenzungsrahmen im Ausgabebild erlaubt.

Threshold Ein Schieberegler, der den Vertrauensschwellenwert festlegt, um schwache Erkennungen herauszufiltern. Das Anpassen dieses Wertes beeinflusst, welche Texte basierend auf ihrem Vertrauensniveau zurückgegeben werden.

🎨 Funktionen

Multi-Orientation Support Der Block kann Bilder verarbeiten, die Text in verschiedenen Ausrichtungen enthalten, dank seiner Funktion für geneigte Modi.

Confidence Filtering Gibt nur die Erkennungen aus, die den festgelegten Vertrauensschwellenwert erfüllen oder überschreiten.

Visual Feedback Der Funktionsblock bietet eine visuelle Darstellung des erkannten Textes und der Begrenzungsrahmen im Ausgabebild, was das Benutzererlebnis verbessert.

📝 Nutzungshinweise

Input Image: Verbinden Sie eine Bildquelle mit dem Eingangsbereich Image.
Configure Settings: Aktivieren oder deaktivieren Sie die Optionen Auto Rotation und Show Texts je nach Bedarf. Passen Sie den Schieberegler Threshold an, um ein Vertrauensniveau für die Texterkennung festzulegen.
Run the Block: Führen Sie die Funktion aus, um das Bild zu verarbeiten und Text zu erkennen. Die Ergebnisse umfassen das annotierte Bild, den gesamten erkannten Text, einzelne Textelemente und Begrenzungsrahmen.

📊 Bewertung

Wenn er ausgeführt wird, nimmt dieser Block ein Bild als Eingabe und gibt das verarbeitete Ergebnis zurück, zusammen mit dem aus dem Bild extrahierten Text, bereit für eine weitere Analyse oder Anzeige.

💡 Tipps und Tricks

Verbesserung der Erkennungsqualität

Für optimale Ergebnisse stellen Sie sicher, dass das Eingangsbild klar und gut beleuchtet ist. Vorverarbeitung des Bildes mit Image Threshold oder OCR - Text Recognition kann die Erkennungsfähigkeiten verbessern.

Umgang mit schiefem Text

Wenn der Text in den Bildern schief erscheint, aktivieren Sie die Funktion Auto Rotation, um den Text automatisch besser auszurichten.

Anpassen des Vertrauensschwellenwerts

Sie möchten möglicherweise den Schieberegler Threshold anpassen, um ein Gleichgewicht zwischen mehr Erkennungen (einschließlich solcher mit niedrigerem Vertrauen) und dem Filtern von Fehlalarmen zu finden.

🛠️ Fehlersuche

Kein Text erkannt

Wenn kein Text erkannt wird, stellen Sie sicher, dass das Eingangsbild eine ausreichende Auflösung und einen ausreichenden Kontrast aufweist. Erhöhen Sie den Schwellenwert bei Bedarf, um weniger vertrauensvolle Erkennungen zu erfassen.

Ausgabebild ist leer

Stellen Sie sicher, dass das Eingangsbild richtig angeschlossen ist und Inhalte enthält. Wenn das Eingangsbild leer ist oder zu viel Rauschen aufweist, kann die OCR möglicherweise keine sinnvollen Ergebnisse liefern.

PreviousText Detection NextCNN Blocks

Last updated 2 months ago