🖥️
AugeLab Studio Manual
Deutch
Deutch
  • 👋Willkommen im AugeLab Studio Benutzerhandbuch
  • 📘Einführung
    • AugeLab Studio
    • Hauptmerkmale
    • Anwendungsfälle
    • Systemanforderungen
  • 🚀Erste Schritte
    • Anmeldung
    • Installation
    • Erster Blick
    • Einfacher Rundgang
    • Ihr allererstes Projekt
      • Grundlagen
      • Erkennung
      • Zusammenfassung
    • Weitere lokale Beispiele
    • Weitere Lektüre
  • 🖥️AugeLab Studio Oberfläche
    • Detaillierter Blick
    • Szenario-Bereich
    • Menü und Werkzeugleiste
    • Projekte verwalten
    • KI installieren und vieles mehr
      • KI mit Modul-Downloader nutzen
  • 🧱Funktionsblöcke
    • Blockstrukturen
    • Schnittstellen
    • Blockspalte
    • Verbindungen
    • Alle Funktionsblöcke
      • AI Blocks
        • Face Detection
        • Mask Detection
        • Object Detection - Custom
        • Object Detection
        • Pose Estimation
        • Safety Equipment Detection
        • Social Distance Detector
        • Super Resolution
        • Text Detection
        • OCR
      • CNN Blocks
        • Average Pooling 2D
        • Batch Normalization
        • Choose Folder 2D
        • Compile Model
        • Conv. Sep. Layer 2D
        • Conv. Trans. Layer 2D
        • Convolutional Layer 2D
        • Dropout Layer
        • Flatten Layer 2D
        • Fully Connected
        • Global Average Pooling 2D
        • Global Max Pooling 2D
        • Input Layer 2D
        • Loss CCE
        • Max Pooling 2D
        • Metrics Accuracy
        • Model EfficientNet
        • Model MobileNet
        • Model ResNet
        • Model VGG
        • Optimizer Adadelta
        • Optimizer Adagrad
        • Optimizer Adam
        • Optimizer Adamax
        • Optimizer FTRL
        • Optimizer Nadam
        • Optimizer RMSProp
        • Optimizer SGD
        • ReLU Layer
        • Softmax Layer
        • Training Parameters
      • Data/Logic
        • Flow Control
          • Batch Concatenation
          • Batch Processing
          • Debatch
          • Get Batch Size
          • HMI Background
          • Subsystem Enabled
          • Subsystem In
          • Subsystem Loop
          • Subsystem Out
          • Subsystem
        • logic
          • All True
          • And
          • Demux
          • Equals
          • Greater
          • Logic Operations
          • Mux
          • Not
          • Or
          • Set - Reset
          • Smaller
        • Mathmetical Operations
          • Add
          • Counter
          • Divide
          • Math Operations
          • Maximum
          • Minimum
          • Multiply
          • Not Equals
          • Round
          • Square Root
          • Subtract
          • Trigonometry
        • Data Operations
          • Data Memory
          • Data to JSON
          • Data Type Converter
          • Datetime Compare
          • Dictionary Operations
          • Exclude Nones
          • Find Substring
          • Get Element
          • Is None
          • List Operations
          • Parse Data Dictionary
          • Replace None
          • String Merge
          • String Operations
        • Referencing
          • Data Read Global
          • Data Read Local
          • Data Write Global
          • Data Write Local
          • Debug Input
          • Tag From
          • Tag To
        • Signal Operators
          • Delay Step
          • Edge Falling
          • Edge Rising
          • Multi Port Switch
          • OFF Delay
          • ON Delay
      • Image/Transformations
        • Analysis
          • Color Density Percentage
          • Get Dimension
          • Histogram On Curve
          • Histogram On Line
          • Image Color Match
          • Image Memory
          • Image Resolution and Channel Value
          • Maximum Images
          • Mean Value of Image
          • Measure Position Distance
          • Minimum Images
          • Non-zero of Image
          • Std. of Image
          • Structural Similarity
        • Transformation Filters
          • Auto Alignment
          • Auto Contrast
          • Color Quantizer and Clustering
          • Color Space
          • Contrast-Brightness-Gamma
          • Contrast Optimization
          • Deconvolution
          • Denoising
          • Distance Transformation
          • FloodFill
          • Grab Cut Algorithm
        • Color Filters
          • 2D Filter
          • Apply Mask
          • Bilateral Filter
          • Blur
          • Edge Filter
          • HSV Filter
          • Image Adaptive Threshold
          • Image Threshold
          • Invert Image
          • Morphological Transformations
          • Normalize Image
          • RGB Mask
          • RGB Set
          • Sobel Filter
        • Operations
          • Add Images Weighted
          • Add Images
          • Collage Images
          • Divide Images
          • Flip Image
          • Image AutoRotator
          • Image Concatenate
          • Image Resize
          • Image Resizer
          • Merge Channels
          • Multiply Images
          • Polar Transform
          • Rotate Image Angle
          • Slice Image
          • Split Image
          • Subtract Images
      • Detections/Shapes
        • Detectors
          • Barcode Reader
          • Blob Detector
          • Blur Detector
          • Circle Detector
          • Corner Detector
          • Custom CNN Model
          • Data Matrix Reader
          • Detect Reference
          • Feature Detector
          • Find Object - Multiple Image
          • Find Object
          • Find Reference
          • Harris Corner Filter
          • Line Detector
          • Match Shapes
          • Measure Object Distance
          • Shape Detector
        • Draw
          • Draw Detections
          • Draw Line
          • Draw Point
          • Draw Rectangle
          • Draw Result On Image
          • Write Date On Image
          • Write Text On Image
        • Roi Processing
          • Check Area (Polygon)
          • Check Area
          • Get Pixel Mouse
          • Get Pixel
          • Get ROI
          • Image ROI Center
          • Image ROI Polygon
          • Image ROI Select Multi
          • Image ROI Select
          • Image ROI
          • Perspective Transform
          • Rectangles in Rectangle
        • Shape Analysis
          • Approximate Contour
          • Choose Line
          • Contour to Image
          • Fill Contour
          • Find Contour
          • Hull Convex
          • Minimum Circle
          • Minimum Ellipse
          • Minimum Rectangle
          • Minimum Rotated Rectangle
          • Most Similar Shape
          • Point Polygon Test
      • Input/Output
        • Communication
          • Modbus Connect
          • Modbus Read
          • Modbus Write
          • MQTT Publish
          • MQTT Subscribe
          • OPC UA Client
          • OPC UA Read
          • OPC UA Write
          • REST API - Get
          • REST API - Post
          • Send Mail
          • Siemens S7 Connect
          • Siemens S7 Read
          • Siemens S7 Write
        • Data Inputs
          • Date-Time List
          • Date-Time
          • Headless Check
          • Keyboard/Barcode Reader
          • Logic Input
          • Number Input
          • Number Range
          • PWM (Pulse Width Modulation)
          • Rising Edge
          • String Input
          • Text
        • Image Inputs
          • Camera IP (ONVIF)
          • Camera IP
          • Camera USB External
          • Camera USB Vidgear
          • Camera USB
          • Load Image From Path
          • Load Image
          • Make Image
          • Pixel
          • Video
        • Outputs/Exports
          • CSV Export
          • Cycle Timer
          • File/Folder Operations
          • GPU Statistics
          • Image Logger
          • Image Write
          • Led Output
          • Multi Image Write
          • Output
          • Scope
          • Show Image
          • Stop
  • 📡Geräte und Kommunikation
    • Kamera-Nutzung
    • Kommunikationsprotokolle
    • Weitere Lektüre
  • 🧩Beispielprojekte
    • Demo-Projekte
    • Umfangmessung
    • Objektezählung
    • Fliesenbreitenmessung
    • Menschenkennung
    • Objekterkennung
  • 🔑Hauptmerkmale
    • Benutzerdefinierte HMI-Anwendungen bereitstellen
    • Daten für die Objekterkennung annotieren
    • Benutzerdefinierte KI-Modelle trainieren
      • Die richtige Datenbank auswählen
      • Wann man das Training stoppen sollte
    • Plugins erstellen
      • Komponenten
      • Codereferenz
    • Teilen Sie Ihre Lösungen mit der Community
    • Python-Pakete installieren
  • 📑FAQ
    • Kontaktieren Sie uns
    • FAQ
    • Ein vollständiges Projekt einrichten
  • Zusätzliche Ressourcen
    • Schulungsplan
    • Schulung Materialien
    • AugeLab-Experten
  • Anhang
    • Wörterbuch
    • Referenzen
Powered by GitBook
On this page
  • 📥 Eingänge
  • 📤 Ausgänge
  • 🕹️ Steuerungen
  • 🎨 Funktionen
  • 📝 Nutzungshinweise
  • 📊 Bewertung
  • 💡 Tipps und Tricks
  • 🛠️ Fehlersuche

Was this helpful?

  1. Funktionsblöcke
  2. Alle Funktionsblöcke
  3. AI Blocks

OCR

Dieser Funktionsblock nutzt die Technologie der optischen Zeichenerkennung (OCR), um Text aus Bildern zu erkennen und zu extrahieren. Er kann automatisch verschiedene Texteinstellungen handhaben und Ergebnisse visuell anzeigen.

📥 Eingänge

Image Das Eingangsbild, aus dem Sie Text erkennen möchten.

📤 Ausgänge

Result Das Ausgabebild, das den erkannten Text zusammen mit den Begrenzungsrahmen anzeigt.

Whole Text Ein einzelner String, der den gesamten erkannten Text enthält, der aus dem Bild extrahiert wurde.

Texts Eine Liste der einzelnen Textelemente, die im Bild erkannt wurden.

Boxes Eine Liste der Begrenzungsrahmen um jede erkannte Textregion.

🕹️ Steuerungen

Auto Rotation Ein Kontrollkästchen, das die Verwendung der automatischen Rotation aktiviert, um Text zu lesen, der möglicherweise auf dem Kopf steht.

Show Texts Ein Kontrollkästchen, das das Anzeigen des erkannten Textes über jedem Begrenzungsrahmen im Ausgabebild erlaubt.

Threshold Ein Schieberegler, der den Vertrauensschwellenwert festlegt, um schwache Erkennungen herauszufiltern. Das Anpassen dieses Wertes beeinflusst, welche Texte basierend auf ihrem Vertrauensniveau zurückgegeben werden.

🎨 Funktionen

Multi-Orientation Support Der Block kann Bilder verarbeiten, die Text in verschiedenen Ausrichtungen enthalten, dank seiner Funktion für geneigte Modi.

Confidence Filtering Gibt nur die Erkennungen aus, die den festgelegten Vertrauensschwellenwert erfüllen oder überschreiten.

Visual Feedback Der Funktionsblock bietet eine visuelle Darstellung des erkannten Textes und der Begrenzungsrahmen im Ausgabebild, was das Benutzererlebnis verbessert.

📝 Nutzungshinweise

  1. Input Image: Verbinden Sie eine Bildquelle mit dem Eingangsbereich Image.

  2. Configure Settings: Aktivieren oder deaktivieren Sie die Optionen Auto Rotation und Show Texts je nach Bedarf. Passen Sie den Schieberegler Threshold an, um ein Vertrauensniveau für die Texterkennung festzulegen.

  3. Run the Block: Führen Sie die Funktion aus, um das Bild zu verarbeiten und Text zu erkennen. Die Ergebnisse umfassen das annotierte Bild, den gesamten erkannten Text, einzelne Textelemente und Begrenzungsrahmen.

📊 Bewertung

Wenn er ausgeführt wird, nimmt dieser Block ein Bild als Eingabe und gibt das verarbeitete Ergebnis zurück, zusammen mit dem aus dem Bild extrahierten Text, bereit für eine weitere Analyse oder Anzeige.

💡 Tipps und Tricks

Verbesserung der Erkennungsqualität

Für optimale Ergebnisse stellen Sie sicher, dass das Eingangsbild klar und gut beleuchtet ist. Vorverarbeitung des Bildes mit Image Threshold oder OCR - Text Recognition kann die Erkennungsfähigkeiten verbessern.

Umgang mit schiefem Text

Wenn der Text in den Bildern schief erscheint, aktivieren Sie die Funktion Auto Rotation, um den Text automatisch besser auszurichten.

Anpassen des Vertrauensschwellenwerts

Sie möchten möglicherweise den Schieberegler Threshold anpassen, um ein Gleichgewicht zwischen mehr Erkennungen (einschließlich solcher mit niedrigerem Vertrauen) und dem Filtern von Fehlalarmen zu finden.

🛠️ Fehlersuche

Kein Text erkannt

Wenn kein Text erkannt wird, stellen Sie sicher, dass das Eingangsbild eine ausreichende Auflösung und einen ausreichenden Kontrast aufweist. Erhöhen Sie den Schwellenwert bei Bedarf, um weniger vertrauensvolle Erkennungen zu erfassen.

Ausgabebild ist leer

Stellen Sie sicher, dass das Eingangsbild richtig angeschlossen ist und Inhalte enthält. Wenn das Eingangsbild leer ist oder zu viel Rauschen aufweist, kann die OCR möglicherweise keine sinnvollen Ergebnisse liefern.

PreviousText DetectionNextCNN Blocks

Last updated 8 months ago

Was this helpful?

🧱