OCR का मतलब ऑप्टिकल कैरेक्टर रिकग्निशन है। इसे एक ऑप्टिकल कैरेक्टर रीडर (OCR) या टेक्स्ट रिकग्निशन के रूप में भी जाना जाता है। इसे स्कैन किए गए कागज दस्तावेजों, या डिजिटल कैमरा द्वारा कैप्चर किए गए दस्तावेजों की छवियों को पठनीय, संपादन योग्य और खोज योग्य डेटा में परिवर्तित करने के लिए डिज़ाइन किया गया है।
एक भौतिक दस्तावेज़ के स्कैन किए गए पृष्ठ को स्क्रीन पर प्रदर्शित किया जा सकता है और पढ़ा जा सकता है, लेकिन कंप्यूटर के लिए, यह काले और सफेद डॉट्स की एक श्रृंखला है, जिसे यह पहचान नहीं सकता है। कंप्यूटर को स्कैन किए गए दस्तावेज़ को पढ़ने और सॉफ्ट कॉपी बनाने में सक्षम करने के लिए, ओसीआर विकसित किया गया था। ओसीआर एक स्कैन किए गए दस्तावेज़ के पाठ की जांच करता है और पात्रों को कोड में अनुवाद करता है जो पाठ मशीन को पठनीय बनाता है ताकि इसे एक इलेक्ट्रॉनिक प्रारूप या सॉफ्ट कॉपी में परिवर्तित किया जा सके, जैसे एक वर्ड प्रोसेसर के साथ बनाया गया दस्तावेज़, जिसे उपयोगकर्ता संपादित कर सकते हैं, प्रारूप कर सकते हैं। खोज और पढ़ें।
इस प्रकार, यह कंप्यूटर को स्कैन किए गए पृष्ठ पर शब्दों और पात्रों को पहचानने में मदद करता है और स्कैन किए गए पृष्ठ या दस्तावेज़ पर मुद्रित शब्दों और वर्णों के ऑप्टिकल गुणों का उपयोग करके भौतिक मुद्रित या हस्तलिखित दस्तावेजों की डिजिटल छवियां।
एक ओसीआर डिवाइस हार्डवेयर और सॉफ्टवेयर संयोजन से बना होता है, जिसे भौतिक दस्तावेजों को मशीन-पठनीय पाठ में बदलने के लिए डिज़ाइन किया गया है। OCR का हार्डवेयर (ऑप्टिकल स्कैनर या एक सर्किट बोर्ड) पाठ को कॉपी करता है और पढ़ता है, जबकि सॉफ्टवेयर उन्नत प्रसंस्करण से संबंधित है। सॉफ्टवेयर बुद्धिमान चरित्र पहचान (ICR) के उन्नत तरीकों का उपयोग करने के लिए कृत्रिम बुद्धिमत्ता का उपयोग भी कर सकता है, जैसे कि भाषा या शैली की लिखावट की पहचान करने की क्षमता।
Loading image...