|
ਆਪਟੀਕਲ ਕਰੈਕਟਰ ਰਿਕੋਗਨੀਸ਼ਨ (ਓ.ਸੀ.ਆਰ.) ਇਕ ਅਜਿਹੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜਿਸ ਰਾਹੀਂ ਪ੍ਰਿੰਟ ਕੀਤੀ ਹੋਈ ਸਮੱਗਰੀ ਨੂੰ ਟੈਕਸਟ ਜਾਂ ਵਰਡ ਪ੍ਰੋਸੈਸਿੰਗ ਫਾਈਲਾਂ ਵਿਚ ਪਰਿਵਰਤਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਨੂੰ ਬੜੀ ਅਸਾਨੀ ਨਾਲ ਸੰਪਾਦਿਤ ਅਤੇ ਭੰਡਾਰ ਵੀ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਅਸੀਂ ਸਪਰਸ਼ ਕੀਤੀ ਜਾ ਸਕਣ ਵਾਲੀ ਕਾਗਜ ਦੀ ਸ਼ੀਟ (ਹਾਰਡ ਕਾਪੀ) ਨੂੰ ਡਿਜ਼ੀਟਲ ਰੂਪ ਵਿਚ ਬਦਲ ਸਕਦੇ ਹਾਂ ਜਿਸ ਨੂੰ ਚਿਤਰਾਂ ਜਾਂ ਪ੍ਰਤੀਬਿੰਬਾਂ (ਆਬਜੈਕਟਸ) ਦੇ ਰੂਪ ਵਿਚ ਸੁਰੱਖਿਅਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਇੱਥੇ ਧਿਆਨ ਰੱਖਣ ਵਾਲੀ ਗੱਲ ਇਹ ਹੈ ਕਿ ਚਿਤਰਾਂ ਜਾਂ ਪ੍ਰਤੀਬਿੰਬਾਂ ਨੂੰ ਤਾਂ ਪੂਰੀ ਤਰ੍ਹਾਂ ਬਦਲਿਆ ਜਾ ਸਕਦਾ ਹੈ ਪਰ ਇਸ ਵਿਚਲੇ ਮੂਲ ਪਾਠ (ਟੈਕਸਟ) ਨੂੰ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਨਹੀਂ ਬਦਲਿਆਜਾ ਸਕਦਾ।ਓ.ਸੀ.ਆਰ. ਅਜਿਹਾ ਹੀ ਇਕ ਔਜ਼ਾਰ ਹੈ ਜੋ ਅੱਖਰਾਂ ਨੂੰ ਪਛਾਣਦਾ ਹੈ ਤੇ ਇਹਨਾਂ ਨੂੰ ਸੰਪਾਦਨਾ ਅਤੇ ਖੋਜ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ। ਹਾਰਡ ਕਾਪੀ ਦੀ ਬਜਾਏ ਅਜਿਹੀ ਤਕਨਾਲੋਜੀ ਰਾਹੀਂ ਸਮੱਗਰੀ ਨੂੰ ਬਹੁਤ ਹੀ ਘੱਟ ਭੰਡਾਰਨ ਸਥਾਨ (ਮੈਮਰੀ ਸਪੇਸ) ਵਿਚ ਸਾਂਭਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਓ.ਸੀ.ਆਰ. ਤਕਨਾਲੋਜੀ ਨੇ ਸੂਚਨਾ ਦੇ ਭੰਡਾਰਨ, ਵੰਡ ਅਤੇ ਸੰਪਾਦਨਾ ਦੇ ਖੇਤਰ 'ਚ ਬਹੁਤ ਗਹਿਰਾ ਪ੍ਰਭਾਵ ਪਾਇਆ ਹੈ। ਅੱਖਰ ਸ਼ੁੱਧਤਾ ਜਾਂ ਦਰੁਸਤੀ, ਟੈਕਸਟ ਰਿਕੋਗਨੀਸ਼ਨ ਦਾ ਇਕ ਮਹੱਤਵਪੂਰਨ ਪੱਖ ਹੈ ਜਿਹੜਾ ਕਿ ਚਿਤਰਾਂ ਜਾਂ ਪ੍ਰਤੀਬਿੰਬਾਂ ਦੀ ਪ੍ਰਕਿਰਤੀ ਜਾਂ ਸਰੂਪ (ਕੁਆਲਟੀ) ਸਕੈਨਿੰਗ ਰੈਜ਼ੋਲੂਸ਼ਨ (ਇਕ ਵਿਸ਼ੇਸ਼ਤਾ) ਅਤੇ ਸਾਫਟਵੇਅਰ ਖੁਦ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। ਕਿਸੇ ਚਿਤਰ ਜਾਂ ਪ੍ਰਤੀਬਿੰਬ ਦਾ ਸਰੂਪ ਬਿਹਤਰ ਹੋਵੇਗਾ ਤਾਂ ਉਸ ਦੀ ਰੈਜ਼ੋਲੂਸ਼ਨ ਅਤੇ ਸ਼ੁੱਧਤਾ ਵੀ ਬਿਹਤਰ ਹੋਵੇਗੀ। ਸ਼ੁੱਧਤਾ ਨੂੰ ਪ੍ਰਤੀਸ਼ਤਤਾ ਵਿਚ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ, 98 ਫੀਸਦੀ ਸ਼ੁੱਧਤਾ ਦਾ ਅਰਥ ਹੈ ਕਿ ਇਥੇ 100 ਅੱਖਰਾਂ ਵਿਚੋਂ 2 ਗ਼ਲਤੀਆਂ ਹਨ। ਜਿਕਰਯੋਗ ਕਾਰਕਾਂ ਦੇ ਅਧਾਰ ਉੱਤੇ ਓ.ਸੀ.ਆਰ. ਦਾ ਸ਼ੁੱਧਤਾ ਦਾਇਰਾ 80 ਫੀਸਦੀ ਤੋਂ 99 ਫੀਸਦੀ ਹੁੰਦਾ ਹੈ।
ਓ.ਸੀ.ਆਰ. (ਆਪਟੀਕਲ ਕਰੈਕਟਰ ਰਿਕੋਗਨੀਸ਼ਨ) ਮਸ਼ੀਨ ਵਿਜ਼ਨ ਤਕਨਾਲੋਜੀ ਇਕ ਬਹੁਤ ਹੀ ਸਧਾਰਨ ਅਤੇ ਲਾਹੇਵੰਦ ਪ੍ਰਯੋਗ ਹੈ। ਇਥੋਂ ਤੱਕ ਕਿ ਖੋਜਕਰਤਾ ਪ੍ਰਿੰਟ ਕੀਤੇ ਹੋਏ ਅੱਖਰਾਂ ਦੀ ਪਛਾਣ ਵਾਲੇ ਪ੍ਰੋਗਰਾਮ ਦਾ ਪ੍ਰਯੋਗ 1960 ਵਿਚ ਕਰ ਚੁੱਕੇ ਹਨ। 1980 ਵਿਚ ਓ.ਸੀ.ਆਰ. ਦੀ ਮਹੱਤਤਾ ਵਧਾਉਣ ਲਈ ਇਸ ਦੀ ਸ਼ਕਤੀ, ਹਾਰਡਵੇਅਰ ਅਤੇ ਸਾਫਟਵੇਅਰ ਦੀ ਕੀਮਤ ਵਿਚ ਉਚੇਚਾ ਸੁਧਾਰ ਕੀਤਾ ਗਿਆ। ਜਿਸ ਨਾਲ ਓ.ਸੀ.ਆਰ. ਮਿਆਰੀ ਡੈਸਕਟਾਪ ਕੰਪਿਊਟਰਾਂ ਉੱਤੇ ਵਿਵਹਰਿਕ ਰੂਪ 'ਚ ਚੱਲਣ ਦੇ ਸਮਰੱਥ ਸਿੱਧ ਹੋਇਆ। ਜੇਕਰ ਗੁਰਮੁਖੀ ਲਿਪੀ ਦੇ ਓ.ਸੀ.ਆਰ ਦੀ ਗੱਲ ਕਰੀਏ ਤਾਂ ਇਸ ਦਾ ਇਤਿਹਾਸ ਬਹੁਤਾ ਪੁਰਾਣਾ ਨਹੀਂ। ਅਸਲ ਵਿਚ ਸਾਲ 2000 ਵਿਚ ਗੁਰਮੁਖੀ ਲਿਪੀ ਲਈ ਆਫ਼ ਲਾਈਨ ਓ.ਸੀ.ਆਰ. ਵਿਕਸਿਤ ਹੋਇਆ। ਇਸ ਪ੍ਰੋਜੈਕਟ ਦੇ ਕੋਆਰਡੀਨੇਟਰ ਦੁਆਰਾ ਵਿਕਸਿਤ ਕੀਤੇ ਓ.ਸੀ.ਆਰ. ਦੀ ਸ਼ੁੱਧਤਾ ਸਾਫ-ਸੁਥਰੇ ਟੈਕਸਟ 'ਤੇ 97 ਫੀਸਦੀ ਹੈ। ਸਾਡਾ ਵਿਚਾਰ ਹੈ ਕਿ ਅਸੀਂ ਗੁਰਮੁਖੀ ਓ.ਸੀ.ਆਰ. ਦੀ ਸ਼ੁੱਧਤਾ ਨੂੰ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਵਧਾਈਏ ਤਾਂ ਜੋ ਇਹ ਪੁਰਾਣੇ ਅਤੇ ਭੱਦੇ ਦਸਤਾਵੇਜਾਂ ਉੱਤੇ ਵੀ ਕੰਮ ਕਰ ਸਕੇ ਅਤੇ ਇਹ ਵੱਧ ਤੋਂ ਵੱਧ ਟਾਈਪ ਰੂਪਾਂ (ਫੇਸਿਜ਼), ਅੰਕੜਿਆਂ ਅਤੇ ਪ੍ਰਤੀਕ ਚਿੰਨ੍ਹਾਂ ਲਈ ਮਦਦਗਾਰ ਸਿੱਧ ਹੋ ਸਕੇ।
ਗੁਰਮੁਖੀ ਓ.ਸੀ.ਆਰ. ਦੇ ਸੰਪੂਰਨ ਵਿਕਾਸ ਲਈ ਅਸੀਂ ਇਕ ਬਹੁਪੱਖੀ ਸਾਂਝੇਦਾਰੀ ਵਾਲੀ ਰਾਸ਼ਰਟੀ-ਸੰਘ ਵਾਲੀ ਸੰਸਥਾ ਨਾਲ ਭਾਗੇਦਾਰੀ ਕਰਨ ਜਾ ਰਹੇ ਹਾਂ। ਗੁਰਮੁਖੀ ਲਿਪੀ ਲਈ ਹੇਠਾਂ ਦਰਸਾਏ ਮਾਡਿਊਲ ਵਿਕਸਿਤ ਕੀਤੇ ਜਾਣਗੇ:
-
ਲਾਈਨ ਤੋਂ ਸ਼ਬਦ ਵਿਭਾਜਨ
-
ਸ਼ਬਦ ਤੋਂ ਅੰਗ ਵਿਭਾਜਨ ਦਾ ਪਤਾ ਲਗਾਉਣਾ ਤੇ ਹਟਾਉਣਾ
-
ਕੰਪੋਨੈਂਟ ਪਛਾਣ
- ਭਾਗਾਂ ਤੋਂ ਗੁਣਾਂ ਦੀ ਉੱਤਪਤੀ
-
ਸਕਰਿਪਟ ਅਧਾਰਤ ਕ੍ਰਮਬੱਧ ਡਿਜ਼ਾਈਨ
-
ਕ੍ਰਮ-ਬੱਧ ਮਾਪ-ਦੰਡ ਦਾ ਅਧਿਐਨ
-
ਮਲਟੀ-ਮਾਡਲ ਕ੍ਰਮਬੱਧ ਦਾ ਸੁਮੇਲ
-
ਭਾਸ਼ਾ-ਵਿਸ਼ੇਸ਼ ਪੋਸਟ ਪ੍ਰੋਸੈਸਿੰਗ
-
ਕੰਪੋਨੈਂਟ ਦੇ ਭਾਗਾਂ ਤੋਂ ਅੱਖਰ ਪਛਾਣ
-
ਅੱਖਰਾਂ ਤੋਂ ਸ਼ਬਦ ਪਛਾਣ
-
ਲੈਂਗੁਏਜ ਮਾਡਲ ਅਧਾਰਤ ਲੇਬਲ ਦੀ ਸਪੱਸ਼ਟਤਾ
-
ਸਪੈੱਲ ਚੈੱਕ ਲਈ ਸ਼ਬਦਕੋਸ਼ ਮੁਹਾਂਦਰਾ
|