Punjabi University Patiala,India,Website http://www.universitypunjabi.org http://www.advancedcentrepunjabi.org http://www.universitypunjabi.org/sangam/ http://www.advancedcentrepunjabi.org/intro1.asp
http://www.mit.gov.in
 

ਹੋਮ ਪੇਜ਼

ਮੰਤਵ

ਲਾਭ

ਟੀਮ ਮੈਂਬਰ

ਆਪਟੀਕਲ ਕਰੈਕਟਰ ਰਿਕੋਗਨੀਸ਼ਨ (ਓ.ਸੀ.ਆਰ.) ਇਕ ਅਜਿਹੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜਿਸ ਰਾਹੀਂ ਪ੍ਰਿੰਟ ਕੀਤੀ ਹੋਈ ਸਮੱਗਰੀ ਨੂੰ ਟੈਕਸਟ ਜਾਂ ਵਰਡ ਪ੍ਰੋਸੈਸਿੰਗ ਫਾਈਲਾਂ ਵਿਚ ਪਰਿਵਰਤਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਨੂੰ ਬੜੀ ਅਸਾਨੀ ਨਾਲ ਸੰਪਾਦਿਤ ਅਤੇ ਭੰਡਾਰ ਵੀ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਅਸੀਂ ਸਪਰਸ਼ ਕੀਤੀ ਜਾ ਸਕਣ ਵਾਲੀ ਕਾਗਜ ਦੀ ਸ਼ੀਟ (ਹਾਰਡ ਕਾਪੀ) ਨੂੰ ਡਿਜ਼ੀਟਲ ਰੂਪ ਵਿਚ ਬਦਲ ਸਕਦੇ ਹਾਂ ਜਿਸ ਨੂੰ ਚਿਤਰਾਂ ਜਾਂ ਪ੍ਰਤੀਬਿੰਬਾਂ (ਆਬਜੈਕਟਸ) ਦੇ ਰੂਪ ਵਿਚ ਸੁਰੱਖਿਅਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਇੱਥੇ ਧਿਆਨ ਰੱਖਣ ਵਾਲੀ ਗੱਲ ਇਹ ਹੈ ਕਿ ਚਿਤਰਾਂ ਜਾਂ ਪ੍ਰਤੀਬਿੰਬਾਂ ਨੂੰ ਤਾਂ ਪੂਰੀ ਤਰ੍ਹਾਂ ਬਦਲਿਆ ਜਾ ਸਕਦਾ ਹੈ ਪਰ ਇਸ ਵਿਚਲੇ ਮੂਲ ਪਾਠ (ਟੈਕਸਟ) ਨੂੰ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਨਹੀਂ ਬਦਲਿਆਜਾ ਸਕਦਾ।ਓ.ਸੀ.ਆਰ. ਅਜਿਹਾ ਹੀ ਇਕ ਔਜ਼ਾਰ ਹੈ ਜੋ ਅੱਖਰਾਂ ਨੂੰ ਪਛਾਣਦਾ ਹੈ ਤੇ ਇਹਨਾਂ ਨੂੰ ਸੰਪਾਦਨਾ ਅਤੇ ਖੋਜ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ। ਹਾਰਡ ਕਾਪੀ ਦੀ ਬਜਾਏ ਅਜਿਹੀ ਤਕਨਾਲੋਜੀ ਰਾਹੀਂ ਸਮੱਗਰੀ ਨੂੰ ਬਹੁਤ ਹੀ ਘੱਟ ਭੰਡਾਰਨ ਸਥਾਨ (ਮੈਮਰੀ ਸਪੇਸ) ਵਿਚ ਸਾਂਭਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਓ.ਸੀ.ਆਰ. ਤਕਨਾਲੋਜੀ ਨੇ ਸੂਚਨਾ ਦੇ ਭੰਡਾਰਨ, ਵੰਡ ਅਤੇ ਸੰਪਾਦਨਾ ਦੇ ਖੇਤਰ 'ਚ ਬਹੁਤ ਗਹਿਰਾ ਪ੍ਰਭਾਵ ਪਾਇਆ ਹੈ। ਅੱਖਰ ਸ਼ੁੱਧਤਾ ਜਾਂ ਦਰੁਸਤੀ, ਟੈਕਸਟ ਰਿਕੋਗਨੀਸ਼ਨ ਦਾ ਇਕ ਮਹੱਤਵਪੂਰਨ ਪੱਖ ਹੈ ਜਿਹੜਾ ਕਿ ਚਿਤਰਾਂ ਜਾਂ ਪ੍ਰਤੀਬਿੰਬਾਂ ਦੀ ਪ੍ਰਕਿਰਤੀ ਜਾਂ ਸਰੂਪ (ਕੁਆਲਟੀ) ਸਕੈਨਿੰਗ ਰੈਜ਼ੋਲੂਸ਼ਨ (ਇਕ ਵਿਸ਼ੇਸ਼ਤਾ) ਅਤੇ ਸਾਫਟਵੇਅਰ ਖੁਦ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। ਕਿਸੇ ਚਿਤਰ ਜਾਂ ਪ੍ਰਤੀਬਿੰਬ ਦਾ ਸਰੂਪ ਬਿਹਤਰ ਹੋਵੇਗਾ ਤਾਂ ਉਸ ਦੀ ਰੈਜ਼ੋਲੂਸ਼ਨ ਅਤੇ ਸ਼ੁੱਧਤਾ ਵੀ ਬਿਹਤਰ ਹੋਵੇਗੀ। ਸ਼ੁੱਧਤਾ ਨੂੰ ਪ੍ਰਤੀਸ਼ਤਤਾ ਵਿਚ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ, 98 ਫੀਸਦੀ ਸ਼ੁੱਧਤਾ ਦਾ ਅਰਥ ਹੈ ਕਿ ਇਥੇ 100 ਅੱਖਰਾਂ ਵਿਚੋਂ 2 ਗ਼ਲਤੀਆਂ ਹਨ। ਜਿਕਰਯੋਗ ਕਾਰਕਾਂ ਦੇ ਅਧਾਰ ਉੱਤੇ ਓ.ਸੀ.ਆਰ. ਦਾ ਸ਼ੁੱਧਤਾ ਦਾਇਰਾ 80 ਫੀਸਦੀ ਤੋਂ 99 ਫੀਸਦੀ ਹੁੰਦਾ ਹੈ।
ਓ.ਸੀ.ਆਰ. (ਆਪਟੀਕਲ ਕਰੈਕਟਰ ਰਿਕੋਗਨੀਸ਼ਨ) ਮਸ਼ੀਨ ਵਿਜ਼ਨ ਤਕਨਾਲੋਜੀ ਇਕ ਬਹੁਤ ਹੀ ਸਧਾਰਨ ਅਤੇ ਲਾਹੇਵੰਦ ਪ੍ਰਯੋਗ ਹੈ। ਇਥੋਂ ਤੱਕ ਕਿ ਖੋਜਕਰਤਾ ਪ੍ਰਿੰਟ ਕੀਤੇ ਹੋਏ ਅੱਖਰਾਂ ਦੀ ਪਛਾਣ ਵਾਲੇ ਪ੍ਰੋਗਰਾਮ ਦਾ ਪ੍ਰਯੋਗ 1960 ਵਿਚ ਕਰ ਚੁੱਕੇ ਹਨ। 1980 ਵਿਚ ਓ.ਸੀ.ਆਰ. ਦੀ ਮਹੱਤਤਾ ਵਧਾਉਣ ਲਈ ਇਸ ਦੀ ਸ਼ਕਤੀ, ਹਾਰਡਵੇਅਰ ਅਤੇ ਸਾਫਟਵੇਅਰ ਦੀ ਕੀਮਤ ਵਿਚ ਉਚੇਚਾ ਸੁਧਾਰ ਕੀਤਾ ਗਿਆ। ਜਿਸ ਨਾਲ ਓ.ਸੀ.ਆਰ. ਮਿਆਰੀ ਡੈਸਕਟਾਪ ਕੰਪਿਊਟਰਾਂ ਉੱਤੇ ਵਿਵਹਰਿਕ ਰੂਪ 'ਚ ਚੱਲਣ ਦੇ ਸਮਰੱਥ ਸਿੱਧ ਹੋਇਆ। ਜੇਕਰ ਗੁਰਮੁਖੀ ਲਿਪੀ ਦੇ ਓ.ਸੀ.ਆਰ ਦੀ ਗੱਲ ਕਰੀਏ ਤਾਂ ਇਸ ਦਾ ਇਤਿਹਾਸ ਬਹੁਤਾ ਪੁਰਾਣਾ ਨਹੀਂ। ਅਸਲ ਵਿਚ ਸਾਲ 2000 ਵਿਚ ਗੁਰਮੁਖੀ ਲਿਪੀ ਲਈ ਆਫ਼ ਲਾਈਨ ਓ.ਸੀ.ਆਰ. ਵਿਕਸਿਤ ਹੋਇਆ। ਇਸ ਪ੍ਰੋਜੈਕਟ ਦੇ ਕੋਆਰਡੀਨੇਟਰ ਦੁਆਰਾ ਵਿਕਸਿਤ ਕੀਤੇ ਓ.ਸੀ.ਆਰ. ਦੀ ਸ਼ੁੱਧਤਾ ਸਾਫ-ਸੁਥਰੇ ਟੈਕਸਟ 'ਤੇ 97 ਫੀਸਦੀ ਹੈ। ਸਾਡਾ ਵਿਚਾਰ ਹੈ ਕਿ ਅਸੀਂ ਗੁਰਮੁਖੀ ਓ.ਸੀ.ਆਰ. ਦੀ ਸ਼ੁੱਧਤਾ ਨੂੰ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਵਧਾਈਏ ਤਾਂ ਜੋ ਇਹ ਪੁਰਾਣੇ ਅਤੇ ਭੱਦੇ ਦਸਤਾਵੇਜਾਂ ਉੱਤੇ ਵੀ ਕੰਮ ਕਰ ਸਕੇ ਅਤੇ ਇਹ ਵੱਧ ਤੋਂ ਵੱਧ ਟਾਈਪ ਰੂਪਾਂ (ਫੇਸਿਜ਼), ਅੰਕੜਿਆਂ ਅਤੇ ਪ੍ਰਤੀਕ ਚਿੰਨ੍ਹਾਂ ਲਈ ਮਦਦਗਾਰ ਸਿੱਧ ਹੋ ਸਕੇ।
ਗੁਰਮੁਖੀ ਓ.ਸੀ.ਆਰ. ਦੇ ਸੰਪੂਰਨ ਵਿਕਾਸ ਲਈ ਅਸੀਂ ਇਕ ਬਹੁਪੱਖੀ ਸਾਂਝੇਦਾਰੀ ਵਾਲੀ ਰਾਸ਼ਰਟੀ-ਸੰਘ ਵਾਲੀ ਸੰਸਥਾ ਨਾਲ ਭਾਗੇਦਾਰੀ ਕਰਨ ਜਾ ਰਹੇ ਹਾਂ। ਗੁਰਮੁਖੀ ਲਿਪੀ ਲਈ ਹੇਠਾਂ ਦਰਸਾਏ ਮਾਡਿਊਲ ਵਿਕਸਿਤ ਕੀਤੇ ਜਾਣਗੇ:

  1. ਲਾਈਨ ਤੋਂ ਸ਼ਬਦ ਵਿਭਾਜਨ

    • ਲਈਨ ਪੱਧਰੀ ਟੈਕਸਟ ਅੰਕੜਾ-ਵਿਗਿਆਨ

    • ਸ਼ਬਦ ਸੀਮਾਂ ਦੀ ਖੋਜ

  2.  ਸ਼ਬਦ ਤੋਂ ਅੰਗ ਵਿਭਾਜਨ ਦਾ ਪਤਾ ਲਗਾਉਣਾ ਤੇ ਹਟਾਉਣਾ

    • ਸੰਬੰਧਿਤ ਭਾਗਾਂ ਦੀ ਖੋਜ

    • ਸਕਰਿਪਟ ਅਧਾਰਤ ਭਾਗਾਂ ਦੀ ਵੰਡ

    • ਕੱਟ ਅਤੇ ਮਰਜ ਦਾ ਨਿਵਾਰਨ

  3. ਕੰਪੋਨੈਂਟ ਪਛਾਣ

    • ਭਾਗਾਂ ਤੋਂ ਗੁਣਾਂ ਦੀ ਉੱਤਪਤੀ
    • ਸਕਰਿਪਟ ਅਧਾਰਤ ਕ੍ਰਮਬੱਧ ਡਿਜ਼ਾਈਨ

    • ਕ੍ਰਮ-ਬੱਧ ਮਾਪ-ਦੰਡ ਦਾ ਅਧਿਐਨ

    • ਮਲਟੀ-ਮਾਡਲ ਕ੍ਰਮਬੱਧ ਦਾ ਸੁਮੇਲ

  4. ਭਾਸ਼ਾ-ਵਿਸ਼ੇਸ਼ ਪੋਸਟ ਪ੍ਰੋਸੈਸਿੰਗ

    • ਕੰਪੋਨੈਂਟ ਦੇ ਭਾਗਾਂ ਤੋਂ ਅੱਖਰ ਪਛਾਣ

    • ਅੱਖਰਾਂ ਤੋਂ ਸ਼ਬਦ ਪਛਾਣ

    • ਲੈਂਗੁਏਜ ਮਾਡਲ ਅਧਾਰਤ ਲੇਬਲ ਦੀ ਸਪੱਸ਼ਟਤਾ

    • ਸਪੈੱਲ ਚੈੱਕ ਲਈ ਸ਼ਬਦਕੋਸ਼ ਮੁਹਾਂਦਰਾ