ਪ੍ਰੋਜੈਕਟ ਬਾਰੇ
ਵਿਆਕਰਨ ਨਿਰੀਖਕ (ਗਰਾਮਰ ਚੈੱਕਰ) ਪ੍ਰੋਜੈਕਟ ਦਾ ਮੰਤਵ ਵਾਕਾਂ ਵਿੱਚੋਂ ਵਿਭਿੰਨ ਵਿਆਕਰਨਿਕ ਤਰੁਟੀਆਂ ਦਾ ਪਤਾ ਲਗਾਉਣਾ ਅਤੇ ਜੇਕਰ ਸੰਭਵ ਹੋਵੇ ਤਾਂ ਉਹਨਾਂ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ ਸੁਝਾਅ ਦੇਣਾ ਹੈ।
ਵਿਆਕਰਨ ਨਿਰੀਖਕ ਇੱਕ ਅਜਿਹੀ ਪ੍ਰਣਾਲੀ ਹੈ ਜੋ ਕਿਸੇ ਭਾਸ਼ਾ ਵਿੱਚ ਲਿਖੇ ਪਾਠ ਦੀਆਂ ਵੱਖ-ਵੱਖ ਵਿਆਕਰਨਿਕ ਤਰੁਟੀਆਂ ਲੱਭਦੀ ਹੈ ਅਤੇ ਉਸ ਨੂੰ ਦਰੁਸਤ ਕਰਨ ਬਾਰੇ ਵਰਤੋਂਕਾਰ ਨੂੰ
ਸਭ ਤੋਂ ਪਹਿਲਾਂ ਇਨਪੁਟ ਪਾਠ ਪੂਰਵ-ਪ੍ਰੋਸੈੱਸਰ (ਪ੍ਰੀ-ਪ੍ਰੋਸੈੱਸਰ) ਨੂੰ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ ਜਿਹੜਾ ਕਿ ਇਨਪੁਟ ਪਾਠ ਨੂੰ ਵਾਕਾਂ ਅਤੇ ਸ਼ਬਦਾਂ ਵਿੱਚ ਤੋੜ ਦਿੰਦਾ ਹੈ। ਇਸ ਤੋਂ ਬਾਅਦ
ਪ੍ਰਤੀਕ ਪਾਠ ਸਮੱਗਰੀ ਰੂਪ ਵਿਗਿਆਨਿਕ ਵਿਸ਼ਲੇਸ਼ਕ ਨੂੰ ਭੇਜ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ਜੋ ਦਿੱਤੇ ਹੋਏ ਪਾਠ ਬਾਰੇ ਵਿਆਕਰਨਿਕ ਜਾਣਕਾਰੀ ਮੁਹੱਈਆ ਕਰਵਾਉਂਦਾ ਹੈ। ਫਿਰ ਪੋਸ (POS) ਟੈਗਰ ਸ਼ਬਦ ਸ਼੍ਰੇਣੀ ਸੰਯੋਜਕ ਦਾ ਕੰਮ ਕਰਦਾ ਹੈ। ਪੋਸ ਟੈਗਰ ਰਾਂਹੀ ਸੰਯੋਜਿਤ ਹੋਈ ਆਉਟਪੁਟ ਵਾਕਾਂਸ਼ ਵਿਭਾਜਕ ਨੂੰ ਦੇ ਕੇ ਵਾਕਾਂਸ਼ਾਂ ਅਤੇ ਉਪਵਾਕਾਂ ਦੀ ਸੀਮਾ ਤਹਿ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
ਆਖਰੀ ਪੜਾਅ 'ਤੇ ਵਾਕਾਂਸ਼ ਪੱਧਰ ਅਤੇ ਫਿਰ ਉਪਵਾਕ ਪੱਧਰ ਉੱਤੇ ਪੋਸ ਟੈਗਰ ਸੂਚਨਾ ਦੇ ਅਧਾਰ ਉੱਤੇ ਵਾਕ ਰਚਨਾ/ਵਾਕਾਤਮਕ ਮੇਲ ਦਾ ਨਿਰੀਖਣ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਕਿਸੇ ਵੀ ਲੱਭੀ ਗਈ ਤਰੁਟੀ ਦਾ ਬਿਉਰਾ ਵਰਤੋਂਕਾਰ ਨੂੰ ਪ੍ਰਸਤਾਵਿਤ ਸੋਧ ਸਮੇਤ ਭੇਜ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ।
ਪਿਛੋਕੜ
ਵਿਆਕਰਨ ਨਿਰੀਖਕ ਭਾਸ਼ਾ ਵਿਓਂਤਕਾਰੀ ਦੇ ਖੇਤਰ ਵਿੱਚ ਬਹੁਤ ਜ਼ਿਆਦਾ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਔਜ਼ਾਰ ਹੈ। ਪਿਛਲੇ ਕਈ ਸਾਲਾਂ ਤੋਂ ਆਮ ਵਰਤੋਂ ਵਾਲੇ ਵਰਡ ਪ੍ਰੋਸੈੱਸਰਾਂ ਨੇ ਵਿਦੇਸ਼ੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਵਿਆਕਰਨ ਨਿਰੀਖਕ ਮੁਹੱਈਆ ਕਰਵਾਏ ਹਨ। ਕਿਸੇ ਵੀ ਭਾਰਤੀ ਭਾਸ਼ਾ ਲਈ ਅਜਿਹੀ ਪ੍ਰਣਾਲੀ ਉਪਲਭਧ ਨਹੀਂ ਹੈ। ਕੰਪਿਊਟਰ ਵਰਡ ਪ੍ਰੋਸੈਸਿੰਗ, ਸੂਚਨਾ ਲੇਖਣ ਅਤੇ ਦਫ਼ਤਰੀ ਦਸਤਾਵੇਜਾਂ ਦੀ ਛਪਾਈ ਆਦਿ ਦੇ ਕੰਮਾਂ ਵਿੱਚ ਦਿਨ-ਪ੍ਰਤੀ-ਦਿਨ ਲੋਕਪ੍ਰਿਅਤਾ ਹਾਸਲ ਕਰ ਰਿਹਾ ਹੈ। ਇਹਨਾਂ ਸਾਰੇ ਕਾਰਜਾਂ ਦੇ ਸੰਬੰਧ ਵਿੱਚ ਪਾਠ ਦੀ ਵਿਆਕਰਨਿਕ ਸ਼ੁੱਧਤਾ ਦੀ ਉਚੇਚੀ ਲੋੜ ਮਹਿਸੂਸ ਹੋ ਰਹੀ ਹੈ। ਸੋ ਇਸ ਸਥਿਤੀ ਵਿੱਚ ਅਜਿਹੀ ਵਿਆਕਰਨ ਨਿਰੀਖਣ (ਗਰਾਮਰ ਚੈੱਕਰ) ਪ੍ਰਣਾਲੀ ਦੀ ਉਚੇਚੀ ਲੋੜ ਹੈ। ਹਾਲ ਹੀ ਵਿੱਚ ਮਾਇਕ੍ਰੋਸਾਫਟ ਨੇ ਆਫਿਸ ਦੇ ਹਿੰਦੀ ਵਰਡ ਪ੍ਰੋਸੈੱਸਰ ਸੰਸਕਰਨ ਰਾਹੀਂ ਵਿਆਕਰਨ ਨਿਰੀਖਣ ਦੀ ਸੁਵਿਧਾ ਮੁਹੱਈਆ ਕਰਵਾਈ ਹੈ। ਪਰ ਇਹ ਇੱਕ ਵਪਾਰਕ ਉਤਪਾਦ ਹੋਣ ਕਾਰਨ ਆਮ ਵਿਅਕਤੀ ਦੀ ਪਹੁੰਚ ਤੋਂ ਬਾਹਰ ਹੈ। ਇਸ ਲਈ ਸਾਡੇ ਗਿਆਨ ਮੁਤਾਬਿਕ ਇਹ ਕੰਮ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਪਹਿਲੀ ਕਿਸਮ ਦਾ ਕੰਮ ਹੋਵੇਗਾ। ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਬਹੁਤ ਸਾਰੀਆਂ ਸਾਂਝਾਂ ਹਨ। ਇਸ ਲਈ ਵਰਤਮਾਨ ਕੰਮ ਹੋਰਨਾਂ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਪ੍ਰਸਾਰਮਈ ਹੋ ਸਕਦਾ ਹੈ।
ਮੰਤਵ
ਇਸ ਖੋਜ ਕਾਰਜ ਦੇ ਹੇਠ ਲਿਖੇ ਮੰਤਵ ਹਨ :
- ਵਰਤਮਾਨ ਰੂਪ ਵਿਗਿਆਨਿਕ ਵਿਸ਼ੇਲਸ਼ਣ ਅਤੇ ਉਤਪਾਦਨ, ਪੋਸ ਟੈਗਿੰਗ ਅਤੇ ਵਾਕਾਂਸ਼ ਵਿਭਾਜਨ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਅਤੇ ਵਧਾਉਣਾ।
-
ਮਿਸ਼ਰਤ ਅਤੇ ਜਟਿਲ ਵਾਕਾਂ ਦੇ ਪਦਛੇਦ ਅਤੇ ਤਰੁਟੀ ਨਿਰੀਖਣ ਲਈ ਔਜ਼ਾਰ ਵਿਕਸਿਤ ਕਰਨੇ।
-
ਇਹਨਾਂ ਔਜ਼ਾਰਾਂ ਦੇ ਸੁਮੇਲ ਨਾਲ ਪੰਜਾਬੀ ਭਾਸ਼ਾ ਲਈ ਇੱਕ ਪੂਰਨ ਵਿਆਕਰਨ ਨਿਰੀਖਣ ਪ੍ਰਣਾਲੀ ਵਿਕਸਿਤ ਕਰਨਾ, ਜਿਹੜੀ ਕਿ ਵੱਧ ਤੋਂ ਵੱਧ ਸੰਭਵ ਤਰੁਟੀਆਂ ਦਾ ਪਤਾ ਲਗਾ ਸਕੇ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ ਸੁਝਾਅ ਦੇ ਸਕੇ।
>
ਵਰਤੋਂ
ਇਹ ਪ੍ਰਣਾਲੀ ਕਿਸੇ ਹੋਰ ਸੂਚਨਾ ਅਮਲ ਪ੍ਰਣਾਲੀ ਵਿੱਚ ਵਰਤੀ ਜਾ ਸਕਦੀ ਹੈ ਜਿੱਥੇ ਪ੍ਰਕਿਰਿਆ ਤੋਂ ਪਹਿਲਾਂ ਸਹੀ ਵਿਆਕਰਨ ਵਾਲੀ ਇਨਪੁਟ ਦੀ ਜ਼ਰੂਰਤ ਪੈਂਦੀ ਹੈ।ਇਸ ਪ੍ਰਣਾਲੀ ਦੇ ਵਿਭਿੰਨ ਭਾਗਾਂ ਜਿਵੇਂ ਕਿ ਰੂਪ ਵਿਗਿਆਨਿਕ ਵਿਸ਼ਲੇਸ਼ਕ, ਰੂਪ ਵਿਗਿਆਨਿਕ ਉਤਪਾਦਕ, ਸ਼ਬਦ ਸ਼੍ਰੇਣੀ ਸੰਯੋਜਕ, ਵਾਕਾਂਸ਼ ਵਿਭਾਜਕ ਆਦਿ ਵਿੱਚ ਮਾਮੂਲੀ ਸੋਧ ਕਰਕੇ ਇਨ੍ਹਾਂ ਨੂੰ ਮਸ਼ੀਨ ਅਨੁਵਾਦਨ ਦੇ ਕੰਮ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।ਇਸ ਦੀ ਵਰਤੋਂ ਪੰਜਾਬੀ ਵਿੱਚ ਰਸਮੀ ਚਿੱਠੀ ਪੱਤਰਾਂ ਆਦਿ ਨੂੰ ਚੈੱਕ ਕਰਨ ਲਈ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ।
ਦੂਸਰੀ ਭਾਸ਼ਾ ਦੇ ਸਿਖਾਂਦਰੂ ਇਸ ਦੀ ਵਰਤੋਂ ਪੰਜਾਬੀ ਭਾਸ਼ਾ ਦੀਆਂ ਵਿਆਕਰਨਿਕ ਸ਼੍ਰੇਣੀਆਂ ਅਤੇ ਸੰਰਚਨਾ ਦਾ ਅਧਿਐਨ ਕਰਨ ਲਈ ਭਾਸ਼ਾ ਸਹਾਇਕ ਵਜੋਂ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹਨ।
ਇਸ ਪ੍ਰਣਾਲੀ ਦੀ ਵਰਤੋਂ ਮਸ਼ੀਨ ਅਨੁਵਾਦਨ ਪ੍ਰਣਾਲੀ ਅਤੇ ਆਪਟੀਕਲ ਕਰੈਕਟਰ ਰਿਕੋਗਨੀਸ਼ਨ ਪ੍ਰਣਾਲੀ ਆਦਿ ਵਿਭਿੰਨ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਆਊਟਪੁਟ ਨੂੰ ਚੈੱਕ ਕਰਨ (ਪੋਸਟ ਐਡਿਟਿੰਗ) ਲਈ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ।
ਇਸ ਪ੍ਰਣਾਲੀ ਦੀ ਤਕਨਾਲੋਜੀ ਨੂੰ ਹੋਰਨਾਂ ਭਾਸ਼ਾਵਾਂ ਦੀ ਵਿਆਕਰਨ ਨਿਰੀਖਣ ਪ੍ਰਣਾਲੀ ਵਿਕਸਿਤ ਕਰਨ ਸਮੇਂ ਪੰਜਾਬੀ ਦੀਆਂ ਵਿਆਕਰਨਿਕ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਸਾਂਝੇਦਾਰੀ ਕਰਨ ਅਤੇ ਤੁਲਨਾ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।
ਟੀਮ ਮੈਂਬਰ
ਇਹ ਪ੍ਰੋਜੈਕਟ ''ਸੰਚਾਰ ਅਤੇ ਸੂਚਨਾ ਤਕਨਾਲੋਜੀ ਮੰਤਰਾਲਾ'', ਨਵੀਂ ਦਿੱਲੀ ਵੱਲੋਂ ਅਮਲ 'ਚ ਲਿਆਂਦਾ ਗਿਆ ਹੈ।
ਪੰਜਾਬੀ ਯੂਨੀਵਰਸਿਟੀ, ਪਟਿਆਲਾ ਵਿਖੇ ਇਸ ਪ੍ਰੋਜੈਕਟ ਲਈ ਕੰਮ ਕਰ ਰਹੇ ਮੈਂਬਰ ਇਸ ਪ੍ਰਕਾਰ ਹਨ:
ਮੁੱਖ ਖੋਜਕਾਰ
ਪ੍ਰੋਜੈਕਟ ਭਾਸ਼ਾ ਵਿਗਿਆਨੀ
ਸਿਸਟਮ ਐਨਾਲਿਸਟ
ਲੈਕਸੀਕਲ ਐਂਟਰੀ ਅਪਰੇਟਰ
- ਮਿਸ ਮਨਦੀਪ ਕੌਰ
- ਸ੍ਰੀ ਸੰਦੀਪ ਮਲਹੋਤਰਾ
|