మాటలకు.. అక్షర రూపం!

IMG-20201218-WA0002.jpg

*మాటలకు.. అక్షర రూపం!*

*మహత్తర క్రతువు చేపట్టిన ఐఐఐటీ* *ప్రాజెక్టుకు రూ.కోటి నిధులు కేటాయించిన కేంద్రం*

ప్రయోగాత్మకంగా తెలుగులో అమలు, తర్వాత అన్ని భాషల్లో మాట్లాడే మాటలకు అంతే వేగంగా అక్షర రూపం ఇచ్చే క్రతువుకు హైదరాబాద్‌లోని ఇంటర్నేషనల్‌ ఇన్‌స్టిట్యూట్‌ ఆఫ్‌ ఇన్‌ఫర్మేషన్‌ టెక్నాలజీ(ఐఐఐటీ) శ్రీకారం చుట్టింది.

కేంద్ర ఎలక్ట్రానిక్స్‌, సమాచార సాంకేతిక శాఖ, నీతి ఆయోగ్‌ ఆధ్వర్యంలో ‘క్రౌడ్‌ సోర్సింగ్‌ ఆఫ్‌ స్పీచ్‌ డాటా సెర్చ్‌’ పేరిట మాట్లాడే భాషను కృత్రిమ మేధ సాయంతో నేరుగా అక్షరాలు(టెక్స్ట్‌)గా మార్చనున్నారు.

ఈ ప్రాజెక్టుకు ఐఐఐటీ ప్రొడక్ట్‌ ల్యాబ్‌ హెడ్‌ ప్రకాశ్‌ ఎల్లా, స్పీచ్‌ ప్రాసెసింగ్‌ ల్యాబ్‌ సహాయ ఆచార్యుడు అనిల్‌ ఉప్పాల సారథ్యం వహిస్తున్నారు. తొలుత తెలుగు భాషలో ప్రాజెక్టు చేపడుతుండగా, రెండో దశలో 15 భారతీయ భాషలకు దాన్ని విస్తరించాలని కేంద్ర ప్రభుత్వం భావిస్తోంది. *‘రెండు వేల గంటల’ ప్రసంగాల సేకరణ* సాధారణంగా సంభాషణను అక్షర రూపంలోకి మార్చేందుకు ఆటోమేటిక్‌ స్పీచ్‌ రికగ్నిషన్‌(ఏఎస్‌ఆర్‌) సాంకేతికతను వినియోగిస్తారు. ఇది భారతీయ భాషల్లో పెద్దగా అందుబాటులో లేదు. కొన్ని అప్లికేషన్లు ఉన్నా సామాన్యులు మాట్లాడే భాషను, యాసను అర్థం చేసుకోలేపోతున్నాయి.

ఈ పరిస్థితుల దృష్ట్యా జన బాహుళ్యంలో ఉన్న భాషకు అక్షరరూపం ఇచ్చే సాంకేతికతను అభివృద్ధి చేయాల్సిన అవసరం ఉందని ఐఐఐటీ పాలకమండలి అధ్యక్షుడు, ప్రొఫెసర్‌ రాజ్‌రెడ్డి కేంద్ర ప్రభుత్వానికి ప్రతిపాదించారు.

దీనికి కేంద్రం సుముఖత వ్యక్తంచేసింది. తొలుత ప్రయోగాత్మకంగా తెలుగుభాషను ఎంపిక చేసి, ప్రాజెక్టు మంజూరు చేయడంతోపాటు రూ.కోటి కేటాయించింది. ఇందులో భాగంగా వచ్చే ఏడాది అక్టోబరులోగా రెండు వేల గంటల ప్రసంగాన్ని (స్పీచ్‌ డాటా) సేకరించి అక్షర రూపంలోకి మార్చనున్నారు.

*ఎలా చేస్తారంటే*

ఈ ప్రాజెక్టు కోసం ట్రిపుల్‌ ఐటీ ప్రత్యేకంగా అప్లికేషన్‌ను రూపొందించింది. విద్యార్థులకు వక్తృత్వ పోటీలు నిర్వహించడం ద్వారా ప్రసంగాన్ని (స్పీచ్‌) సేకరించాలని నిర్ణయించింది. ‘తొలుత సంక్షిప్త సందేశం ద్వారా వెబ్‌ లింక్‌ పంపుతాం. అందులో విద్యార్థులు వివిధ అంశాలపై మాట్లాడతారు. సదరు సమాచారం రాగానే వ్యక్తుల గుర్తింపును (ఐడెంటిటీ) తొలగిస్తాం.

సదరు ప్రసంగాన్ని చిన్నచిన్న భాగాలుగా విభజించి అక్షర రూపంలోకి మారుస్తాం. అనంతరం లేఖకుల (ట్రాన్స్‌స్కైబర్స్‌) సాయంతో తప్పులను సరిచేస్తాం. తెలుగు భాషలో యాస ఎక్కువగా ఉంటుంది.

ప్రాంతాల వారీగా మాట్లాడే తీరు మారుతుంటుంది. దీనికి తగ్గట్టుగా సాధారణ ప్రజలతోనూ మాట్లాడించి, దాని ఆధారంగా డాటాను అభివృద్ధి చేస్తాం’ అని ఈ ప్రాజెక్టులో పాలుపంచుకుంటున్న ఎల్లా ప్రకాశ్‌, ఆచార్య అనిల్‌ ఉప్పాల వెల్లడించారు.

ఆ మాటలు లేదా ప్రసంగాల్లో ఆంగ్లం, సంఖ్యలు, ఊత పదాలు ఉంటాయని, ఇలా అన్నింటినీ గుర్తించి అక్షరరూపంలోకి మారుస్తామని తెలిపారు.


Discover more from TeluguWonders

Subscribe to get the latest posts sent to your email.

Leave a Reply

Discover more from TeluguWonders

Subscribe now to keep reading and get access to the full archive.

Continue reading

Verified by MonsterInsights