*మాటలకు.. అక్షర రూపం!*
*మహత్తర క్రతువు చేపట్టిన ఐఐఐటీ* *ప్రాజెక్టుకు రూ.కోటి నిధులు కేటాయించిన కేంద్రం*
ప్రయోగాత్మకంగా తెలుగులో అమలు, తర్వాత అన్ని భాషల్లో మాట్లాడే మాటలకు అంతే వేగంగా అక్షర రూపం ఇచ్చే క్రతువుకు హైదరాబాద్లోని ఇంటర్నేషనల్ ఇన్స్టిట్యూట్ ఆఫ్ ఇన్ఫర్మేషన్ టెక్నాలజీ(ఐఐఐటీ) శ్రీకారం చుట్టింది.
కేంద్ర ఎలక్ట్రానిక్స్, సమాచార సాంకేతిక శాఖ, నీతి ఆయోగ్ ఆధ్వర్యంలో ‘క్రౌడ్ సోర్సింగ్ ఆఫ్ స్పీచ్ డాటా సెర్చ్’ పేరిట మాట్లాడే భాషను కృత్రిమ మేధ సాయంతో నేరుగా అక్షరాలు(టెక్స్ట్)గా మార్చనున్నారు.
ఈ ప్రాజెక్టుకు ఐఐఐటీ ప్రొడక్ట్ ల్యాబ్ హెడ్ ప్రకాశ్ ఎల్లా, స్పీచ్ ప్రాసెసింగ్ ల్యాబ్ సహాయ ఆచార్యుడు అనిల్ ఉప్పాల సారథ్యం వహిస్తున్నారు. తొలుత తెలుగు భాషలో ప్రాజెక్టు చేపడుతుండగా, రెండో దశలో 15 భారతీయ భాషలకు దాన్ని విస్తరించాలని కేంద్ర ప్రభుత్వం భావిస్తోంది. *‘రెండు వేల గంటల’ ప్రసంగాల సేకరణ* సాధారణంగా సంభాషణను అక్షర రూపంలోకి మార్చేందుకు ఆటోమేటిక్ స్పీచ్ రికగ్నిషన్(ఏఎస్ఆర్) సాంకేతికతను వినియోగిస్తారు. ఇది భారతీయ భాషల్లో పెద్దగా అందుబాటులో లేదు. కొన్ని అప్లికేషన్లు ఉన్నా సామాన్యులు మాట్లాడే భాషను, యాసను అర్థం చేసుకోలేపోతున్నాయి.
ఈ పరిస్థితుల దృష్ట్యా జన బాహుళ్యంలో ఉన్న భాషకు అక్షరరూపం ఇచ్చే సాంకేతికతను అభివృద్ధి చేయాల్సిన అవసరం ఉందని ఐఐఐటీ పాలకమండలి అధ్యక్షుడు, ప్రొఫెసర్ రాజ్రెడ్డి కేంద్ర ప్రభుత్వానికి ప్రతిపాదించారు.
దీనికి కేంద్రం సుముఖత వ్యక్తంచేసింది. తొలుత ప్రయోగాత్మకంగా తెలుగుభాషను ఎంపిక చేసి, ప్రాజెక్టు మంజూరు చేయడంతోపాటు రూ.కోటి కేటాయించింది. ఇందులో భాగంగా వచ్చే ఏడాది అక్టోబరులోగా రెండు వేల గంటల ప్రసంగాన్ని (స్పీచ్ డాటా) సేకరించి అక్షర రూపంలోకి మార్చనున్నారు.
*ఎలా చేస్తారంటే*
ఈ ప్రాజెక్టు కోసం ట్రిపుల్ ఐటీ ప్రత్యేకంగా అప్లికేషన్ను రూపొందించింది. విద్యార్థులకు వక్తృత్వ పోటీలు నిర్వహించడం ద్వారా ప్రసంగాన్ని (స్పీచ్) సేకరించాలని నిర్ణయించింది. ‘తొలుత సంక్షిప్త సందేశం ద్వారా వెబ్ లింక్ పంపుతాం. అందులో విద్యార్థులు వివిధ అంశాలపై మాట్లాడతారు. సదరు సమాచారం రాగానే వ్యక్తుల గుర్తింపును (ఐడెంటిటీ) తొలగిస్తాం.
సదరు ప్రసంగాన్ని చిన్నచిన్న భాగాలుగా విభజించి అక్షర రూపంలోకి మారుస్తాం. అనంతరం లేఖకుల (ట్రాన్స్స్కైబర్స్) సాయంతో తప్పులను సరిచేస్తాం. తెలుగు భాషలో యాస ఎక్కువగా ఉంటుంది.
ప్రాంతాల వారీగా మాట్లాడే తీరు మారుతుంటుంది. దీనికి తగ్గట్టుగా సాధారణ ప్రజలతోనూ మాట్లాడించి, దాని ఆధారంగా డాటాను అభివృద్ధి చేస్తాం’ అని ఈ ప్రాజెక్టులో పాలుపంచుకుంటున్న ఎల్లా ప్రకాశ్, ఆచార్య అనిల్ ఉప్పాల వెల్లడించారు.
ఆ మాటలు లేదా ప్రసంగాల్లో ఆంగ్లం, సంఖ్యలు, ఊత పదాలు ఉంటాయని, ఇలా అన్నింటినీ గుర్తించి అక్షరరూపంలోకి మారుస్తామని తెలిపారు.
Discover more from Telugu Wonders
Subscribe to get the latest posts sent to your email.