சுருக்கம்

Automatic Language Identification from Written Texts ? An Overview

H L Shashirekha

Language Identification is the task of automatically identifying the language(s) in which the content is written in a document (web page, text document). Due to the widespread use of internet, identification of languages has become an important preprocessing step for a number of applications such as machine translation, Part-of-Speech tagging, linguistic corpus creation, supporting low-density languages, accessibility of social media or user-generated content, search engines and information extraction in addition to processing multilingual documents. In a multilingual country like India, Language Identification has wider scope to bridge the digital divide between different language users. This paper presents a brief overview of the challenges involved in automatic language identification, existing methodologies and some of the tools available for language identification.

குறியிடப்பட்டது

Index Copernicus
கல்வி விசைகள்
CiteFactor
காஸ்மோஸ் IF
RefSeek
ஹம்டார்ட் பல்கலைக்கழகம்
அறிவியல் இதழ்களின் உலக பட்டியல்
சர்வதேச புதுமையான இதழ் தாக்க காரணி (IIJIF)
சர்வதேச அமைப்பு ஆராய்ச்சி நிறுவனம் (I2OR)
காஸ்மோஸ்

மேலும் பார்க்க