Lingüística de Corpus
La Lingüística de Corpus (LC) se define como “una rama de la lingüística que basa sus investigaciones en datos obtenidos a partir de corpus” (Martín Peris et al., 2008). Más que una disciplina en sentido estricto, la LC es un enfoque metodológico interdisciplinar que ha transformado los estudios lingüísticos actuales, basando sus estudios en la confección y análisis de los corpus lingüísticos.
¿Qué es un corpus lingüístico?
Un corpus es una recopilación de muestras reales de lengua (literatura, prensa, discursos, conversaciones, etc.), seleccionadas bajo criterios objetivos previos para ofrecer una representación fiel de la lengua.
En este sentido, la representatividad se convierte en “la piedra angular de la LC, pues de ello depende que se puedan extraer conclusiones fiables a partir de los datos estadísticos” (Cruz Piñol, 2012: 36). Debido a su gran volumen, estos recursos se gestionan habitualmente en formato electrónico, permitiendo la investigación profunda de diversos aspectos de una lengua o de una variedad concreta.
Tipología de Corpus
Siguiendo los estándares internacionales (EAGLES, 1996), clasificamos los corpus según sus objetivos:
-
Corpus de referencia o generales: Pretenden ser una muestra representativa y exhaustiva de las variedades, las estructuras y el vocabulario de una lengua, por lo que suelen ser bastante extensos. Permiten estudiar las características de una lengua en un momento determinado de su historia.
-
Corpus especiales, especializados o con fines específicos: Pese a que existe gran controversia con respecto a la denominación de este tipo de corpus, se puede decir de manera general que son recopilaciones de menor volumen creadas con algún propósito específico. Son representativas de un sublenguaje, o lengua especializada, o del uso lingüístico de un grupo específico de hablantes que posee características comunes.
-
Corpus bilingüe o multilingüe: Dentro de estos tipos podemos distinguir entre:
-
Corpus paralelo: Contienen textos y su traducción a una o varias lenguas.
-
Corpus comparable: Incluyen tipos de textos similares en varias lenguas permitiendo así realizar comparaciones entre ellas.
-
Recursos y Herramientas
Enlaces de interés
Contacta con nosotros: