Corpus del español de Mark Davies
CORPUS DEL ESPAÑOL DE MARK DAVIES
Es un corpus de referencia subvencionado por el programa de Estados Unidos. Forma parte de la colección .
Está dividido en dos bloques fundamentales:(1) género/ histórico, contiene textos orales, ficción, prensa y académicos desde el siglo XIII hasta el siglo XX. Permite buscar cambios históricos y variación de géneros (100 millones de palabras),(2) webs/dialectos, incluye textos más recientes (tres o cuatro años de antigüedad) extraídos de páginas webs de 21 países hispanohablantes. Permite investigar variaciones dialectales (2000 millones de palabras).
Además, cabe destacar que su interfaz permite crear “corpus virtuales”, a partir de un conjunto determinado de autores, fuentes o temas.