DACyTAr - Datos Primarios en Acceso Abierto de la Ciencia y la Tecnología Argentina

News Style Corpus v2

Compartir en
redes sociales


Registro completo

Título
News Style Corpus v2
Autor(es)
Afiliación(es) del/de los autor(es)
Przybiła, Piotr. Polish Academy of Sciences; Argentina
Soto, Axel Juan. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina
Resumen
El corpus utilizado en esta investigación contiene 95.900 documentos de 199 fuentes. News Style Corpus v2 se basa en un corpus anterior (https://github.com/piotrmp/fakestyle), utilizando el trabajo de PolitiFact (https://www.politifact.com/punditfact/article/2017/apr/20/politifacts-guide-fake-news-websites-and-what-they/) y Pew Research Center (https://www.journalism.org/2014/10/21/political-polarization-media-habits/) para evaluaciones de credibilidad en función de su origen. Esta versión refina la anterior mediante la extracción de texto sin formato a través de la biblioteca unfluff (https://github.com/ageitgey/node-unfluff) y la eliminación de documentos con contenido insuficiente.
Año de publicación
Idioma
inglés
Formato (Tipo MIME)
text/plain
Clasificación temática de acuerdo a la FORD
Ciencias informáticas y de la información
Condiciones de uso
Disponible en acceso abierto bajo licencia Creative Commons https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio digital
CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
Identificador de proyecto
POLISH NATIONAL AGENCY FOR ACADEMIC EXCHANGE/PPN/PPO/2018/1/00006
Identificador de proyecto
Google Limited Liability Company (google Llc)/PPN/PPO/2018/1/00006
Identificador de proyecto
Ministerio de Ciencia, Tecnología e Innovación Productiva/PPN/PPO/2018/1/00006
Identificador de proyecto
POZNAN SUPERCOMPUTING AND NETWORKING CENTER/PPN/PPO/2018/1/00006

Citación

Przybiła, Piotr Soto, Axel Juan (): News Style Corpus v2. Consejo Nacional de Investigaciones Científicas y Técnicas, http://hdl.handle.net/11336/162377.

Exportar cita