DACyTAr - Datos Primarios en Acceso Abierto de la Ciencia y la Tecnología Argentina
News Style Corpus v2
Registro completo
- Título
- News Style Corpus v2
- Autor(es)
- Przybiła, Piotr; Soto, Axel Juan
- Afiliación(es) del/de los autor(es)
-
Przybiła, Piotr. Polish Academy of Sciences; Argentina
Soto, Axel Juan. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina
- Resumen
-
El corpus utilizado en esta investigación contiene 95.900 documentos de 199 fuentes. News Style Corpus v2 se basa en un corpus anterior (https://github.com/piotrmp/fakestyle), utilizando el trabajo de PolitiFact (https://www.politifact.com/punditfact/article/2017/apr/20/politifacts-guide-fake-news-websites-and-what-they/) y Pew Research Center (https://www.journalism.org/2014/10/21/political-polarization-media-habits/) para evaluaciones de credibilidad en función de su origen. Esta versión refina la anterior mediante la extracción de texto sin formato a través de la biblioteca unfluff (https://github.com/ageitgey/node-unfluff) y la eliminación de documentos con contenido insuficiente.
- Año de publicación
- Idioma
-
inglés
- Formato (Tipo MIME)
-
text/plain
- Clasificación temática de acuerdo a la FORD
- Ciencias informáticas y de la información
- Condiciones de uso
- Disponible en acceso abierto bajo licencia Creative Commons https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio digital
- CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
- Identificador de proyecto
- POLISH NATIONAL AGENCY FOR ACADEMIC EXCHANGE/PPN/PPO/2018/1/00006
- Identificador de proyecto
- Google Limited Liability Company (google Llc)/PPN/PPO/2018/1/00006
- Identificador de proyecto
- Ministerio de Ciencia, Tecnología e Innovación Productiva/PPN/PPO/2018/1/00006
- Identificador de proyecto
- POZNAN SUPERCOMPUTING AND NETWORKING CENTER/PPN/PPO/2018/1/00006
Citación
Przybiła, Piotr Soto, Axel Juan (): News Style Corpus v2. Consejo Nacional de Investigaciones Científicas y Técnicas, http://hdl.handle.net/11336/162377.