Saltar al contenido

M11- Detección Automática de Plagio.

Tutor: Pablo Nicolás Ramos

Descripción

A partir de la aplicación de técnicas de aprendizaje automático y procesamiento del lenguaje natural, se pretende analizar textos con el fin de determinar si estos se pueden clasificar como posibles casos de plagio. La detección automática de plagio estudia tres enfoques: detección de plagio intrínseco, detección de plagio explícito y de detección de plagio translingüe. El último enfoque escapa al presente trabajo de mentoría. Se parte de la hipótesis de que todo individuo es capaz de plasmar sus ideas mediante el lenguaje escrito de manera única, es decir, es poco probable que dos personas expresen sus ideas del mismo modo. En otras palabras, cada persona tiene una forma de escribir que la diferencia del resto, entonces si un documento de texto presenta alguna variación significativa en un fragmento, dicha sección puede ser considerada como un potencial caso de plagio.
Se trabajarán con documentos de textos, de acceso libre, provisto por la competencia internacional de plagio. El corpus con el que se trabajará se denomina PAN-PC-2011. Para evaluar los algoritmos desarrollados se utilizará un script codificado por dicha competencia. A esta propuesta de Detección Automática de Plagio se le sumaron ciertas etapas que forman parte de la Ciencia y Minería de Datos.

Este tema es interesante porque...

La detección automática de plagio permite detectar textos, de manera sistemática, que posiblemente fueron plagiados. Las personas de cualquier campo del conocimiento, invierten tiempo en investigación, creación y aplicación de conocimiento; entonces descubrir a aquellos individuos que sólo buscan quedarse con el crédito por el trabajo realizado por otra persona se vuelve una tarea indispensable.

Trataremos de responder algunas de las siguientes preguntas

– ¿Cuáles son las características específicas de los textos que indican la presencia de plagio intrínseco?
– ¿Cómo se puede identificar el plagio intrínseco de manera más precisa y eficiente utilizando técnicas de procesamiento de lenguaje natural y aprendizaje automático?
– ¿Cómo se pueden diseñar algoritmos de detección de plagio intrínseco que sean más efectivos y precisos independientemente del idioma?
– ¿Cómo se pueden prevenir el plagio intrínseco en la enseñanza y la producción de textos académicos y científicos?
– ¿Cómo se pueden detectar y prevenir el plagio intrínseco en la producción de textos en el mundo laboral y profesional?

Integrantes del grupo 1
Emilse Ferreyra - Agustin Osiecki -
Agustina Maini - Lucas Cardacci.
Integrantes del grupo 2
Pedro Bonafe - Jorge Huck.