Descubrimiento de relaciones semánticas entre autores y temas de investigación en artículos científicos



Descubrimiento de relaciones semánticas entre autores y temas de investigación en artículos científicos

Karla del Carmen Durán Arévalo
 

Texto completo de la Tesis            Video del evento          

 



Resumen

 

Encontrar relaciones semánticas entre autores de artículos científicos y temas de investigación permite ofrecer servicios de búsqueda de información confiable sobre quiénes son las personas expertas que trabajan sobre un área de investigación y sobre qué artículos científicos ofrecen la información más adecuada sobre un tema. El problema a resolver para ofrecer estos servicios es encontrar los datos apropiados que generalmente son obtenidos de trabajos científicos publicados, que permitan descubrir las relaciones semánticas que formen redes de investigadores sobre distintos temas científicos. El propóosito de esta tesis es crear una herramienta para extraer datos de artículos científicos que permitan encontrar relaciones semánticas entre autores de artículos científicos y sus temas de investigación, lo que permitiría al usuario realizar búsquedas efcientes de artículos científicos y de personas dedicadas a una misma área de investigación. Se busca obtener únicamente los datos más relevantes que dan información general del artículo, que son título, autor, palabras clave y resumen. Con los datos obtenidos, se realiza un análisis sintáctico de las oraciones del resumen que involucren las palabras clave del documento para formar relaciones semánticas entre los artículos científicos y sus autores. El anáalisis sintáctico de las oraciones se realiza mediante un nuevo método que obtiene la similitud entre un par de oraciones. Después de extraer los datos del artículo, analizarlos y encontrar relaciones semánticas, la información generada es almacenada en una ontología con la cual es posible realizar consultas para obtener la información más adecuada para el usuario.

 

Abstract

Finding semantic relations between authors of scientific articles and research topics provides can provide a reliable information about who are the experts working in an area of research and which scientific articles can offer the best information on a subject. The problem is that in order to offer services to find the appropriate information these are usually obtained from published scientific papers by discovering semantic relations form networks of researchers in different scientific topics. The purpose of this thesis is to create a tool for extracting data from scientific articles and finding semantic relationships between authors of scientific articles and their research topics, the aim of this proposal is to allow to users to perform efficient searches of scientific papers and researchers engaged in the same area research. By obtaining the most relevant information in the article, as title, author, keywords and abstract a syntactic analysis of sentences is performed, this analysis involves the document keywords to form semantic relations between scienti c articles and their authors. The syntactic analysis of sentences is performed by a new method which obtains the similarity between a pair of sentences. After the analyze of data and discovering the semantic relations, the information generated is stored in an ontology where which it is possible to search the most relevant information for the users.