Autor(es):
Pereira, T.
Data: 2007
Identificador Persistente: http://hdl.handle.net/1822/7031
Origem: RepositóriUM - Universidade do Minho
Assunto(s): Revistas científicas; Metadados; RSS; Journals; Metadata
Descrição
Dissertação de Mestrado em Sistemas de Informação Actualmente a Internet é uma importante fonte de informação na descoberta de recursos de informação na Web. De
facto a Internet tornou-se num instrumento de aplicação por parte dos investigadores e cientistas, no
desenvolvimento diário do seu trabalho. O seu crescimento tem contribuído para a transformação dos processos de
distribuição e disseminação do conhecimento científico produzido no seio das comunidades científicas e
consequentemente a reestruturação do sistema de comunicação científica.
Esta dissertação de mestrado tem como objectivo instanciar o sistema desenvolvido no projecto OmniPaper no que
se refere aos mecanismos de recuperação de informação distribuída, desenvolvidos no âmbito das notícias
publicadas em jornais, e instanciá-los no contexto da publicação científica. Outro objectivo prende-se com a
utilização de uma camada central de metadados, desenvolvida com o intuito de proceder à sindicância de conteúdos
científicos, seguindo a abordagem tecnológica RSS.
O RSS é um formato normalizado para agregação e distribuição de conteúdos da Web, facilitando o processo de
consulta e partilha de informação proveniente de diversas fontes de informação, que periodicamente está sujeita a
alterações ou actualizações.
A concepção do protótipo pretende alcançar os objectivos propostos nesta dissertação de mestrado. Assim, foi
definida uma camada de metadados que suporta as funcionalidades de pesquisa e de navegação desenvolvidas, e
permite proceder à sindicância de conteúdos. Na definição camada de metadados estiveram envolvidas diversas
tarefas, nomeadamente o levantamento e análise de diversos vocabulários normalizados de metadados e
extensamente utilizados no domínio da literatura científica, selecção dos elementos de metadados adequados à
descrição dos artigos científicos, seguido da definição do perfil de aplicação e do template RSS. As descrições RSS
das publicações científicas foram armazenadas numa base de metadados e a sua gestão e manipulação é
executada por um sistema de gestão de base de dados nativa RDF. A implementação dos processos de pesquisa e
de navegação foram desenvolvidos no protótipo utilizando a versão RDFS do WordNet e do sistema de classificação
da Association for Computing Machinery Computing Classification System (ACM CCS).
O desenvolvimento destas tarefas resultou num protótipo que é uma instância do sistema desenvolvido no projecto
OmniPaper no contexto da publicação científica, e agrega os metadados dos artigos científicos provenientes do
repositório da APSI, facilitando a sua pesquisa.
Como trabalho futuro sugere-se, entre outras coisas, a implementação do processo de recolha dos metadados de
vários repositórios para a base de metadados aqui implementada possibilitando, assim, o fornecimento de um
serviço mais completo e com mais informação. At present, the Internet is an important source, which enables the finding and access of information on the Web. In
fact, the Internet has become an important tool used daily by researchers and scientists in the development of their
work. Its growth has been promoting the transformation of distribution and dissemination processes of knowledge
produced by scientific communities and as a result the restructuring of the scientific communication system.
This dissertation, intends to instance the system developed in the OmniPaper project, regarding the mechanisms of
distributed information retrieval, developed in the scope of the news published in newspapers, instancing them in the
context of the scientific publication. Another goal, concerns the use of a central metadatabase developed to
accomplish the syndication of contents, through the RSS approach.
The RSS is a format used for the syndicating of content of news published on the Web, facilitating the access and
sharing of information from several sources which are constantly changing.
The implementation of the prototype intends to reach the goals proposed in this master dissertation. In this sense, a
metadata layer supporting the research and developed navigation functionalities was defined, and it allows the
contents syndication. In the definition of the metadata layer several tasks were involved, namely the analysis of
several metadata standard vocabularies widely used in the domain of scientific literature, selection of the metadata
elements which best describe the features of the scientific contents. These elements will be included in the
application profile and in the RSS template defined. The RSS descriptions of the scientific publications were stored in
a metadatabase, through the use of a native RDF database management system. The implementation of the search
and navigation processes was developed in the prototype through the use of the RDFS version of the WordNet and
the RDFS version of classification system of Association for Computing Machinery Computing Classification System
(ACM CCS).
The development of these tasks resulted in a prototype that is an instance of the system developed in the
OmniPaper project, in the context of the scientific publication, and aggregates the metadata of the scientific articles
provided by the APSI repository, facilitating its research.
As future work, among other things, the implement of metadata harvesting from several repositories to the metadata
database implemented in this system is suggested, thus providing a more complete service and one with more
information.