Potocolos OAI-PMH / OAI-ORE

De IBICT
Ir para: navegação, pesquisa

Se deseja saber mais sobre esse o protocolo, poderá acessar o Fórum OAI, que tem como publico alvo os iniciantes no estudo dessa tecnologia.

De início, o ponto chave na comunicação OAI é a definição de dois diferentes tipos de agentes: provedores de dados (data providers) e provedores de serviço (service providers). O provedor de dados é quem, de fato, contém o documento, ou o arquivo, que será disponibilizado na rede. E o provedor de serviço é quem realiza a coleta da descrição dos documentos para dentro de sua base, esta é o que se denomina por operação de harversting dos metadados.


Figura retirada do site http://www.oaforum.org/tutorial


Dois exemplos de provedores de serviço são o Oasisbr e a BDTD, e portanto todos os demais agentes relacionados: repositórios, revistas etc, se configuram como provedores de dados na comunicação OAI-PMH.

O módulo OAI do DSpace

O DSpace possui módulo nativo, pré-configurado, de comunicação por meio do protocolo OAI-PMH e OAI-ORE.

Este módulo permite que ele trabalhe tanto como provedor de dados (fornecendo informações para provedores remotos), quanto como provedor de serviço (realizando coleta de metadados de provedores remotos).

Em sua instalação padrão, o OAI está disponível dentro da pasta [dspace-base]/webapps/oai/ da instalação do DSpace. E para sua ativação, deve-se seguir os seguintes passos:

  1. Copiar as pastas [dspace-base]/webapps/oai/ e [dspace-base]/webapps/solr/ para dentro da webapps, do servidor de aplicação Apache-Tomcat;
  2. Reiniciar o servidor Apache-Tomcat;
  3. Executar o comando:
[dspace-base]/bin/dspace oai import

O DSpace como provedor de dados

Se o módulo OAI estiver ativo no servidor de aplicação, ele poderá ser acessado por meio da URL: http://www.meuservidor.com.br/oai/request?verb=Identify. Onde a palavra www.meuservidor.com.br deverá ser substituída pelo endereço WEB de seu servidor de aplicação, incluindo a porta, se for o caso (por exemplo www.meuservidor.com.br:8080). Um modo de se testar se o servidor OAI está respondendo é inserir a mencionada URL no navegador, e, assim deve-se obter como resposta uma tela com a descrição do servidor provedor de dados. A equipe da Lyncode desenvolveu uma interface específica de comunicação com usuário para os protocolos OAI, a partir da versão 3.0 do DSpace ela já está nativa na istalação. Logo se estiver utilizando a versão 3.x receberá como retorno um ambiente gráfico à requisição http://www.meuservidor.com.br/oai/request?verb=Identify. Caso contrário a reposta será somente um arquivo de extensão xml.

Xoai-screen.jpg


Tão logo o módulo OAI esteja ativo, há a possibilidade de se compartilhar os dados do repositório, e endereço a ser informado para coleta (tanto no caso da BDTD, como do Oasisbr) é o http://www.servidor.com.br/oai/request. Lembrando que a palavra www.meuservidor.com.br deverá ser substituída pelo endereço WEB de seu servidor de aplicação (normalmente o Apache-Tomcat), incluindo a porta, se for o caso (por exemplo www.servidor.com.br:8080).

O DSpace como provedor de serviço

Para configurar coleções que obtêm seu acervo pelo processo de harvesting, há uma aba própria (fonte do conteúdo ou, em inglês, "content source"). Nessa aba há várias configurações para adequar o processo de coleta que irá criar o acervo da coleção. Nesse processo os itens não passam por um fluxo de submissão, nem mesmo ocorre a catalogação.

No final do processo, o acervo será composto apenas de referências dos documentos (os metadados), com link para o objeto digital, que estará em outra iniciativa de arquivos abertos.

A primeira configuração refere-se à indicação de que a coleção não é padrão, mas seu acervo deverá ser oriundo de harvesting. Ao selecionar essa opção, os outros campos são apresentados, podendo configurar como a coleta ocorrerá. Nesse caso, o acervo é, preferencialmente, proveniente de harvesting, mas nada impede que se submeta itens para essa coleção.


XMLUI JSPUI
Oai-teste-xmlui.jpg
Oai-teste-jspui.jpg


O OAI-Provider, nesse formulário, é um endereço (URL) da iniciativa que responde ao harvester - provedor de dados. Geralmente os provedores de dados fornecem essa URL, indicando o endereço que responde às requisições feitas pelo protocolo de coleta de metadados. Esse campo é obrigatório e deve ser preenchido com o endereço completo, inclusive com o http://. caso tenha dificuldades, entre em contato com a equipe técnica do provedor de dados que deseja coletar metadados.

A coleta pode ser feita para todo o acervo do provedor de dados ou só para um conjunto (set). caso selecione a opção por conjunto, deve-se indicar o nome do conjunto que se deseja coletar. Pode-se saber o nome dos conjuntos (Sets) utilizando o verbo ListSets do protocolo de harvesting. O conjunto (Set) é de organização interna do repositório e no DSpace, por exemplo, relaciona-se às coleções. Assim, se coletar de um repositório baseado em DSpace, pode-se coletar de todo o repositório ou apenas de uma coleção.

O formato de metadados refere-se a Dublin Core, Dublin Core qualificado e formato DSpace, que são esquemas de metadados suportados pelo protocolo coletor (Harvester). Pode-se saber a quais esquemas de metadados um provedor de dados responde pelo verbo ListmetadataFormats do protocolo de harvesting. Na maioria dos casos usa-se o esquema de metadados Dublin Core, que é o mais simples.

As opções de harvesting possuem três níveis de coleta, que são: somente metadados, metadados mais referências dos objetos digitais e metadados mais os objetos digitais. Essas opções indicam qual o formato dos registros que comporão o acervo da coleção. A mais simples refere-se apenas aos metadados, enquanto a mais complexa coleta os metadados e os objetos digitais, trazendo todo o item. Para utilizar a opção de coletar os objetos digitais, o provedor de dados deve implementar suporte ao Object Reuse and Exchange (ORE).