Plug-in de exportação do aplicativo TEDE para DSpace

De IBICT
Ir para: navegação, pesquisa

Índice

Introdução

O Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict), no âmbito de sua missão, lançou em 2002, a Biblioteca Digital Brasileira de Teses e Dissertações (BDTD), um serviço inovador, que distribuiu o aplicativo TEDE (teses e dissertações eletrônicas), visando à criação de bibliotecas digitais de teses e dissertações nas Instituições de Ensino Superior (BDTD-Local). Com isso, visou a formação de uma rede, que possibilitasse a interoperabilidade de metadados entre seus participantes. Dez anos depois, em 2012, a BDTD conta com mais de 200 mil registros, oriundos de 97 instituições brasileiras. Houve ainda uma outra iniciativa de acesso aberto à informação científica que objetivou fomento à implantação de repositórios institucionais (RI), e viabilizou a preservação e disseminação da produção intelectual de uma instituição. Nesse caso, o software escolhido para transferência às instituições interessadas foi o DSpace, por ser aceito e utilizado amplamente no mundo, principalmente, nas instituições de ensino e pesquisa. O que hoje se observa é que em algumas instituições, a manutenção de uma BDTD-Local e um repositório institucional revelou-se redundante, visto que, há interesse de que as teses e dissertações, também, constituam coleções no repositório institucional. Para tanto, necessitam de uma facilidade que exporte os registros do sistema TEDE para um formato que possam ser importado em sistemas DSpace. Nesse contexto, o Plug-in de exportação TEDE-DSpace visa apoiar as instituições que utilizam o sistema TEDE e pretendem constituir uma coleção de teses e dissertações no repositório institucional. Dessa forma, o Ibict renova o compromisso de atualizar as tecnologias associadas aos seus serviços, mantendo as instituições integradas à Rede BDTD, ao mesmo tempo em que, possibilita a consolidação dos repositórios institucionais implementados com o DSpace.

Descrição e funcionamento do Plug-in

O Plug-in exportador foi desenvolvido conforme a tecnologia utilizada no desenvolvimento do sistema TEDE, assim, integra-se totalmente, de forma transparente, e sem grandes necessidades de modificações no sistema. Por esse motivo, não possui um instalador, basta apenas copiar alguns arquivos e sobrescrever outros, para a sua total instalação. Ao adicionar uma nova opção no menu do administrador, o plug-in de exportação, promove maior segurança ao processo de exportação. Assim, só quem tem permissão pode executá-lo. O Plug-in executa uma exportação, tanto dos metadados, quanto dos arquivos das teses e dissertações, em um formato de importação no DSpace, de forma automática. Da mesma forma que, apresenta uma tela com os resultados do processo de exportação, permitindo verificar o processo de exportação, levantar os erros e a ver a quantidade de registros processados. Desse modo permite realizar ações para correções de problemas que porventura possa ter. Todo o processo é executado na interface do sistema TEDE, como administrador, não requerendo a intervenção da equipe de TI. Somente para a copia e transferência dos arquivos exportados para o servidor do DSpace será necessária o apoio da equipe de TI. Deve-se ressaltar que o processo de exportação pode ser re-executado quantas vezes forem necessárias, para correção de possíveis erros.

Instalação do Plug-in

A instalação do Plug-in dá-se por meio de cópia de arquivos em diretórios específicos, não existindo um instalador. Assim, a seguir, o passo-a-passo para a instalação:

Passo 1: Obter o Plugin

O Plugin está disponível, em formato compactado, com extensão .rar, para ser baixado em exportador.rar. Ele pode ser baixado diretamente no servidor do sistema Tede ou em um desktop e transferido para o servidor.

Passo 2: Fazer cópia de segurança do sistema TEDE

O Plug-in de exportação não faz grandes alterações no sistema TEDE, que modifique os dados das teses e dissertações contidos no sistema, mas por precaução, é altamente recomendável que se faça uma cópia de segurança em todo procedimento de manutenção de sistemas informatizados. Assim, fazer uma cópia de segurança, tanto dos programas quanto das bases de dados, alinha-se aos procedimentos padrão de manutenção do sistema TEDE. Com essa diretriz, assegura-se a integridade original de todo o sistema TEDE. Caso venha ocorrer algum problema, basta retornar a copia de segurança para ter o sistema no estado original. Para os programas e arquivos, basta copiar o sistema de diretório do sistema TEDE desde o diretório raiz (diretório inicial do sistema, em que está contido todo o sistema). Geralmente, se instalado na forma padrão, por ser um sistema PHP/Apache, ele fica no diretório /var/www/[nome-do-diretório-tede]. Para copiar, pode-se utilizar o comando de sistema operacional cp –R que copia recursivamente os diretórios:

 cp –R /var/www/[nome-do-diretório-tede] /var/www/[nome-do-backup] 

Para as bases de dados (o sistema TEDE possui duas bases de dados, TDE e TDE_SUBMISSÃO em um programa gerenciador de banco de dados MySql, e é importante que a cópia de segurança contemple as duas) pode-se fazer uso das facilidades de backup de banco de dados do MySql, da seguinte forma:

 mysqldump -u [nomedousuario] -p [nomeBanco] > [nomeBackUp] 

Passo 3: Descompactar o Plug-in de exportação

O Plug-in de exportação deve ser descompactado ou copiado para o diretório raiz do sistema TEDE, o que sobrescreverá alguns arquivos. Por isso, é importante a copia de segurança. Ele criará, entre outras, uma nova pasta chamada arquivo-exportacao e sobrescreverá, também, arquivos na pasta tde-admin. A questão crítica é a de que o plugin deve manter as funcionalidades existentes, e apenas copiar ou sobrescrever código para implementar a nova ferramenta de exportação. A estrutura do Plug-in é a seguinte:

  • arquivo-exportacao (pasta vazia em que as teses e dissertações serão exportadas, pasta destino dos dados exportados)
  • tde-admin (pasta existente no sistema TEDE, com os programas novos e alterados)
    • biblioteca (pasta existente no sistema, com novos programas)
  • export.php (programa exportador)
    • detalhar_export.php (página de detalhamento da exportação)
    • exportar.php (página de detalhamento da exportação)
    • tde_admin.php (página de administração do sistema TEDE, único programa a ser sobrescrito, para que se adicione a opção de menu exportação)
    • tela_export.php (página de exportação)
  • log-export.sql (script para alteração da base de dados TDE para criar a tabela que armazenará logs da exportação).

Passo 4: Verificar permissões

Como o Plug-in precisará criar pastas e arquivos no diretório “arquivos_exportacao”, o sistema TEDE requer permissão de escrita neste diretório. Para tanto, use o comando de sistema operacional chmod com o argumento –R (recursivo a todos os subdiretórios) e 755 (7=permissão total para o dono do sistema, 5=leitura e execução para os membros do grupo do dono do sistema, e 5= leitura e execução para os demais usuários). Assim, de forma padrão, o comando ficaria assim:

 chmod  –R 755 [usuário-Apache:grupo-Apache] arquivo-exportacao 

Salvo configurações diferentes da padrão no servidor Apache, o usuário-Apache e o grupo-Apache são ambos www-data. Para se verificar essa informação, pode-se dar o comando:

 ps – ef | grep apache 

Uma lista é apresentada, e na primeira coluna aparece sempre o usuário do sistema Apache.

Passo 5: Criar tabela para registros de log da exportação

Como o Plug-in de exportação contempla o registro e visualização do procedimento de exportação, diretamente na interface do sistema TEDE, uma tabela de banco de dados deve ser criada para esse fim. Para tanto, o arquivo log_export.sql é um script MySql que cria essa tabela. O que pode ser feito manualmente com o seguinte comando SQL (Structured Query Language) no SGBD (Sistema Gerenciador de Banco de Dados) do MySql:

CREATE TABLE `log_export` (
`le_data` datetime NOT NULL,
`tsIdentificador` int(11) NOT NULL,
`le_metadados` text,
`le_arquivos` text
) ENGINE=MyISAM DEFAULT CHARSET=latin1;

Esse procedimento deve ser feito na base de dados TDE (lembrando que o sistema TEDE possui duas bases de dados). Para executar o procedimento, pode-se utilizar as facilidades ofertadas pelo SGBD do MySql, conforme o exemplo abaixo:

mysql -u [nome-do-usuario] -p [nome-do-banco] < log_export.sql

Caso não esteja na pasta onde o log_export.sql resida, coloque todo o caminho do arquivo, por exemplo: "/var/www/tede..../log_export.sql", com a descrição do caminho entre aspas duplas.

Execução da exportação

A execução da exportação das teses e dissertações do sistema TEDE, no formato DSpace, dá-se na página de administrador. Para tanto o usuário deve ter acesso (usuário e senha) para executá-lo. Ao entrar na página do administrador, surge à esquerda, uma nova opção no menu Exportador DSPACE, como mostra a figura abaixo:


Menu-dspace.jpg


Ao clicar na opção de menu Exportador DSPACE, uma nova tela será apresentada com um menu com duas opções Exportar e Visualizar, como mostra a próxima figura. Esta é a página de histórico e mantém as informações da última exportação. Para exportar as teses e dissertações, clique em exportar, para visualizar o resultado da exportação, clique em Visualizar.


Exportar.png


Na tela de visualização, há a opção de detalhar o processo de exportação, clique em detalhar. Assim, o sistema apresenta uma lista de todas as teses e dissertações exportadas e o status final do processo. Pode-se verificar os registros que sofreram erro na exportação para que seja possível fazer as devidas correções visando uma nova tentativa.


Relatorio.png


Ao clicar na opção de menu Exportar uma tela de confirmação será apresentada. Esse procedimento pode ser feito várias vezes, pois o programa cria uma estrutura para cada exportação das teses e dissertações. Assim, ao verificar, pelo detalhamento, algum problema, pode-se corrigir e reexecutar a exportação. A exportação pode demorar alguns segundos, pois precisar criar, para cada tese ou dissertação, um sistema de diretórios com arquivos. Ao término da exportação, a tela de resumo do processo será apresentada. Nessa página, pode-se verificar as condições de termino da exportação, quantidade de itens exportados e erros.


Final.png


Ao executar a exportação, o Plug-in cria um sistema de identificação da exportação na pasta arquivo_exportacao, conforme a data e hora de execução. Assim, para cada exportação um diretório exclusivo será criado. Cada item (tese ou dissertação) estará contido em uma pasta numerada sequencialmente, que conterá os seguintes arquivos:

  • content (arquivo texto com o conteúdo da pasta, pois uma tese ou dissertação pode ter mais que um arquivo de texto completo, e estar dividida em volumes;
  • dublin_core.xml (arquivo contendo os metadados da tese ou dissertação, no formato QDC, para o DSpace);
  • arquivos da tese ou dissertação (os arquivos em texto completo).