Guia do Usuário - Archivematica
Guia do usuário do Archivematica
Índice |
Apresentação
Archivematica é um sistema gratuito de preservação digital de código aberto, que possibilita o acesso de longo prazo da memória digital. O conteúdo preservado no Archivematica pode ser acessado via AtoM, um sistema de gerenciamento de conteúdo Web. Desenvolvido pela empresa canadense Artefactual Systems, com a colaboração de instituições como a UNESCO, por meio do Memory of the World's - Subcommittee on Technology, o Arquivo Municipal da cidade de Vancouver, o Arquivo Central de Rockefeller, o Arquivo da Universidade Simon Fraser University, a Biblioteca da Universidade de British Columbia e outros. Archivematica está sob AGPL e licenças de código aberto Creative Commons, e sua estrutura de preservação digital está em conformidade com o modelo ISO-OAIS e outras normas de preservação digital.
Sobre o Archivematica
O Archivematica usa um padrão de design de micro serviços para fornecer um conjunto integrado de ferramentas de software que permite ao usuário processar objetos digitais,de ingerir para o acesso em conformidade com o modelo funcional ISO-OAIS. O Usuário monitora e controla os micro serviços através de um painel baseado na web. O Archivematica usa Mets, Premis (eventos, agentes,direitos e restrições), Dublin Core, da Biblioteca do Congresso especificação BagIt e outros padrões e práticas para fornecer pacotes de arquivamento confiáveis , autênticos, confiáveis e interoperáveis (AIP) para o armazenamento em prática o seu melhor repositório preferido. Todo o código do Archivematica é liberado sob a licença GNU Affero General Public License (AGPL 3.0) - o que dá a liberdade de estudar, modificar, melhorar, e distribuí-lo. Acredita-se que parte importante da preservação é a transparência, e que as instituições de memória devem ser capazes de demonstrar, em cada etapa, o que acontece quando eles processam materiais de patrimônio cultural para preservação. O código do Archivematica está sempre disponível gratuitamente, tendo também sua documentação distribuída sob uma licença Creative Commons Share-alike.
O Archivematica fornece vários pontos de decisão que dão, ao usuário, controle sobre as escolhas sobre ferramentas de identificação de formato, impressão da ordem original dos diretórios submetidos, examinando o conteúdo de informações pessoais e privadas, extraindo conteúdo dos pacotes e imagens forenses, transcrevendo conteúdo, e muito mais. Os usuários também podem pré-configurar a maioria destas opções para submeter de forma perfeita ao armazenamento de arquivos e acesso. O Archivematica oferece fluxos de trabalho de submissão: importação de metadados e submissão de documentação, Bags zipadas e não zipadas, processamento de imagens digitais foresnses, reorganização de SIP, normalização manual, e gerenciamento de dataset.
Compatível com centenas de formatos
No Registro da Política de Formatos (FPR), o Archivematica implementa suas políticas de formato padrão com base em uma análise das características significativas de formatos de arquivo. A FPR também oferece um quadro editável, flexível para a identificação formato, extração de pacote, transcrição e normalização para a preservação e acesso. A instituição pode atualizar as ferramentas, regras e comandos em seu FPR local a partir do servidor FPR. Também pode adicionar suas próprias políticas locais à sua FPR interna. O FPR é integrado com o PRONOM.
Integração com terceiros
As Instituições de memória têm dedicado grandes recursos ao longo das duas últimas décadas para implementar várias plataformas de software e ferramentas para gerenciar objetos digitais. Por esta razão, busca-se alavancar a força de outras ferramentas de integração sempre que possível. Destaques:AtoM, DSpace, CONTENTdm, Islandora, LOCKSS, DuraCloud,Arkivum, OpenStack and Archivists' Toolkit. As aplicações de software integradas em Archivematica são cada uma liberada sob a sua própria licença de código aberto. Estas são verificadas quanto à compatibilidade de licenças antes de serem integradas ao projeto. A lista completa de aplicações com sua respectiva licença está disponível na página de external software tools. [1].
Modelo OAIS
O Archivemática, como dito anteriormente, segue o modelo de referência OAIS (Open Archival Information System), que tornou-se em 2003 uma norma internacional, ISO 14721:2003, atualizada para ISO 14721:2012 com o objetivo de estabelecer um sistema de arquivamento de informações, por meio de um esquema organizacional composto de pessoas que aceitam a responsabilidade de preservar as informações e disponibilizá-las para uma comunidade designada.
Transferência
Transfer é o processo de transformar qualquer conjunto de objetos e / ou diretórios digitais em um SIP (Submission Information Package ou Pacotes de Submissão de Informação) . A transformação pode incluir avaliação,arranjo, descrição e identificação de doadores restrito, privado ou conteúdo confidencial.Na guia Transferência, o usuário move objetos digitais de diretórios de origem, acessíveis através do serviço de armazenamento em Archivematica. Uma vez carregado no painel de instrumentos, as transferências executadas através de vários micro-serviços: atribuição UUID; verificação de checksum (se as somas de verificação estão presentes); extração pacote (ou seja, de descompactação de arquivos compactados ou não embalados); verificação de vírus; indexação;identificação formato e validação; e extração de metadados. No final da transferência, o utilizador cria um SIP de um ou mais de transferência padrão. Uma vez feito isso, o SIP pode ser movido para ingerir ou enviados para uma lista de pendências para posterior processamento.
Alimentação
Ingest Ingerir / Submeter
Ao fazer-se o Ingest os objetos digitais são empacotados em SIPs e executado através de vários micro-serviços,incluindo a normalização, a embalagem em uma AIP e geração de uma DIP. Se desejar pular alguns dos pontos de decisão padrão ou fazer escolhas pré-configuradas para o seu workflow desejado, consulte User administration - Processing configuration. Caso haja um erro durante o Ingest, consulte Error handling.
Armazenamento
Durante o armazenamento de arquivo, o AIP é movido para seu repositório de armazenamento.
Armazenamento da AIP
1. Uma vez que o processo de ingerir estiver concluído, selecionar a opção "store AIP" nas ações do menu drop-down irá comprimir no formato ZIP e move-lo para o armazenamento de arquivo.
2. O armazenamento do arquivo pode ser qualquer local, incluindo serviços de armazenamento remoto.
3. Os diretórios AIP são divididos em quatro diretórios para um armazenamento e recuperação mais eficiente.
4. A guia de armazenamento de arquivo (archival storage) no painel do Archivematica consiste em uma tabela com informações sobre os AIP armazenados.
5. Para abrir uma cópia da AIP, clique no nome da AIP, em seguida, pode abrir ou baixar o AIP zipado.
6. O arquivo do AIP pode ser acessado clicando no link do arquivo. O arquivo fornece informações sobre a AIP e seus relacionamentos com o Archivematica, DIPs, AIP e outras informações.
7. Para buscar um AIP, use a barra de busca na parte superior da tela. A base de busca possui os nomes dos AIP e dos METS.
Gerenciamento de Armazenamento
Você pode facilmente procurar o seu backlog e seu armazenamento de arquivo de dentro de seu painel de controle baseado na web Archivematica. Isto significa que Nvocê pode baixar AIP's armazenados como pacotes completos, objetos individuais ou em cada pacote em um AIC. Você também pode gerenciar seu armazenamento e processamento locais utilizando o serviço de armazenamento Archivematica, incluindo um processo de exclusão de duas etapas que requer justificação e aprovação para eliminar um AIP armazenado.
Acesso
Durante a Ingest, cópias de acesso de objetos digitais são gerados e empacotados em um DIP. O usuário carrega o DIP para o sistema de acesso. Saiba que o usuário deve criar a descrição em AtoM (ou outro sistema de acesso)antes de fazer o upload do DIP. O utilizador terá de indicar parte da URL do descrição ou uma coleção de destino, a fim de enviá-lo para o local apropriado na descrição. Caso haja um erro durante este processo, consulte Error handling.
Preservação
Estratégia de preservação primária de Archivematica é normalizar arquivos para preservação e acesso formatos mediante ingest. As cópias de preservação são adicionados à AIP e as cópias de acesso são usados para gerar um DIP para o upload para o sistema de acesso. Note que os arquivos originais são mantidos sempre, para permitir diferentes ações de preservação no futuro, tais como a normalização de diferentes formatos de arquivo ou emulação. Nem todos os objetos digitais podem ser normalizada em ingerir. Por exemplo,para alguns objetos digitais, como desenhos CAD ou Microsoft Visio arquivos não existem ferramentas baseadas em Linux de código aberto disponíveis para lidar com as conversões e / ou não acordadas formatos de preservação. Além disso,alguns formatos como documentos do Microsoft Word não são necessariamente no melhor formato preservação, mas ainda são tão onipresentes e bem suportada que eles não precisam ser normalizados no tempo presente. Nestes casos, o padrão Archivematica é mantê-los em seus formatos originais; avaliação de risco formato e informações recebidas de nossos usuários ao longo do tempo vai permitir artefactual para expandir os padrões ao longo do tempo para incluir mais formatos através da Secretaria Política Format (FPR).
Administração
As páginas de administração Archivematica, sob a guia Administração do painel, permitem configurar os componentes do aplicativo e gerenciar usuários.
● Processing configuration
● General
● Failures
● Transfer source locations
● AIP storage locations
● Processing storage usage
● AtoM DIP upload
● Archivists Toolkit DIP upload
● PREMIS agent
● REST API
● Users
Backup
No Archivematica há três tipos de dados para fazer backup:
● Filesystem (em particular os diretórios de armazenamento);
● MySQL;
● ElasticSearch.
MySQL é usada para armazenar dados de processamento de curto prazo. Você pode fazer backup do banco de dados MySQL usando o seguinte comando:
mysqldump -u <seu nome de usuário> -p <password> -c MCP> <nome do arquivo de backup>
ElasticSearch é usada para armazenar dados de longo prazo. Instruções e scripts para backup e restauração de ElasticSearch estão disponíveis here.
Baglt
BagIt é uma especificação para empacotar diretórios de arquivos, hierarquicamente, para armazenamento a longo prazo ou para a transferência entre ambientes de armazenamento. Sua característica mais importante é que ele gera e registra checksums (somas de verificação de bytes) para cada arquivo armazenado em uma bag, o que torna muito fácil de verificar a integridade dos arquivos depois que eles foram movidos. O Archivematica armazena os seus AIPs como um Bag, assim como ingere Bags criadas por outros sistemas.
A instituição que quiser elaborar seus pacotes, tem disponível código no GitHub:
● Archive::BagIt: Perl, BagIt Library: Java, BagIt gem: Ruby, bagit: Python,pybagit: Python, BagIt GUI: JRuby, BagItPHP: PHP.
Metadados
O esquema de metadados esta em Dublin Core que fornece um núcleo de vocabulários de apoio a soluções interoperáveis, visando reconhecer e gerenciar pesquisas. O Dublin Core Metadata Initiative (DCMI) é uma organização aberta, constituída em Cingapura como um bem público, empresa sem fins lucrativos, limitada por garantia, apoiando a inovação em design.
O METS é um padrão para codificar metadados descritivos, administrativos e estruturais sobre os objetos dentro de uma biblioteca digital, utilizando a linguagem de esquema XML do World Wide Web Consortium. O padrão é mantido na Network Development and MARC Standards Office da Biblioteca do Congresso Norte Americano, e está sendo desenvolvido como uma iniciativa da Biblioteca Digital da Federação Norte Americana.
PREMIS (PREservation Metadata: Implementation Strategies) é um grupo de trabalho internacional preocupado com o desenvolvimento de metadados para uso em preservação digital. Em 2003, o Online Computer Library Center (OCLC) e o Research Library Group (RLG) estabeleceu o grupo de trabalho PREMIS, que consistia de uma lista multi-nacional de mais de trinta representantes dos setores culturais, governamentais e privados, a fim de definir metadados centrais de preservação, com orientações/recomendações para a gestão e utilização. PREMIS foi "encarregado a definir um conjunto de unidades semânticas de implementação independente, orientada para a prática, e que seja necessário para a maioria dos repositórios de preservação".
O código fonte está disponível em [github.com/artefactual/archivematica].
Toda a documentação do sistema é liberado sob uma licença Creative Commons.