Discussão:Preservação Digital

De IBICT
Ir para: navegação, pesquisa

Índice

Acessibilidade de Longo Prazo

Acessibilidade do sistema de preservação digital que permite medir as facilidades de uso que ele proporciona aos usuários a dimensão das tarefas realizadas e o grau de conhecimento que eles têm das funções do sistema depende da sua capacidade de ser interoperável usa de ferramentas de softwares livres possibilitando a alteração de qualquer parte do sistema sem nenhuma conseqüência nas suas funcionalidades. Como um critério pode ser medido por meio de indicadores de desempenho que proporcionam os dados sobre a eficiência do sistema no atendimento de usuários e suas expectativas de tempo e tipo de resposta

Acesso Livre

Disponibilização livre e pública na Internet de forma a permitir a qualquer usuário a leitura download cópia impressão distribuição busca ou link com o conteúdo completo de artigos bem como a indexação ou o uso para qualquer outro propósito legal.

Arqueologia Digital

Estudo de práticas culturais, sócio-econômicas e políticas por meio da recuperação, documentação e análise de vestígios deixados por usuários no ambiente digital. Webpages institucionais e redes sociais, por exemplo, podem possuir elementos gráficos e informacionais capazes de serem estudados e considerados como fontes primárias para pesquisas em áreas como as ciências sociais e a história. Não apenas software, mas hardware podem compor o material de análise e investigação da arqueologia digital. Estudos forenses se utilizam de equipamentos para recuperar dados já apagados de dispositivos como HDs (hard disk) e celulares, por exemplo. Compõem os objetos da arqueologia digital os materiais tecnológicos, que se utilizem de tecnologia eletrônica e digital, capazes de estocar dados; aplicativos periféricos; sistemas operacionais; linguagens de programação; ferramentas e sistemas de gestão eletrônica de documentos obsoletos, danificados ou descartados.

Referência:

GRAVES, Michael W. Digital archaeology: the art and science of digital forensics. Upper Saddle River, NJ: Addison-Wesley, 2014. ROGERS, Richard. Digital Methods. Cambridge, MA: MIT Press, 2013.

Ações de Preservação (Preservation Action)

Ações tomadas para garantir a viabilidade a longo prazo e disponibilidade do material digital, atestando autoridade sobre a natureza do dado. Ações de preservação devem garantir que o material permaneça autêntico, confiável e utilizável enquanto sua integridade é mantida; tais ações incluem a validação, a atribuição de metadados de preservação, atribuindo a informação à representação, e garantindo estruturas de dados aceitáveis e formatos de arquivo.

Arquivamento

Sequência de operações intelectuais e físicas que visam à guarda ordenada de documentos. Ação pela qual uma autoridade determina a guarda de um documento cessada a sua tramitação.

Arquivos Abertos (Open Archives)

Arquivos eletrônicos conectados por meio do protocolo Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) permitindo a interoperabilidade entre bibliotecas e repositórios digitais.

Artigo Científico

Parte de uma publicação com autoria declarada, que apresenta e discute idéias,métodos, técnicas, processos e resultados nas diversas áreas do conhecimento.

Ativo Digital

Segundo Van Niekerk (2006) “um ativo digital é qualquer item de texto ou mídia que tenha sido formatado em uma fonte binária que inclui o direito de utilizá-lo.

Atributo

Característica inerente ou qualidade associada a um elemento já mencionado.

Atualização (Refreshment)

Migração de dados digitais que procura substituir uma mídia com uma cópia que seja suficientemente exata para que a infra-estrutura de hardware e software continue a funcionar como antes.

Auditoria

Permite que os desenvolvedores dos repositórios analisem e respondam de forma sistemática às carências e acertos na criação dos sistemas.

Autenticação (Authentication)

Medida de segurança projetada para estabelecer a validade de uma transmissão, mensagem, origem ou um meio de verificar a autoridade de um indivíduo para fornecer categorias específicas de informações).

Autenticidade

Comprovação de autoria do documento por meio de mecanismos de verificação como o layout tipologia de fontes vocabulários controlados da época e assinatura digital.

Autodepósito

Que possibilita ao próprio autor a publicação de seu trabalho científico diretamente na Rede sem necessidade de intermediários.

Base de Dados

Arquivo de dados homogêneos de conteúdo e formato, coletados sistematicamente e armazenados num computador.

Base de Dados Bibliográfica

Versão eletrônica de um catálogo ou índice bibliográfico.

Biblioteca Digital

Biblioteca com textos completos em formatos digitais armazenados e disponíveis via Internet;

♦ Leiner (1998) a define de modo amplo como “o conjunto de serviços e a coleção de objetos de informação e sua organização, estruturação e apresentação que apoia os usuários no trato com objetos informacionais disponíveis, diretamente ou indiretamente, via meios eletrônicos/digitais”.

Biblioteca Virtual

Coleção organizada e estruturada de recursos localizados em diversos locais remotos por meio de um catálogo local on-line ou por um gateway, como a Internet.

Bit (binary bit)

Dígito binário menor unidade de informação armazenada em um computador. Um bit tem um valor único 0 ou 1.

Bitstream

A camada mais elementar para dotar de significado um objeto digital emprega a leitura bit por bit em vez do método convencional de 16 bits por vez.

Bundles

Agrupamento ou pacotes de bitstreams. A possibilidade de um documento incluir vários bundles significa que ele pode pertencer a uma ou mais coleções e uma coleção a uma ou mais comunidades. Essa função dos bundles pode ser compreendida na seqüência de duas funcionalidades já disponíveis na versão 1.3 do DSpace.

Byte

Grupo de dígitos binários que são armazenados e operados como se fossem uma unidade.

Catálogo on-line

Catálogo em forma de base de dados com informação em formato legível por máquina.

Certificação

Envolve mais do que a aplicação de critérios resultantes de normas e requisitos básicos. Ela deve prover ferramentas para o planejamento da auto-avaliação e formas de auditorias internas e externas. O contexto de ambas é geopolítico mas o processo não varia significativamente.

Ciberinfraestrutura

Termo utilizado pela NSF para designar a rede de centros de computação distribuída e repositórios, com investimento em pesquisa para o desenvolvimento de soluções automatizadas para repositórios e para a gestão dos dados científicos. O termo ciberinfraestrutura foi transplantado para o contexto científico a partir do relatório “Revolutionizing Science and engineering through cyberinstructure ” lançado pela NSF Blue Ribbon Task Force em 2003. ♦ Superestrutura para pesquisa científica que teve de ser estabelecida para que a ciência nos dias de hoje nos dias de hoje possa ser realizada de maneira distribuída. Nos dias de hoje – capaz de grandes empreendimentos com contribuições de pesquisadores e acadêmicos distribuídos pelo mundo – possa ser realizada de maneira distribuída.

Ciência in Silico

Expressão usada no âmbito da simulação computacional e áreas correlatas para indicar algo ocorrido "em ou através de uma simulação computacional". A frase foi cunhada em 1989, como uma analogia com as frases latinas in vivo, in vitro, e in situ, comumente usados na Biologia.

Confiabilidade

Garantir o armazenamento e acesso da informação por longo prazo.

Cópia de Segurança (Backup)

Cópia de dados de um dispositivo de armazenamento a outro para que possam ser restaurados em caso da perda dos dados originais.

Critérios de Preservação Digital

Conjunto de atividades que determinam a manutenção de coleções digitais a maioria das propostas de critérios que vem surgindo menciona a influência do modelo de referência OAIS/SAAI elas definem as funções dos repositórios os processos e procedimentos a comunidade alvo a usabilidade da informação e as tecnologias e a infra-estrutura técnica. Usados em procedimentos de auditoria e modelos de certificação.

Curadoria de Arte

A curadoria de arte compõe, idealiza, desenvolve e/ou expõe um conceito de uma expressão artística. O curador de arte reflete suas inclinações particulares em objetos de arte, construindo uma narrativa artística que eleva os elementos representativos de um artista ou uma coleção dentro de um conjunto de itens em particular com o intuito de informar ou para pura contemplação do público.

Curadoria de Conteúdo

Atividade de busca, organização e compartilhamento do conteúdo relevante de um assunto específico online de modo contínuo. Utiliza de mídias e redes sociais para compartilhar conteúdo para consumo imediato. Assuntos relacionados: Ciberjonalismo.

Curadoria de Dados

A curadoria de dados trata das atividades de gestão requeridas para manter dados de pesquisa a longo prazo de modo que esteja disponível para o reuso e para a preservação. Ver: e-Science

Curadoria Digital

A curadoria é o trabalho de intervenção para preservação em todas as etapas do tratamento da informação em meio digital. Trata-se de termo polissémico para indicar: o planejamento de ações para gestão da informação, ações para preservação e acesso para uso futuro que extrapola os dados científicos, ainda que a termo tenha florescido da preocupação pela manutenção da herança científica para as gerações futuras. Surgido da necessidade de permanência da informação científica em meio digital, evoluiu da curadoria de museus e do mundo da arte, da curadoria de dados e da preservação digital – esta desenvolvida para que a informação digital estivesse disponível na rede mundial de computadores – para a curadoria digital e de conteúdos, estas atreladas a criação, disseminação e acesso da informação em rede. ♦ Termo guarda-chuva que está em franco desenvolvimento, que abarca definições correlatas voltadas à seleção, enriquecimento, tratamento e preservação da informação para o acesso e uso futuro, seja ela de natureza científica, administrativa ou pessoal. ♦ Termo hiperomínico que designa as atividades e estratégias que compreendem a administração de uma parte específica de coleções da biblioteca – os ativos digitais.

Dados Abertos (Open Data)

Por dados abertos em ciência queremos dizer que eles estão disponível gratuitamente na internet, permitindo a qualquer usuário baixar, copiar, analisar, reprocessar, captura-los via softwares ou utilizá-los para qualquer outra finalidade, sem outras barreiras financeiras, legais ou técnicas adcionais além daquelas inseparáveis da própria internet. Para este fim os dados relacionados com a ciência publicada deve ser explicitamente colocado no domínio público. Fonte: Extrato de Panton Principles: Principles for Open Data in Science. Disponível em: . Acesso em: 10 jul. 2014

Dados Científicos (Research Data)

Dados que são produzidos no contexto de investigação científica ou que de alguma forma são usados em investigação. Estes dados podem ser criados para efeito de processamento científico, como nos dados atmosféricos usados para previsão meteorológica, ou os dados recolhidos de sensores para monitorar o estado de um edifício. Há dados que são obtidos como resultados do processamento automático de objetos (eles próprios representados como dados), como, por exemplo, os histogramas de cor obtidos através do processamento de uma coleção de imagens. Há ainda dados que não sendo produzidos para investigações acabam por ser objeto dela, como as contribuições que os utilizadores de uma rede social fazem, na forma de textos ou outros conteúdos, e que acabam por ser utilizados para estudos sociológicos. Fonte: RECCAP

Data Grid

É um conjunto de serviços estruturados que fornece vários serviços, como a capacidade de acessar, alterar e transferir grandes quantidades de dados geograficamente separados, especialmente para fins de pesquisa e de colaboração. Dados de diferentes regiões são puxados a partir de domínios administrativos que filtram dados para fins de segurança e os apresentam para o usuário, mediante pedido por meio de um aplicativo de middleware. Ver: Ciberinfraestrutura.

Digitalização

Transformação de informação analógica para formato digital por meio de dispositivo adequado e seguindo requisito de qualidade no seu processo de produtividade.

Documento

Unidade de registro de informações qualquer que seja o suporte ou formato.

Documento Digital

Documento codificado em linguagem binária digital ou convertido para formato digital legível por máquinas independente do suporte físico e de sua mensagem original sendo que a digitalização pode chegar a produzir mudanças no se registro.

Documento Eletrônico

Um registro que foi criado (elaborado ou recebido) de forma eletrônica.

DOI® (Digital Object Identifier)

Sistema de identificador de objetos digitais on-line para gerenciar a propriedade intelectual e o uso comercial dos objetos materiais digitais.

Dublin Core

Esquema de descrição de metadados para descoberta de recursos on-line.

E-Science

A e-Science trata da pesquisa ciência realizada em ambientes distribuídos que utiliza imenso volume de dados habilitados pela Internet. Ela faz a distribuição de tarefas por meio de várias organizações; tem uma sobrecarga em termos de complexidade da gestão e exige implementação de infraestrutura global de redes de conexão e financiamento massivo e coletivo. A terminologia ainda está em consolidação, existindo outros termos para indicar a e-Science, a saber: ciberinfraestrutura, dados científicos, ciência digital, ciência fortemente baseada em dados, ciência eletrônica, quarto paradigma, ciência orientada por dados, etc.

Emulação

Criação de um novo software que imita o funcionamento do antigo hardware e/ou software com o objetivo de reproduzir seu comportamento.

Encapsulamento

Preservação da informação necessária para o desenvolvimento de conversores emuladores e visualizadores de objetos digitais.

Espelhamento ou Redundância (Mirroring or Redundancy)

Manter uma cópia exata de um arquivo em diversos lugares muito usado na cópia de segurança de grandes bases de dados.

Estratégia de Preservação Digital

Tipo de abordagem que permite o acesso contínuo à informação em formato digital. Esquemas técnicos e conceituais que permitem identificar as partes integrantes do processo de preservação digital assim como sua padronização em modelos de referência.

Formato

Estrutura do arquivo que define o modo como é armazenado ou apresentado na tela ou impressão organização seqüencial de dados em termos de seus componentes também chamado de extensão. Formatos abertos de arquivo são aqueles em que os usuários têm acesso aos detalhes técnicos e ao significado de sua estrutura de bits.

Gerenciamento de Direitos Digitais (Digital Rights Management)

O uso de tecnologias para controlar como o conteúdo digital é utilizado e reutilizado.

Gestão de Dados (Data Management)

Na gestão de dados científicos incluem-se as ações de representação dos dados e seu armazenamento, a associação de metadados que os descrevem, que ajudam a interpretá-los e documentam o seu uso, a organização dos dados em coleções, a indexação dos dados para pesquisa e todas as formas de apresentação dos dados. A gestão de dados pode ser realizada por pessoas que não têm conhecimento direto do seu significado, desde que os dados tenham sido descritos de forma completa pelos seus produtores. Fonte: RECCAP

Handle System®

Um exemplo de identificador persistente desenvolvido pela Corporation for National Research Initiatives.

Harvesting

Busca automática de endereços web com o resgate das referências para outros documentos links e informações relevantes.

Identificador

Um caractere ou conjunto de caracteres designados para identificar inequivocamente um documento. Alguns exemplos de identificadores são o URN (Uniform Resource Name) o DOI® o ISBN (International Standard Book Number) e o SICI (Serial Item and Contribution Identifier).

Identificador Persistente

Um único identificador permanentemente associado a um objeto digital quando gerenciado sempre proverá acesso permanente a um objeto independentemente de qualquer mudança de local.

Informação

Usada em geral para englobar idéias, fatos e obras de ficção. No âmbito da Ciência da Informação tais fatos idéias são registrados sobre qualquer tipo de suporte para poderem ser manipulados. Assim, não há informação sem documento nem documento sem informação.

Informação Digital

Dados organizados e com significados codificados em dígitos binários bits produzidos e armazenados em computador.

Integridade (Integrity)

Condição dada quando os dados não são alterados a partir de sua origem e não foi acidentalmente ou maliciosamente modificado, alterado ou destruído.

International Standard Bibliographic Description (ISBD)

Formato padrão aceito internacionalmente para representar informação bibliográfica.

International Standard Book Number (ISBN)

Número padrão aceito internacionalmente que identifica um livro de forma única. No Brasil, a Biblioteca Nacional é o órgão que atribui o ISBN.

International Standard Serial Number (ISSN)

Número padrão aceito internacionalmente que identifica uma publicação seriada de forma única. No Brasil, o IBICT é o órgão que atribui o ISSN.

Interoperabilidade

Interação de documentos digitais entre diferentes sistemas tecnológicos configuração de todos os arquivos padronizando-os de forma global.

Library of Congress Subject Headings (LCSH)

Lista de cabeçalhos de assunto padronizados, criados pela Biblioteca do Congresso dos Estados Unidos.

Metadados

Informações estruturadas e codificadas que descrevem e permitem gerenciar compreender preservar e acessar os documentos digitais ao longo do tempo;

♦ os metadados são dados cujo propósito é garantir a autenticidade, descrever, tornar acessíveis, ou de alguma forma qualificar e aumentar a inteligibilidade dos dados de base. Quando o significado dos dados está acessível ao utilizador menos especializado, como é o caso dos registos de publicações, existem normas bem estabelecidas para os metadados, neste exemplo as diversas normas bibliográficas. Na maioria das áreas que produzem dados científicos, não estão fixadas normas para metadados, o que torna a tarefa de descrição um desafio substancial. Fonte: RECCAP

Metadados Administrativos

Tipo de metadados que permite o gerenciamento de uma coleção digital.

Metadados de Preservação

Atributos especiais de dados ou documentos geralmente descritivos são aqueles relacionados com o conteúdo do documento seu contexto e estrutura no momento da sua criação assim como das mudanças acontecidas em todo seu ciclo de vida.

Migração

Conjunto de atividades para copiar converter ou transferir a informação digital de uma tecnologia antiga ou obsoleta para uma tecnologia nova transferência periódica de dados de uma geração tecnológica para outra.

Modelo de Referência

Estrutura para o entendimento de relações significativas entre entidades de um ambiente e para o desenvolvimento de padrões consistente ou especificações que lhe dão suporte. Um modelo de referência esta baseado em um número pequeno de conceitos unificados.

Objeto Digital

Tipos de arquivos encontrados em meio digital compostos de conjuntos de seqüências de bits sobre conteúdos informacionais. metadados e identificadores.

Online Public Access Catalog (OPAC)

Sistema automatizado que dá acesso público a catálogos de biblioteca via Internet.

Open Archival Information System (OAIS)

Esquema conceitual que disciplina e orienta um sistema para a preservação e manutenção de acesso à informação digital por longo prazo contém o termo archival para distingüi-lo de outros usos do termo “arquivo”. Arquivo no OAIS consiste em uma organização de pessoas e sistemas que aceitam a responsabilidade de preservar informação e torna-la disponível.

Pacote de Arquivamento de Informação (PAI)

Informação de conteúdo e sua descrição de preservação necessária para preservar-la dentro de um pacote de informação por longo prazo.

Pacote de Disseminação de Informação (PDI)

Pacote de informação que contém partes de um PAI que são distribuídas a um Cliente/Usuário quando solicitado.

Pacote de Submissão de Informação (PSI)

Pacote de informação identificado pelo produtor no acordo de submissão na estrutura conceitual do OAIS.

Periódico Científico

Publicação seriada com finalidade acadêmica ou profissional, relatando resultado de pesquisas à comunidade de seus pares. Os artigos em geral possuem resumos, notas de rodapé e referências bibliográficas.

Plataforma Digital de Investigação (e-research)

Uma plataforma digital de suporte à investigação fornece tecnologias para suportar o processo de investigação, incluindo a colaboração entre grupos, a recolha de dados, a sua análise, a publicação de resultados, o armazenamento e a partilha dos dados. As tecnologias disponíveis neste domínio incluem os ambientes de investigação virtuais, a computação grid, os serviços de visualização, a mineração de dados. Fonte: RECCAP

Preservação digital de longo prazo

O ato de manter informação de forma correta e independente por longo prazo. Informação armazenada independentemente que possui documentação suficiente para permitir que seja interpretada e usada por uma comunidade sem necessidade de recursos especiais obsoletos. Requer procedimentos específicos e técnicas apropriadas para cada tipo de formato e mídia. Com ela pretende-se garantir a inalterabilidade dos registros digitais.

♦ É o conjunto de atividades ou processos responsáveis por garantir o acesso contínuo a longo prazo à informação existente em formatos digitais. A preservação digital consiste na capacidade de garantir que a informação digital de valor contínuo permaneça acessível e com qualidades de autenticidade suficientes para que possa ser interpretada no futuro ao se recorrer a uma plataforma tecnológica diferente da utilizada no momento da sua criação.

Sinônimo: gerenciamento do ciclo de vida de dados digitais

Preservation Master File

O objeto derivado do original que será preservado gerenciado e disseminado por longo prazo.

Protocolo

Padrões que controlam a transferência de informação entre computadores. Desenvolvidos para melhorar a confiabilidade e a velocidade de dados transferidos.

Publicação Seriada

Publicação em fascículos ou volume, em geral numerados cronológica e/ou seqüencialmente, com periodicidade predeterminada, sem data prevista de término. Ex.: Jornal, revista, periódico.

Repositório Digital

Sistema de informação on-line encarregado de gerar e armazenar objetos digitais para seus subsequentes acessos e recuperações.

Repositório digital confiável

Resultado da associação de repositórios institucionais serviços de preservação e arquivos por área de conhecimento tem como missão prover acesso de longo prazo confiável a recursos digitais gerenciados para suas comunidades alvo hoje e no futuro.

Repositório Institucional (Institutional repositoires)

Repositório digital que incluem não só artigos submetidos ao processo tradicional de revisão dos pares (pos-print) como também versões eletrônicas preliminares de documentos científicos (pré-prints) teses manuais materiais de ensino ou qualquer outro tipo de material que os autores ou sua instituição desejem que se torne disponível para o público. Eles devem estar respaldados por política de gerenciamento que os reconheçam como vitais para a instituição;

♦ um repositório institucional é uma infraestrutura mantida por uma organização, tal como uma universidade ou um centro de investigação, com o propósito de colecionar e preservar a sua produção científica, técnica ou administrativa, e de lhe dar visibilidade. Os repositórios institucionais podem contribuir para iniciativas mais alargadas, como a agregação da publicação científica a nível nacional. Os repositórios têm também uma função importante na auditoria das organizações. Fonte: RECCAP

Serviços de Repositório (Repository Services)

Serviços oferecidos por uma infraestrutura técnica que permite o armazenamento, o acesso, a descrição, a disseminação e a preservação de objetos digitais. Nesta infraestrutura também estão presentes os serviços de apoio aos investigadores em aspectos técnicos, legais e das políticas de criação, do depósito e partilha de resultados de investigação. Fonte: RECCAP

SGML (Standard Generalized Markup Language)

Linguagem de Marcação Generalizada Padrão que é a base para a criação de todas as linguagens de marcação definido pela norma ISO 8879 -1986.

Software

Programa de computador. São instruções que o computador é capaz de entender e executar.

Software Livre

Programa de computador em que se tem liberdade de executar copiar distribuir modificar e aperfeiçoar de acordo com interesses pessoais ou comerciais. Apresenta um código-fonte aberto.

Tecnologia da informação

Conjunto de dispositivos mecânicos e eletrônicos que auxiliam no armazenamento, recuperação, armazenamento e gestão da informação.

URL (Uniform Resource Locator)

Padronização da localização ou dos detalhes de endereçamento dos recursos da Internet.

XML (Extensible Markup Language)

Linguagem para descrição de documentos eletrônicos estrutura sintática para descrição de dados entre aplicações de informática em formato de texto é um formato padrão para publicação armazenamento e transferência de documentos por via eletrônica independente dos fabricantes de software facilmente interpretável por múltiplas aplicações e em certa forma auto-explicativo.