16.05.2013 Views

O Processo de integração dos registos na PORBASE - Biblioteca ...

O Processo de integração dos registos na PORBASE - Biblioteca ...

O Processo de integração dos registos na PORBASE - Biblioteca ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

O PROCESSO DE INTEGRAÇÕES NA <strong>PORBASE</strong><br />

A <strong>PORBASE</strong>, constituída como o Catálogo Colectivo das <strong>Biblioteca</strong>s Portuguesas, é<br />

uma base <strong>de</strong> da<strong>dos</strong> cooperativa, resultante da contribuição <strong>dos</strong> catálogos das diversas<br />

bibliotecas e centros <strong>de</strong> documentação que nela participam. São mais <strong>de</strong> 160<br />

instituições, públicas, universitárias, escolares, especializadas, com diferentes fontes<br />

tecnológicas e com diferentes práticas <strong>de</strong> tratamento documental instituídas.<br />

A <strong>integração</strong> <strong>na</strong> <strong>PORBASE</strong> <strong>de</strong> <strong>registos</strong> bibliográficos com as mais diversas origens<br />

exige assim, por parte da <strong>Biblioteca</strong> Nacio<strong>na</strong>l, um gran<strong>de</strong> esforço <strong>de</strong> normalização, e<br />

<strong>de</strong> controlo <strong>de</strong> qualida<strong>de</strong>. O processo <strong>de</strong> <strong>integração</strong> <strong>dos</strong> <strong>registos</strong> <strong>de</strong>ve produzir o<br />

menor ruído possível no catálogo colectivo, evitando a produção <strong>de</strong> duplica<strong>dos</strong>,<br />

criando bons pontos <strong>de</strong> acesso, evitando os erros genéricos, uniformizando algumas<br />

características próprias <strong>dos</strong> vários sistemas <strong>de</strong> gestão <strong>de</strong> bibliotecas e das várias<br />

versões <strong>dos</strong> mesmos.<br />

Nesse sentido, implementou-se um processo <strong>de</strong> pré-tratamento <strong>dos</strong> <strong>registos</strong>,<br />

suportado por ferramentas <strong>de</strong> análise e comparação, verificação, correcção e<br />

validação, que realizam à priori, alguma activida<strong>de</strong> normativa sobre os <strong>registos</strong> das<br />

bibliotecas cooperantes que são integra<strong>dos</strong> <strong>na</strong> <strong>PORBASE</strong>. Esse conjunto <strong>de</strong><br />

operações funcio<strong>na</strong> sobre uma plataforma a que se chamou IRIS.<br />

As funcio<strong>na</strong>lida<strong>de</strong>s disponibilizadas pelo IRIS são as seguintes:<br />

1. Possibilida<strong>de</strong> <strong>de</strong> processamento <strong>de</strong> bases <strong>de</strong> da<strong>dos</strong> oriundas <strong>de</strong> diversos<br />

sistemas <strong>de</strong> gestão <strong>de</strong> bibliotecas através do uso <strong>de</strong> conversores;<br />

2. Produção <strong>de</strong> relatórios <strong>de</strong> conteúdo e <strong>de</strong> erros sobre os lotes, através da<br />

<strong>integração</strong> com a ferramenta MANGAS;<br />

3. Correcção e filtragem <strong>dos</strong> lotes igualmente através da <strong>integração</strong> com a<br />

ferramenta MANGAS;<br />

4. Detecção <strong>de</strong> <strong>registos</strong> duplica<strong>dos</strong> entre os lotes e a <strong>PORBASE</strong><br />

5. Integração <strong>de</strong> <strong>registos</strong> bibliográficos e <strong>de</strong> exemplar <strong>na</strong> <strong>PORBASE</strong>;<br />

Passemos então à <strong>de</strong>scrição das etapas <strong>de</strong> tratamento <strong>dos</strong> <strong>registos</strong> até à sua<br />

<strong>integração</strong> <strong>na</strong> Base Nacio<strong>na</strong>l <strong>de</strong> Da<strong>dos</strong> Bibliográficos:<br />

Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />

1


Como to<strong>dos</strong> sabemos, são várias as soluções existentes no mercado no que diz<br />

respeito a sistemas <strong>de</strong> gestão <strong>de</strong> bibliotecas, pelo que houve a necessida<strong>de</strong> <strong>de</strong><br />

<strong>de</strong>senvolver “conversores” que normalizam as características <strong>dos</strong> vários ficheiros ISO<br />

2709: <strong>de</strong> uma forma genérica, convertem os ficheiros em ISO standard (80 colu<strong>na</strong>s),<br />

resolvem alguns problemas <strong>de</strong> repetição <strong>de</strong> campos e subcampos, uniformizam a<br />

pontuação <strong>de</strong> algumas zo<strong>na</strong>s (que em alguns sistemas é digitada e noutros não), e<br />

convertem o co<strong>de</strong>page para aquele que é utilizado pela <strong>PORBASE</strong>.<br />

A funcio<strong>na</strong>lida<strong>de</strong> <strong>de</strong> produção <strong>de</strong> relatórios <strong>de</strong> conteúdo e <strong>de</strong> erros, sobre o lote <strong>de</strong><br />

<strong>registos</strong> em processamento no IRIS, é assegurada pela ferramenta MANGAS. O<br />

Mangas – Manipulação e Gestão <strong>de</strong> Metada<strong>dos</strong> Descritivos, é uma aplicação para a<br />

análise e tratamento <strong>de</strong> da<strong>dos</strong> bibliográficos, que tem embebida toda a estrutura do<br />

formato UNIMARC bibliográfico e os requisitos <strong>de</strong>fini<strong>dos</strong> para a cooperação, e que<br />

penso ser já do conhecimento genérico <strong>de</strong> to<strong>dos</strong>.<br />

Assim são produzi<strong>dos</strong> 2 relatórios, um <strong>de</strong> conteúdo e outro <strong>de</strong> erros:<br />

1. Chamamos relatório <strong>de</strong> conteúdo à análise que é feita em relação aqueles<br />

aspectos que são “contabilizáveis”, que são susceptíveis <strong>de</strong> construir uma<br />

estatística e que nos permitem um conhecimento genérico sobre o acervo<br />

contido no lote. O MANGAS produz os relatórios <strong>de</strong> conteúdo <strong>de</strong> acordo com:<br />

a. Tipos <strong>de</strong> material catalogado;<br />

b. País <strong>de</strong> Publicação;<br />

c. Língua <strong>de</strong> Publicação;<br />

d. Classes CDU;<br />

e. Datas <strong>de</strong> Publicação.<br />

2. Os relatórios <strong>de</strong> erros são elabora<strong>dos</strong> com base <strong>na</strong> correcta aplicação da<br />

estrutura do formato UNIMARC bibliográfico, ao nível <strong>dos</strong> campos, subcampos,<br />

indicadores e da<strong>dos</strong> codifica<strong>dos</strong>, e da estrutura <strong>de</strong>finida como <strong>de</strong><br />

preenchimento essencial e que constitui aquilo a que chamamos nível mínimo<br />

<strong>de</strong> preenchimento, <strong>de</strong> que falaremos mais à frente.<br />

A produção <strong>de</strong> relatórios <strong>de</strong> erros resultantes da aplicação do formato UNIMARC<br />

bibliográfico é feita <strong>de</strong> acordo com os seguintes aspectos:<br />

Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />

2


a. Preenchimento incorrecto da etiqueta <strong>de</strong> registo;<br />

b. Campos, subcampos e indicadores obrigatórios não preenchi<strong>dos</strong>;<br />

c. Campos, subcampos e indicadores in<strong>de</strong>vi<strong>dos</strong> (campos que não se<br />

aplicam no tipo <strong>de</strong> documento em causa e indicadores e subcampos<br />

não autoriza<strong>dos</strong> no campo em uso);<br />

d. Repetição in<strong>de</strong>vida <strong>de</strong> campos e subcampos;<br />

e. Preenchimento incorrecto <strong>de</strong> indicadores (que não se aplicam <strong>na</strong><br />

situação <strong>de</strong>scrita);<br />

f. Preenchimento incorrecto <strong>de</strong> subcampos (preenchimento <strong>dos</strong> da<strong>dos</strong><br />

codifica<strong>dos</strong> e <strong>dos</strong> códigos <strong>de</strong> língua, país e função).<br />

Os lotes <strong>de</strong> <strong>registos</strong> para <strong>integração</strong> são seguidamente sujeitos a um conjunto <strong>de</strong><br />

operações automáticas <strong>de</strong> limpeza e correcção, igualmente asseguradas pela<br />

ferramenta MANGAS.<br />

Este conjunto <strong>de</strong> operações foi <strong>de</strong>finido com base <strong>na</strong> compilação <strong>de</strong> alguns <strong>dos</strong> erros<br />

mais frequentes e em relação aos quais é possível efectuar correcções <strong>de</strong> forma<br />

sistemática (entre estes encontra-se a correcção da sigla da instituição nos campos<br />

801 e 966 e que em gran<strong>de</strong> parte <strong>dos</strong> casos não é a atribuída pela BN para efeitos <strong>de</strong><br />

cooperação). A essas correcções juntaram-se ainda algumas operações <strong>de</strong> limpeza <strong>de</strong><br />

caracteres inváli<strong>dos</strong> em <strong>de</strong>termi<strong>na</strong><strong>dos</strong> campos <strong>de</strong> da<strong>dos</strong> codifica<strong>dos</strong>.<br />

Daqui resulta o seguinte conjunto <strong>de</strong> correcções em bloco: limpeza <strong>de</strong> campos e<br />

subcampos vazios, correcção <strong>de</strong> subcampos <strong>de</strong> preenchimento standard (como a sigla<br />

<strong>de</strong> cooperação <strong>de</strong> que já falei), adição do campo 801 (que apesar <strong>de</strong> ser um campo<br />

obrigatório raramente é preenchido), correcção <strong>de</strong> códigos <strong>de</strong> língua e país ao nível do<br />

uso das maiúsculas e minúsculas, só para citar alguns exemplos. Um aspecto<br />

importante é a adição <strong>de</strong> um campo 001 (que <strong>na</strong> <strong>PORBASE</strong> se converte em 035) on<strong>de</strong><br />

se regista a sigla do cooperante ao qual pertence aquele lote <strong>de</strong> <strong>registos</strong>, o lote a que<br />

correspon<strong>de</strong> e a data <strong>de</strong> tratamento, sendo <strong>de</strong>ste modo preservada a “história” do<br />

registo, que irá permitir a qualquer momento i<strong>de</strong>ntificar a sua origem.<br />

Os <strong>registos</strong> passam agora à fase <strong>de</strong> separação em lotes <strong>de</strong> <strong>registos</strong> com<br />

características pré <strong>de</strong>finidas. Esta triagem é necessária pois os <strong>registos</strong> que não<br />

po<strong>de</strong>rão ser imediatamente integra<strong>dos</strong> <strong>na</strong> <strong>PORBASE</strong>, são guarda<strong>dos</strong> até que existam<br />

as condições para a sua <strong>integração</strong>.<br />

Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />

3


São 2 os filtros aplica<strong>dos</strong> nesta fase:<br />

1. Filtro <strong>de</strong> A<strong>na</strong>líticos - i<strong>de</strong>ntifica e separa os <strong>registos</strong> <strong>de</strong> a<strong>na</strong>líticos, assim<br />

i<strong>de</strong>ntifica<strong>dos</strong> pela etiqueta <strong>de</strong> registo. Isto porque os <strong>registos</strong> <strong>de</strong> a<strong>na</strong>líticos<br />

serão alvo <strong>de</strong> um projecto específico;<br />

2. Filtro <strong>de</strong> Bloco 4XX - i<strong>de</strong>ntifica e separa os <strong>registos</strong> que contém campos do<br />

bloco 4XX preenchi<strong>dos</strong>, uma vez que não se estão a integrar ainda <strong>registos</strong><br />

com ligações ao bloco 4XX e por ser mais uma forma <strong>de</strong> i<strong>de</strong>ntificar os <strong>registos</strong><br />

<strong>de</strong> a<strong>na</strong>líticos que não se encontram i<strong>de</strong>ntifica<strong>dos</strong> <strong>na</strong> Etiqueta <strong>de</strong> Registo.<br />

Limadas as arestas que po<strong>de</strong>riam criar ruído e dificultar o processo <strong>de</strong> comparação, o<br />

IRIS proce<strong>de</strong> então à <strong>de</strong>tecção <strong>de</strong> duplica<strong>dos</strong>, comparando o lote <strong>de</strong> <strong>registos</strong> em<br />

tratamento com toda a <strong>PORBASE</strong>. Cada registo é classificado como duplicado,<br />

possível duplicado ou novo.<br />

A <strong>de</strong>tecção <strong>de</strong> <strong>registos</strong> duplica<strong>dos</strong> é o primeiro passo do processo <strong>de</strong> <strong>integração</strong>, pois<br />

<strong>de</strong>sta forma, mesmo os <strong>registos</strong> que não passariam no filtro <strong>de</strong> nível mínimo, como por<br />

exemplo, os <strong>registos</strong> sem classificação CDU, são passíveis <strong>de</strong> ter a sua localização<br />

registada <strong>na</strong> <strong>PORBASE</strong>. Desta forma, o número <strong>de</strong> <strong>registos</strong> efectivamente integra<strong>dos</strong><br />

é muito maior.<br />

Para os <strong>registos</strong> i<strong>de</strong>ntifica<strong>dos</strong> como duplica<strong>dos</strong> <strong>na</strong> <strong>PORBASE</strong>, o IRIS i<strong>de</strong>ntifica ainda,<br />

quais <strong>dos</strong> seus exemplares ou cota ainda não se encontram no catálogo colectivo.<br />

Esses <strong>registos</strong> novos <strong>de</strong> exemplar são imediatamente importa<strong>dos</strong> e adicio<strong>na</strong><strong>dos</strong> ao<br />

seu duplicado <strong>na</strong> <strong>PORBASE</strong>: este processo gera assim a adição <strong>de</strong> novas cotas.<br />

Existem ainda os <strong>registos</strong> que suscitam dúvidas <strong>na</strong> sua i<strong>de</strong>ntificação enquanto<br />

duplica<strong>dos</strong>, e que constituem o grupo a que chamamos “possíveis duplica<strong>dos</strong>”. Este<br />

grupo exige ainda a análise huma<strong>na</strong> para a confirmação como duplicado efectivo, mas<br />

preten<strong>de</strong>-se que os próximos <strong>de</strong>senvolvimentos da plataforma IRIS sejam foca<strong>dos</strong> <strong>na</strong><br />

melhoria <strong>de</strong>ste processo <strong>de</strong> análise.<br />

I<strong>de</strong>ntificado o lote <strong>de</strong> <strong>registos</strong> novos, é aplicado o filtro <strong>de</strong> nível mínimo: este nível<br />

mínimo <strong>de</strong> preenchimento obrigatório, foi <strong>de</strong>finido <strong>de</strong> forma a garantir uma estrutura <strong>de</strong><br />

preenchimento coerente <strong>de</strong> acordo com o tipo <strong>de</strong> documento a catalogar, <strong>de</strong> modo a<br />

Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />

4


garantir a consistência e qualida<strong>de</strong> mínimas da Base Nacio<strong>na</strong>l <strong>de</strong> Da<strong>dos</strong><br />

Bibliográficos. Para além <strong>dos</strong> campos e subcampos consi<strong>de</strong>ra<strong>dos</strong> <strong>de</strong> preenchimento<br />

obrigatório pelo próprio formato UNIMARC, foram ainda <strong>de</strong>fini<strong>dos</strong> alguns campos e<br />

subcampos cujo preenchimento se consi<strong>de</strong>rou essencial para os fins da cooperação.<br />

Neste momento encontram-se <strong>de</strong>fini<strong>dos</strong> ape<strong>na</strong>s 4 tipos <strong>de</strong> documentos, que<br />

correspon<strong>de</strong>m aos mais comuns <strong>na</strong>s colecções das bibliotecas cooperantes da<br />

<strong>PORBASE</strong>: monografias impressas; publicações periódicas impressas; documentos<br />

electrónicos e a<strong>na</strong>líticos.<br />

Assim, o Filtro <strong>de</strong> Nível mínimo, i<strong>de</strong>ntifica e separa os <strong>registos</strong> que respeitam o nível<br />

mínimo <strong>de</strong> catalogação <strong>de</strong>finido para a <strong>PORBASE</strong>, e os que respeitam esse nível<br />

mínimo são integra<strong>dos</strong> <strong>na</strong> Base Nacio<strong>na</strong>l <strong>de</strong> Da<strong>dos</strong> Bibliográficos, ficando assim<br />

completo o processo <strong>de</strong> tratamento e <strong>integração</strong> <strong>de</strong> <strong>registos</strong> da bibliotecas<br />

cooperantes.<br />

O IRIS tem três mo<strong>dos</strong> <strong>de</strong> processamento <strong>dos</strong> lotes:<br />

1. <strong>Processo</strong> <strong>de</strong> Teste: permite realizar testes <strong>de</strong> <strong>integração</strong> e avaliar conteú<strong>dos</strong> e<br />

comportamentos específicos <strong>de</strong> um lote <strong>de</strong> <strong>registos</strong>;<br />

2. <strong>Processo</strong> Corrente: que processa actualizações e bases <strong>de</strong> da<strong>dos</strong> a integrar<br />

pela primeira vez;<br />

3. <strong>Processo</strong> das Bases completas: utilizado para as bases <strong>de</strong> da<strong>dos</strong> completas<br />

que sofreram actualizações pelo próprio cooperante, como limpeza <strong>de</strong><br />

exemplares que <strong>de</strong>ixaram <strong>de</strong> existir <strong>na</strong> biblioteca ou alterações <strong>de</strong> cotas e que<br />

terá a capacida<strong>de</strong> <strong>de</strong> actualizar os <strong>registos</strong> <strong>de</strong> exemplar <strong>na</strong> <strong>PORBASE</strong> e retirar<br />

os que já não constam do lote. Este processo está ainda em fase <strong>de</strong><br />

<strong>de</strong>senvolvimento e esperamos que esteja operacio<strong>na</strong>l brevemente pois temos<br />

já algumas bases <strong>de</strong> da<strong>dos</strong> completas para <strong>integração</strong>.<br />

Por último, gostaria ainda <strong>de</strong> lembrar a todas as bibliotecas cooperantes a importância<br />

<strong>de</strong> manter os seus da<strong>dos</strong> actualiza<strong>dos</strong> no Directório, pois é ele que fornece ao leitor e<br />

investigador os da<strong>dos</strong> acerca da sigla encontrada <strong>na</strong> <strong>PORBASE</strong>.<br />

Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />

5

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!