O Processo de integração dos registos na PORBASE - Biblioteca ...
O Processo de integração dos registos na PORBASE - Biblioteca ...
O Processo de integração dos registos na PORBASE - Biblioteca ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
O PROCESSO DE INTEGRAÇÕES NA <strong>PORBASE</strong><br />
A <strong>PORBASE</strong>, constituída como o Catálogo Colectivo das <strong>Biblioteca</strong>s Portuguesas, é<br />
uma base <strong>de</strong> da<strong>dos</strong> cooperativa, resultante da contribuição <strong>dos</strong> catálogos das diversas<br />
bibliotecas e centros <strong>de</strong> documentação que nela participam. São mais <strong>de</strong> 160<br />
instituições, públicas, universitárias, escolares, especializadas, com diferentes fontes<br />
tecnológicas e com diferentes práticas <strong>de</strong> tratamento documental instituídas.<br />
A <strong>integração</strong> <strong>na</strong> <strong>PORBASE</strong> <strong>de</strong> <strong>registos</strong> bibliográficos com as mais diversas origens<br />
exige assim, por parte da <strong>Biblioteca</strong> Nacio<strong>na</strong>l, um gran<strong>de</strong> esforço <strong>de</strong> normalização, e<br />
<strong>de</strong> controlo <strong>de</strong> qualida<strong>de</strong>. O processo <strong>de</strong> <strong>integração</strong> <strong>dos</strong> <strong>registos</strong> <strong>de</strong>ve produzir o<br />
menor ruído possível no catálogo colectivo, evitando a produção <strong>de</strong> duplica<strong>dos</strong>,<br />
criando bons pontos <strong>de</strong> acesso, evitando os erros genéricos, uniformizando algumas<br />
características próprias <strong>dos</strong> vários sistemas <strong>de</strong> gestão <strong>de</strong> bibliotecas e das várias<br />
versões <strong>dos</strong> mesmos.<br />
Nesse sentido, implementou-se um processo <strong>de</strong> pré-tratamento <strong>dos</strong> <strong>registos</strong>,<br />
suportado por ferramentas <strong>de</strong> análise e comparação, verificação, correcção e<br />
validação, que realizam à priori, alguma activida<strong>de</strong> normativa sobre os <strong>registos</strong> das<br />
bibliotecas cooperantes que são integra<strong>dos</strong> <strong>na</strong> <strong>PORBASE</strong>. Esse conjunto <strong>de</strong><br />
operações funcio<strong>na</strong> sobre uma plataforma a que se chamou IRIS.<br />
As funcio<strong>na</strong>lida<strong>de</strong>s disponibilizadas pelo IRIS são as seguintes:<br />
1. Possibilida<strong>de</strong> <strong>de</strong> processamento <strong>de</strong> bases <strong>de</strong> da<strong>dos</strong> oriundas <strong>de</strong> diversos<br />
sistemas <strong>de</strong> gestão <strong>de</strong> bibliotecas através do uso <strong>de</strong> conversores;<br />
2. Produção <strong>de</strong> relatórios <strong>de</strong> conteúdo e <strong>de</strong> erros sobre os lotes, através da<br />
<strong>integração</strong> com a ferramenta MANGAS;<br />
3. Correcção e filtragem <strong>dos</strong> lotes igualmente através da <strong>integração</strong> com a<br />
ferramenta MANGAS;<br />
4. Detecção <strong>de</strong> <strong>registos</strong> duplica<strong>dos</strong> entre os lotes e a <strong>PORBASE</strong><br />
5. Integração <strong>de</strong> <strong>registos</strong> bibliográficos e <strong>de</strong> exemplar <strong>na</strong> <strong>PORBASE</strong>;<br />
Passemos então à <strong>de</strong>scrição das etapas <strong>de</strong> tratamento <strong>dos</strong> <strong>registos</strong> até à sua<br />
<strong>integração</strong> <strong>na</strong> Base Nacio<strong>na</strong>l <strong>de</strong> Da<strong>dos</strong> Bibliográficos:<br />
Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />
1
Como to<strong>dos</strong> sabemos, são várias as soluções existentes no mercado no que diz<br />
respeito a sistemas <strong>de</strong> gestão <strong>de</strong> bibliotecas, pelo que houve a necessida<strong>de</strong> <strong>de</strong><br />
<strong>de</strong>senvolver “conversores” que normalizam as características <strong>dos</strong> vários ficheiros ISO<br />
2709: <strong>de</strong> uma forma genérica, convertem os ficheiros em ISO standard (80 colu<strong>na</strong>s),<br />
resolvem alguns problemas <strong>de</strong> repetição <strong>de</strong> campos e subcampos, uniformizam a<br />
pontuação <strong>de</strong> algumas zo<strong>na</strong>s (que em alguns sistemas é digitada e noutros não), e<br />
convertem o co<strong>de</strong>page para aquele que é utilizado pela <strong>PORBASE</strong>.<br />
A funcio<strong>na</strong>lida<strong>de</strong> <strong>de</strong> produção <strong>de</strong> relatórios <strong>de</strong> conteúdo e <strong>de</strong> erros, sobre o lote <strong>de</strong><br />
<strong>registos</strong> em processamento no IRIS, é assegurada pela ferramenta MANGAS. O<br />
Mangas – Manipulação e Gestão <strong>de</strong> Metada<strong>dos</strong> Descritivos, é uma aplicação para a<br />
análise e tratamento <strong>de</strong> da<strong>dos</strong> bibliográficos, que tem embebida toda a estrutura do<br />
formato UNIMARC bibliográfico e os requisitos <strong>de</strong>fini<strong>dos</strong> para a cooperação, e que<br />
penso ser já do conhecimento genérico <strong>de</strong> to<strong>dos</strong>.<br />
Assim são produzi<strong>dos</strong> 2 relatórios, um <strong>de</strong> conteúdo e outro <strong>de</strong> erros:<br />
1. Chamamos relatório <strong>de</strong> conteúdo à análise que é feita em relação aqueles<br />
aspectos que são “contabilizáveis”, que são susceptíveis <strong>de</strong> construir uma<br />
estatística e que nos permitem um conhecimento genérico sobre o acervo<br />
contido no lote. O MANGAS produz os relatórios <strong>de</strong> conteúdo <strong>de</strong> acordo com:<br />
a. Tipos <strong>de</strong> material catalogado;<br />
b. País <strong>de</strong> Publicação;<br />
c. Língua <strong>de</strong> Publicação;<br />
d. Classes CDU;<br />
e. Datas <strong>de</strong> Publicação.<br />
2. Os relatórios <strong>de</strong> erros são elabora<strong>dos</strong> com base <strong>na</strong> correcta aplicação da<br />
estrutura do formato UNIMARC bibliográfico, ao nível <strong>dos</strong> campos, subcampos,<br />
indicadores e da<strong>dos</strong> codifica<strong>dos</strong>, e da estrutura <strong>de</strong>finida como <strong>de</strong><br />
preenchimento essencial e que constitui aquilo a que chamamos nível mínimo<br />
<strong>de</strong> preenchimento, <strong>de</strong> que falaremos mais à frente.<br />
A produção <strong>de</strong> relatórios <strong>de</strong> erros resultantes da aplicação do formato UNIMARC<br />
bibliográfico é feita <strong>de</strong> acordo com os seguintes aspectos:<br />
Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />
2
a. Preenchimento incorrecto da etiqueta <strong>de</strong> registo;<br />
b. Campos, subcampos e indicadores obrigatórios não preenchi<strong>dos</strong>;<br />
c. Campos, subcampos e indicadores in<strong>de</strong>vi<strong>dos</strong> (campos que não se<br />
aplicam no tipo <strong>de</strong> documento em causa e indicadores e subcampos<br />
não autoriza<strong>dos</strong> no campo em uso);<br />
d. Repetição in<strong>de</strong>vida <strong>de</strong> campos e subcampos;<br />
e. Preenchimento incorrecto <strong>de</strong> indicadores (que não se aplicam <strong>na</strong><br />
situação <strong>de</strong>scrita);<br />
f. Preenchimento incorrecto <strong>de</strong> subcampos (preenchimento <strong>dos</strong> da<strong>dos</strong><br />
codifica<strong>dos</strong> e <strong>dos</strong> códigos <strong>de</strong> língua, país e função).<br />
Os lotes <strong>de</strong> <strong>registos</strong> para <strong>integração</strong> são seguidamente sujeitos a um conjunto <strong>de</strong><br />
operações automáticas <strong>de</strong> limpeza e correcção, igualmente asseguradas pela<br />
ferramenta MANGAS.<br />
Este conjunto <strong>de</strong> operações foi <strong>de</strong>finido com base <strong>na</strong> compilação <strong>de</strong> alguns <strong>dos</strong> erros<br />
mais frequentes e em relação aos quais é possível efectuar correcções <strong>de</strong> forma<br />
sistemática (entre estes encontra-se a correcção da sigla da instituição nos campos<br />
801 e 966 e que em gran<strong>de</strong> parte <strong>dos</strong> casos não é a atribuída pela BN para efeitos <strong>de</strong><br />
cooperação). A essas correcções juntaram-se ainda algumas operações <strong>de</strong> limpeza <strong>de</strong><br />
caracteres inváli<strong>dos</strong> em <strong>de</strong>termi<strong>na</strong><strong>dos</strong> campos <strong>de</strong> da<strong>dos</strong> codifica<strong>dos</strong>.<br />
Daqui resulta o seguinte conjunto <strong>de</strong> correcções em bloco: limpeza <strong>de</strong> campos e<br />
subcampos vazios, correcção <strong>de</strong> subcampos <strong>de</strong> preenchimento standard (como a sigla<br />
<strong>de</strong> cooperação <strong>de</strong> que já falei), adição do campo 801 (que apesar <strong>de</strong> ser um campo<br />
obrigatório raramente é preenchido), correcção <strong>de</strong> códigos <strong>de</strong> língua e país ao nível do<br />
uso das maiúsculas e minúsculas, só para citar alguns exemplos. Um aspecto<br />
importante é a adição <strong>de</strong> um campo 001 (que <strong>na</strong> <strong>PORBASE</strong> se converte em 035) on<strong>de</strong><br />
se regista a sigla do cooperante ao qual pertence aquele lote <strong>de</strong> <strong>registos</strong>, o lote a que<br />
correspon<strong>de</strong> e a data <strong>de</strong> tratamento, sendo <strong>de</strong>ste modo preservada a “história” do<br />
registo, que irá permitir a qualquer momento i<strong>de</strong>ntificar a sua origem.<br />
Os <strong>registos</strong> passam agora à fase <strong>de</strong> separação em lotes <strong>de</strong> <strong>registos</strong> com<br />
características pré <strong>de</strong>finidas. Esta triagem é necessária pois os <strong>registos</strong> que não<br />
po<strong>de</strong>rão ser imediatamente integra<strong>dos</strong> <strong>na</strong> <strong>PORBASE</strong>, são guarda<strong>dos</strong> até que existam<br />
as condições para a sua <strong>integração</strong>.<br />
Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />
3
São 2 os filtros aplica<strong>dos</strong> nesta fase:<br />
1. Filtro <strong>de</strong> A<strong>na</strong>líticos - i<strong>de</strong>ntifica e separa os <strong>registos</strong> <strong>de</strong> a<strong>na</strong>líticos, assim<br />
i<strong>de</strong>ntifica<strong>dos</strong> pela etiqueta <strong>de</strong> registo. Isto porque os <strong>registos</strong> <strong>de</strong> a<strong>na</strong>líticos<br />
serão alvo <strong>de</strong> um projecto específico;<br />
2. Filtro <strong>de</strong> Bloco 4XX - i<strong>de</strong>ntifica e separa os <strong>registos</strong> que contém campos do<br />
bloco 4XX preenchi<strong>dos</strong>, uma vez que não se estão a integrar ainda <strong>registos</strong><br />
com ligações ao bloco 4XX e por ser mais uma forma <strong>de</strong> i<strong>de</strong>ntificar os <strong>registos</strong><br />
<strong>de</strong> a<strong>na</strong>líticos que não se encontram i<strong>de</strong>ntifica<strong>dos</strong> <strong>na</strong> Etiqueta <strong>de</strong> Registo.<br />
Limadas as arestas que po<strong>de</strong>riam criar ruído e dificultar o processo <strong>de</strong> comparação, o<br />
IRIS proce<strong>de</strong> então à <strong>de</strong>tecção <strong>de</strong> duplica<strong>dos</strong>, comparando o lote <strong>de</strong> <strong>registos</strong> em<br />
tratamento com toda a <strong>PORBASE</strong>. Cada registo é classificado como duplicado,<br />
possível duplicado ou novo.<br />
A <strong>de</strong>tecção <strong>de</strong> <strong>registos</strong> duplica<strong>dos</strong> é o primeiro passo do processo <strong>de</strong> <strong>integração</strong>, pois<br />
<strong>de</strong>sta forma, mesmo os <strong>registos</strong> que não passariam no filtro <strong>de</strong> nível mínimo, como por<br />
exemplo, os <strong>registos</strong> sem classificação CDU, são passíveis <strong>de</strong> ter a sua localização<br />
registada <strong>na</strong> <strong>PORBASE</strong>. Desta forma, o número <strong>de</strong> <strong>registos</strong> efectivamente integra<strong>dos</strong><br />
é muito maior.<br />
Para os <strong>registos</strong> i<strong>de</strong>ntifica<strong>dos</strong> como duplica<strong>dos</strong> <strong>na</strong> <strong>PORBASE</strong>, o IRIS i<strong>de</strong>ntifica ainda,<br />
quais <strong>dos</strong> seus exemplares ou cota ainda não se encontram no catálogo colectivo.<br />
Esses <strong>registos</strong> novos <strong>de</strong> exemplar são imediatamente importa<strong>dos</strong> e adicio<strong>na</strong><strong>dos</strong> ao<br />
seu duplicado <strong>na</strong> <strong>PORBASE</strong>: este processo gera assim a adição <strong>de</strong> novas cotas.<br />
Existem ainda os <strong>registos</strong> que suscitam dúvidas <strong>na</strong> sua i<strong>de</strong>ntificação enquanto<br />
duplica<strong>dos</strong>, e que constituem o grupo a que chamamos “possíveis duplica<strong>dos</strong>”. Este<br />
grupo exige ainda a análise huma<strong>na</strong> para a confirmação como duplicado efectivo, mas<br />
preten<strong>de</strong>-se que os próximos <strong>de</strong>senvolvimentos da plataforma IRIS sejam foca<strong>dos</strong> <strong>na</strong><br />
melhoria <strong>de</strong>ste processo <strong>de</strong> análise.<br />
I<strong>de</strong>ntificado o lote <strong>de</strong> <strong>registos</strong> novos, é aplicado o filtro <strong>de</strong> nível mínimo: este nível<br />
mínimo <strong>de</strong> preenchimento obrigatório, foi <strong>de</strong>finido <strong>de</strong> forma a garantir uma estrutura <strong>de</strong><br />
preenchimento coerente <strong>de</strong> acordo com o tipo <strong>de</strong> documento a catalogar, <strong>de</strong> modo a<br />
Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />
4
garantir a consistência e qualida<strong>de</strong> mínimas da Base Nacio<strong>na</strong>l <strong>de</strong> Da<strong>dos</strong><br />
Bibliográficos. Para além <strong>dos</strong> campos e subcampos consi<strong>de</strong>ra<strong>dos</strong> <strong>de</strong> preenchimento<br />
obrigatório pelo próprio formato UNIMARC, foram ainda <strong>de</strong>fini<strong>dos</strong> alguns campos e<br />
subcampos cujo preenchimento se consi<strong>de</strong>rou essencial para os fins da cooperação.<br />
Neste momento encontram-se <strong>de</strong>fini<strong>dos</strong> ape<strong>na</strong>s 4 tipos <strong>de</strong> documentos, que<br />
correspon<strong>de</strong>m aos mais comuns <strong>na</strong>s colecções das bibliotecas cooperantes da<br />
<strong>PORBASE</strong>: monografias impressas; publicações periódicas impressas; documentos<br />
electrónicos e a<strong>na</strong>líticos.<br />
Assim, o Filtro <strong>de</strong> Nível mínimo, i<strong>de</strong>ntifica e separa os <strong>registos</strong> que respeitam o nível<br />
mínimo <strong>de</strong> catalogação <strong>de</strong>finido para a <strong>PORBASE</strong>, e os que respeitam esse nível<br />
mínimo são integra<strong>dos</strong> <strong>na</strong> Base Nacio<strong>na</strong>l <strong>de</strong> Da<strong>dos</strong> Bibliográficos, ficando assim<br />
completo o processo <strong>de</strong> tratamento e <strong>integração</strong> <strong>de</strong> <strong>registos</strong> da bibliotecas<br />
cooperantes.<br />
O IRIS tem três mo<strong>dos</strong> <strong>de</strong> processamento <strong>dos</strong> lotes:<br />
1. <strong>Processo</strong> <strong>de</strong> Teste: permite realizar testes <strong>de</strong> <strong>integração</strong> e avaliar conteú<strong>dos</strong> e<br />
comportamentos específicos <strong>de</strong> um lote <strong>de</strong> <strong>registos</strong>;<br />
2. <strong>Processo</strong> Corrente: que processa actualizações e bases <strong>de</strong> da<strong>dos</strong> a integrar<br />
pela primeira vez;<br />
3. <strong>Processo</strong> das Bases completas: utilizado para as bases <strong>de</strong> da<strong>dos</strong> completas<br />
que sofreram actualizações pelo próprio cooperante, como limpeza <strong>de</strong><br />
exemplares que <strong>de</strong>ixaram <strong>de</strong> existir <strong>na</strong> biblioteca ou alterações <strong>de</strong> cotas e que<br />
terá a capacida<strong>de</strong> <strong>de</strong> actualizar os <strong>registos</strong> <strong>de</strong> exemplar <strong>na</strong> <strong>PORBASE</strong> e retirar<br />
os que já não constam do lote. Este processo está ainda em fase <strong>de</strong><br />
<strong>de</strong>senvolvimento e esperamos que esteja operacio<strong>na</strong>l brevemente pois temos<br />
já algumas bases <strong>de</strong> da<strong>dos</strong> completas para <strong>integração</strong>.<br />
Por último, gostaria ainda <strong>de</strong> lembrar a todas as bibliotecas cooperantes a importância<br />
<strong>de</strong> manter os seus da<strong>dos</strong> actualiza<strong>dos</strong> no Directório, pois é ele que fornece ao leitor e<br />
investigador os da<strong>dos</strong> acerca da sigla encontrada <strong>na</strong> <strong>PORBASE</strong>.<br />
Dulce Fontes, <strong>Biblioteca</strong> Nacio<strong>na</strong>l<br />
5