quinta-feira, 3 de outubro de 2013

Como pesquisar: os arquivos dos Mórmons e acervos paroquiais.

Caros colegas do Instituto Norte-Rio-Grandense de Genealogia,

Talvez vocês já sejam sabedores, mas, em todo caso, repasso porque acredito que trata-se de uma dica importante e que economizará bastante tempo nosso em termos de pesquisa. Já é de conhecimento de todos que os mórmons estão disponibilizando, gradativamente, os livros de registros paroquiais (batizados, casamentos, enterros, crismas) de alguns estados do Brasil, no endereço https://www.familysearch.org/search/image/show#uri=https%3A//api.familysearch.org/records/collection/1719212/waypoints

No caso do Rio Grande do Norte, os livros disponibilizados no endereço https://www.familysearch.org/search/image/show#uri=https%3A//api.familysearch.org/records/waypoint/11160374 correspondem, coincidência ou não, a paróquias da região do Seridó (Acari, Caicó, Cruzeta, Currais Novos, Florânia, Jardim do Seridó, Jucurutu, Parelhas e Serra Negra do Norte). Todavia, o portal do Family Search só permite que salvemos página por página. Imaginem, então, o trabalho. Eu mesmo comecei a baixar os livros de Acari, mas, desanimado, parei. 

Encontrei no fórum Geneall.net, no endereço http://www.geneall.net/P/forum_msg.php?id=283222&fview=e, uma possibilidade de baixar os livros paroquiais de uma vez só, livro por livro! A dica foi dada por Rita van Zeller, e reproduzo abaixo. Para fazer o download dos livros, é necessário usar o Mozilla Firefox, baixar o software WinHTTrack e o plugin Add-On IMacros, além, é claro, de ter certa paciência. Segue o texto do fórum, reproduzido ipsis litteris. 

Eu, particularmente, estou utilizando o método para baixar o acervo paroquial de Acari e está dando certo. Já vou em 8 livros de batizados baixados em formato JPG. Não em resolução excelente, mas, com um monitor grande (de 18" acima) dá para fazer leitura. Já consegui rastrear vários descendentes dos mestiços Nicolau Mendes da Cruz (da Bonita, no rio São José) e de Feliciano da Rocha Vasconcelos (das Barrentas) e até ancestrais meus dos Dantas e Araújo, embora, nesse momento da minha pesquisa da tese, o interesse esteja recaindo sobre os mestiços. 

Conversei com o nosso confrade Arysson e acredito que, caso possamos nos dividir e ir baixando esses acervos, poderíamos disponibilizar para todos fazerem cópias. Eu mesmo, de antemão, comprometo-me a baixar o acervo da paróquia de Acari e gravar em DVD para deixar no Instituto, onde todos poderiam fazer cópia. Cada livro, com, em média, 200 a 250 páginas, fica com aproximadamente 100 MB. Ou seja, provavelmente em 1 ou 2 DVDs dê para armazenar a paróquia do Acari. Acho que essa seria uma atitude interessante e salutar para que todos nós, do instituto, pudéssemos compartilhar essas informações tão ricas e que tanto nos deixam felizes. 

Saudações genealógicas,
Helder Macedo


RE: folhear livros paroquiais digitalizados
25-07-2011, 21:58
Autor: rlvz      [responder para o fórum]

Caro Manuel,


Aqui ficam então as instruções para se conseguir fazer o download dos livros dos mormons, agora com os novos endereços.


1) INSTALAR O WINHTTRACK

http://www.httrack.com/


2) INSTALAR O ADD-ON IMACROS NO FIREFOX.

https://addons.mozilla.org/pt-PT/firefox/addon/imacros-for-firefox/


3) CRIAR UMA MACRO PARA OBTER AS LISTAS DE LINKS DOS LIVROS.

Depois de instalado, e reinicializado o Firefox, vai reparar que deve ter à esquerda da barra de endereços um ícone novo (um quadrado azul com uma bola amarela no canto inferior esquerdo).

Se clicar nesse botão, abre-se do lado esquerdo do Firefox um separador vertical, com o iMacros. Na parte de baixo tem três opções: Play; Rec; Edit.

Seleccionar [Rec] e depois clicar em [Record]. Se o iMacros perguntar se quer fechar todos os tabs, responder que não. Clicar em [Stop].

O iMacros vai voltar ao separador [Rec]. Seleccionar na parte de cima do iMacros, logo abaixo da pasta que diz "Favorites" a macro chamada #Current.iim. Na parte de baixo clicar em [Edit] e depois em [Edit Macro]. Vai abrir-se uma segunda janela com o texto da macro. Funciona como um processador de texto. Deve apagar tudo o que lá está, e copiar para lá o texto abaixo:

VERSION BUILD=7361445
TAB T=1
ADD !EXTRACT {{!URLCURRENT}}
SAVEAS TYPE=EXTRACT FOLDER=* FILE=URLS.txt
TAG POS=1 TYPE=IMG ATTR=SRC:https://cdn.familysearch.org/content/images/icon_next_img.png
WAIT SECONDS=1

Clicar [Save & Close].

Na parte de cima do iMacros clicar com o botão direito do rato na macro #Current.iim e seleccionar [Rename]. Na parte de baixo da janela do iMacros vai ver um campo onde pode escrever o nome da macro. Pode chamar-lhe, por exemplo, "Links-Mormons.iim" (sem aspas, e sem esquecer o .iim), e depois clicar no botão [Rename].

Ficou agora com uma macro, que vai poder usar para todos os livros dos Mormons.


4) OBTER A LISTA DE LINKS DE UM LIVRO.


Ir para a primeira página do livro/documento:

No iMacros seleccionar a macro "Links-Mormons" na parte de cima da janela, e na parte de baixo seleccionar o tab [Play].

No campo "Max:" abaixo de "Repeat Macro" colocar o número total de imagens do livro.

Clicar em [Play (Loop)]

A macro vai começar a executar, percorrendo as imagens uma a uma, e gravando o respectivo link num ficheiro no disco. Esperar que se chegue ao fim de todas as imagens, sem interromper a macro. Se a macro encravar, pode recomeçar-se no ponto onde se ficou.


5) PREPARAR A LISTA OBTIDA PARA DOWNLOAD DAS IMAGENS

Dentro da sua pasta "Documentos" ou "Meus Documentos" vai encontrar uma nova pasta "iMacros" e dentro dessa uma pasta "Downloads".

Nessa pasta vai estar um documento chamado URLS.txt (ou apenas URLS para aqueles que não configuraram o Windows para ver as extensões dos nomes dos ficheiros).

Abrir esse ficheiro com um editor de texto. Serve qualquer editor de texto -- Notepad do Windows, NoteTab Light, Notepad++ -- desde que tenha capacidade de fazer um search & replace simples. É preferível um editor de texto simples ao MS Word.

No editor de texto usar a função de substituir (no Notepad do Windows Editar -> Substituir), e fazer duas substituições em todos os links obtidos (no Notepad do Windows "Substituir tudo").

Primeiro substituir o texto seguinte (incluindo as primeiras ")

"https://www.familysearch.org/search/image/show#uri=https%3A//api.familysearch.org/records/pal%3A/MM9.3.1/

por

https://das.familysearch.org/das/v2/apid:


Depois substituir o texto seguinte (incluindo as últimas ")

%3Fcc%3D1850164%26wc%3D8112024"

por

/$dist?ctx=CrxCtxPublicAccess

Ou seja, a linha que era por exemplo

"https://www.familysearch.org/search/image/show#uri=https%3A//api.familysearch.org/records/pal%3A/MM9.3.1/TH-1-16279-48687-54%3Fcc%3D1850164%26wc%3D8112024"

transforma-se em

https://das.familysearch.org/das/v2/apid:TH-1-16279-48687-54/$dist?ctx=CrxCtxPublicAccess

ou seja a parte que se aproveita é "TH-1-16279-48687-54", a referência directa para a imagem em questão.

Depois de fazer todas as substituições, e ter uma lista de links com este aspecto, por exemplo:

https://das.familysearch.org/das/v2/apid:TH-1-16279-48687-54/$dist?ctx=CrxCtxPublicAccess
https://das.familysearch.org/das/v2/apid:TH-1-16279-48623-10/$dist?ctx=CrxCtxPublicAccess
https://das.familysearch.org/das/v2/apid:TH-1-16279-48384-14/$dist?ctx=CrxCtxPublicAccess
https://das.familysearch.org/das/v2/apid:TH-1-16279-48535-7/$dist?ctx=CrxCtxPublicAccess

etc., guardar o ficheiro e fechá-lo.



6) FAZER O DOWNLOAD DAS IMAGENS COM O WINHTTRACK

Abrir o WinHTTrack.

Clicar em [Seguinte].

Dar um nome ao projecto. Clicar em [Seguinte]

Se é a primeira vez que se usa o WinHTTRack configurar as opções:

==========
Clicar em [Set Options]

Scan Rules: seleccionar o quadrado que diz gif, jpg, png, tif, bmp

Build:
Local Structure Type: User-defined structure
clicar em [Options] e na janela que aparece escrever exactamente isto:

%r/%h%p/%n%[id:-:::].%t

clicar em [OK] para fechar essa janela
clicar em [OK] outra vez para fechar a janela das Options

Na barra de menu clicar Preferences -> Save Default Options
=========

No menu dropdown de "Action" seleccionar "Get separated files"

Na linha que diz "URL List (txt):" clicar no botão com "...", navegar até à pasta Documentos -> iMacros -> Downloads e seleccionar o ficheiro URLS.txt.

Clicar em [Seguinte]

Clicar em [Concluir]

No fim do Download as imagens vão estar dentro da pasta "nome do projecto", em C:\My Web Sites (Computador -> Disco C: -> My Web Sites).

Se tudo tiver corrido bem, deve apagar-se o ficheiro URLS.txt ou dar-lhe outro nome, para poder ser usado para recolher a lista de links do próximo download.


(todos os links numa linha só, caso fiquem partido nesta mensagem)



Vamos a ver quanto tempo dura este método!

Melhores cumprimentos,

Rita van Zeller


--

@heldermacedox

Oco-do-pau de Helder Macedo

Meu cantinho escuro e molhado
http://escuromolhado.wordpress.com

"O meu mundo não é como o dos outros,
Quero demais, exijo demais,
Há em mim uma sede de infinito,
Uma angústia constante que nem eu mesma compreendo,
Pois estou longe de ser uma pessimista;
Sou antes uma exaltada, com uma alma intensa, violenta, atormentada.
Uma alma que não se sente bem onde está, que tem saudade... Sei lá de quê!" (Florbela Espanca)


2 comentários:

  1. Gostaria de conseguir os arquivos de Acari, mas não consegui fazer o procedimento. Alguém pode disponibilizar aqui no blog?

    ResponderExcluir
  2. Procure o prof.João Felipe, através do imeio hipotenusa@digi.com.br , se identifique e peça as informações que deseja.

    ResponderExcluir