"Ebook del I Concurso Wikanda"

Wikanda:Dumps

De Wikanda
Saltar a: navegación, buscar

En esta página se detalla cómo obtener y utilizar los dumps o copias de seguridad de Wikanda.

Descarga

Los contenidos de Wikanda están disponibles para su descarga en:


https://dumps.wikanda.es


Los dumps se encuentran separados por locapedias. Dentro del directorio de cada una de ellas encontrará dos subdirectorios: el que alberga los dumps XML y el de las imágenes, detallados más abajo.

También verá dos ficheros con la forma *pedia-xml-latest.xml.7z y *pedia-files-latest.list. Son accesos directos para descargar la última copia del XML e imágenes, respectivamente.

Dump XML

► Contiene los textos e historiales de todas las páginas de cada wiki. Representa una copia íntegra en XML de los contenidos textuales de cada portal.

► Se generan diariamente mediante dumpBackup.php.

► En los subdirectorios /xml/ se almacenan durante un plazo de 15 días.


Exportar/importar

Para importar el dump XML en otra instalación de MediaWiki necesita tener acceso a la consola y seguir las instrucciones.

También puede exportar o importar páginas individuales o en lotes pequeños (< 100) con las siguientes herramientas de MediaWiki:

Dump de ficheros

► Contiene un listado con las URLs de todas las imágenes disponibles en tamaño original.

► Se generan diariamente y se almacenan en los subdirectorios /files/ durante un plazo de 15 días.


Descarga automática

Las imágenes listadas en los ficheros .lst pueden ser obtenidas automáticamente usando un gestor de descargas.

Por ejemplo, en GNU/Linux puede usar wget de la siguiente forma:

wget -i https://dumps.wikanda.es/wikanda/wikanda-files-latest.list


Descarga parcial

Si quiere mantener una copia actualizada de las imágenes disponibles, no es necesario que las descargue todas cada vez. Puede obtener únicamente los nuevos ficheros haciendo una comparación entre el archivo .list de su copia local previamente descargada y el latest.lst de dumps.wikanda.es.

En GNU/Linux podría hacerlo usando las herramientas diff o comm:

comm -13 wikanda-files-20161231.list wikanda-files-latest.list > wikanda-files-diff.list

También puede usar directamente wget sobre su repositorio local, indicando que no se descarguen los ficheros ya existentes (-nc, --no-clobber):

wget -nc -i https://dumps.wikanda.es/wikanda/wikanda-files-latest.list

En cualquier caso, debe tener en cuenta que algunos archivos pueden ser renombrados según las políticas de cada portal.


Importar

Para importar en una instalación de MediaWiki:

  1. Activar y configurar la subida de ficheros.
  2. Activar $wgHashedUploadDirectory (recomendado por el alto volumen de imágenes).
  3. Activar $wgUseInstantCommons (algunas imágenes enlazadas en el dump XML se insertan directamente desde Commons por este método).
  4. Importar usando ImportImages.php.

Licencia

Todos los dumps se encuentran bajo la misma licencia general de contenidos de Wikanda: Creative Commons Reconocimiento-CompartirIgual 3.0.

Los archivos de imágenes pueden estar sujetos a otras licencias. Si va a usar cualquiera de las imágenes enlazadas en un dump, compruebe primero la licencia buscándola por su nombre de archivo en el portal correspondiente.

Otros wikis

► Puede encontrar los dumps de Wikipedia y el resto de proyectos de la Fundación Wikimedia en dumps.wikimedia.org.

► Existen copias de seguridad de miles de wikis en Archive.org, dentro de la iniciativa Wiki Team.