SQL Server dispone de múltiples tipos de replicación de datos que nos ayudarán a automatizar la duplicación de datos. Habitualmente estos datos son duplicados para sacar un beneficio de ello. Un ejemplo típico es el desacoplamiento de cargas de lectura y de escritura, donde desde una instancia de lectura/escritura distribuimos datos a N servidores de solo lectura. Otro escenario típico de replicación implica la duplicación de datos entre una oficina central y un conjunto de oficinas distribuidas geográficamente.En este post vamos a mostrar paso a paso cómo configurar una replicación transaccional unidireccional explicando durante el proceso de configuración los roles implicados así como los distintos agentes. El primer paso que debemos realizar es configurar la distribución de datos en nuestro publicador. El servidor publicador será aquel servidor (central, principal, etc.) que contendrá los datos que deseamos replicar a los servidores suscriptores (secundarios, oficinas, etc.). Para configurar la distribución utilizaremos la opción “Configure Distribution…” directamente desde Management Studio:

image_thumb_254BFEA3

Indicaremos que el distribuidor de nuestra instancia será la misma instancia que estamos utilizando para publicar los datos:

image_thumb_1_254BFEA3

Esta configuración es válida cuando la carga de nuestra réplica no es elevada, el número de suscriptores no es muy alto y no tenemos funcionalidades de alta disponibilidad no compatibles con el rol de distribución. Por ejemplo podemos tener esta configuración sin problemas montada en un cluster pero si utilizamos Database Mirroring como mecanismo de alta disponibilidad deberemos utilizar otra instancia independiente como distribuidor. También es habitual que cuando tenemos un entorno con múltiples publicadores se centralice la configuración en un único distribuidor.

A continuación indicaremos que el agente de SQL Server se configure para arrancar automáticamente (si no lo teníamos ya configurado de esta forma). La relación entre el agente de SQL Server y la replicación es muy íntima ya que el agente es el responsable de la ejecución de los agentes de replicación (meros ejecutables con parámetros) mediante el uso de jobs de SQL Server.

image_thumb_2_254BFEA3

Para inicializar una réplica habitualmente utilizamos lo que se llama una instantánea. Una instantánea contiene todos los datos que vamos a replicar que están presentes en un instante en el tiempo. Una vez que se ha generado una instantánea se utilizará para inicializar los suscriptores y poder continuar la replicación de datos desde ese punto en el tiempo. Como símil podemos pensar en que una instantánea corresponde con un backup completo de los datos a replicar sobre los que posteriormente aplicaremos los “log de transacciones” pendientes hasta dejar los suscriptores sincronizados. Indicaremos la ruta donde queremos almacenar las instantáneas, siendo recomendable que la ruta sea una ruta de red para facilitar el acceso de la instantánea desde los suscriptores:

image_thumb_5_5339515B

Elegiremos la ubicación para los ficheros de datos y del log de transacciones de nuestra base de datos de distribución e indicaremos que deseamos que nuestra instancia sea un publicador autorizado:

image_thumb_6_5339515B

Una vez configurada la distribución procederemos a crear nuestra publicación. Para ello desplegaremos el nodo “Replication” del Object Explorer de la instancia e indicaremos con el menú contextual del nodo “Local Publications” que queremos crear una nueva:

image_thumb_7_5339515B

Elegiremos la base de datos que contiene los artículos (tablas, vistas, procedimientos, etc.) que vamos a replicar. Debemos tener en cuenta que si deseamos replicar datos de distintas bases de datos lo deberemos realizar en distintas publicaciones ya que una publicación puede contener únicamente objetos de una base de datos. Seleccionaremos por ejemplo AdventureWorks:

image_thumb_8_5339515B

Indicaremos que vamos a utilizar replicación transaccional. En la replicación transaccional se garantiza el orden de las transacciones así como la consistencia de dichas transacciones. Para ellos se marcarán en el log de transacciones los cambios que afecten a los artículos publicados de forma que el agente logreader pueda llevar dichos cambios de forma consistente a la base de datos de distribución.

image_thumb_9_5339515B

A continuación seleccionaremos los artículos a replicar. En nuestro caso seleccionaremos únicamente una tabla, la tabla de contactos, para ser replicada:

image_thumb_10_5339515B

Es interesante que revisemos si las propiedades de replicación del artículo por defecto se ajustan a nuestras necesidades. Para ello utilizaremos el botón “Article Properties” para desplegar la ventana de propiedades:

image_thumb_11_5339515B

Una modificación habitual a estas propiedades por defecto es activar la copia automática de los índices no-clustered. Por defecto el artículo contara únicamente con el índice cluster si éste existiera. También puede ser interesante habilitar la opción de copiar las restricciones check (“copy check constraints”) para facilitar al optimizador los planes de ejecución de algunas consultas.

Una vez configuradas las propiedades, continuaremos con los filtros de datos:

image_thumb_12_5339515B

En ocasiones no deseamos replicar todo el conjunto de datos de la tabla. Por ejemplo podemos desear mantener únicamente los datos a partir de una fecha o bien los correspondientes a un país concreto. Por ejemplo si quisiéramos filtrar únicamente aquellos contactos cuyo título sea “Mr.” podríamos crear un filtro de este tipo:

image_thumb_13_5339515B

A continuación configuraremos el agente de instantáneas (snapshot) para que nos genere una instantánea al finalizar el asistente. De esta forma podremos inicializar un suscriptor tan pronto como la instantánea finalice:

image_thumb_14_5339515B

A continuación indicaremos las cuentas de seguridad que utilizarán los agentes. Como buena práctica deberemos generar usuarios específicos para cada uno de los agentes y dar a cada uno de ellos los permisos necesarios. Aunque no lo recomendamos para un sistema en producción, para simplificar en este ejemplo, utilizaremos la misma cuenta que utilizamos para el servicio del agente de SQL Server:

image_thumb_15_5339515B

Finalmente, crearemos la publicación que hemos configurado. En esta pantalla tenemos una opción muy útil de generar un script con todos los pasos necesarios para recrear la replicación. Como hemos comprobado, son muchos los pasos a seguir y es fácil, cuando tenemos unas cuantas decenas de artículos replicados con propiedades distintas, equivocarnos al configurar una réplica con el interfaz de usuario. Además recomendamos guardar dicho script para si tenemos un desastre y necesitamos por ejemplo restaurar nuestra base de datos en otro servidor poder regenerar nuestra réplica rápidamente.

image_thumb_16_0126A414 image_thumb_17_0126A414

 

Una vez creada la publicación, procederemos a crear una suscripción nueva. Para ello sobre la nueva réplica utilizaremos la opción contextual de crear nueva suscripción:

image_thumb_18_0126A414

Para comenzar seleccionaremos el publicador, nuestra instancia donde configuramos la publicación, y la base de datos publicada:

image_thumb_20_0126A414

A continuación elegimos la modalidad de la suscripción, push o pull. Las suscripciones push son aquellas en las que el agente de distribución, responsable de entregar las transacciones del distribuidor al suscriptor, se ejecuta en el distribuidor. Las suscripciones pull son aquellas en las que el agente de distribución se ejecuta en el suscriptor. La elección de una modalidad u otra dependerá de diversos factores. Por ejemplo si tenemos un alto número de suscriptores, 100 por ejemplo, puede ser recomendable utilizar suscripciones pull para evitar saturar al distribuidor con la ejecución de 100 agentes, uno por cada suscriptor. Sin embargo si el número es bajo puede interesarnos centralizar los agentes en el distribuidor y de esa forma tener más control sobre la ejecución de los agentes. En nuestro ejemplo elegiremos crear una suscripción push:

image_thumb_21_0126A414

Elegiremos la instancia y la base de datos donde se replicarán nuestros datos:

image_thumb_22_0126A414

De nuevo utilizaremos la seguridad del proceso del agente para simplificar la conectividad. Recordemos que lo recomendable es impersonar una cuenta específica para los agentes de replicación:

image_thumb_23_0126A414

Aunque lo habitual es que los agentes de distribución se ejecuten de forma continua en el caso de la replicación transaccional, también podemos definir una planificación específica de forma que por ejemplo únicamente distribuyan cambios por la noche de 8 PM a 6 AM. Elegiremos que ejecute el agente continuamente y continuamos:

image_thumb_24_0126A414

Finalmente indicaremos cuando deseamos que se inicialice la suscripción a partir del snapshot. Es posible que creemos la suscripción en un momento del día distinto al que queremos que inicialice. En este ejemplo indicaremos que se inicialice de forma inmediata:

image_thumb_25_0126A414

Al igual que ocurría al crear la publicación, con la suscripción tenemos también la opción de realizar la operación directamente y de generar un script con la configuración utilizada. Es útil disponer de dichos scripts para casos de desastre o si deseamos configurar N suscriptores con la misma configuración utilizar dicho script editando los parámetros correspondientes para facilitar la labor:

image_thumb_26_0126A414

Finalmente tenemos nuestra suscripción creada:

image_thumb_27_0126A414

Por último nos quedará comprobar con el monitor de replicación que todo está funcionando correctamente. Lanzaremos el monitor de replicación desde el menu contextual del nodo “Replication”:

image_thumb_28_0126A414

Podemos ver como se ha generado correctamente el snapshot y el agente Log Reader está en marcha:

image_thumb_29_6C3521A0

Si pasamos a la pestaña de las suscripciones podemos ver que está funcionando correctamente el agente de distribución:

image_thumb_30_6C3521A0

Si hacemos doble-click sobre la publicación veremos los detalles de la inicialización mediante el uso de la instantánea:

image_thumb_31_6C3521A0

Como hemos podido ver la configuración de una replicación transaccional no es compleja aunque sí requiere de un conjunto de pasos bastante extenso. Existen además multitud de parámetros y configuraciones que modifican su comportamiento por lo que debemos ser cautos con el uso de la replicación por las implicaciones que pueda tener.

Con la práctica y el uso de scripts es viable generar publicaciones y suscripciones en pocos segundos bajo demanda o incluso utilizar una modalidad especial de suscripciones anónimas donde exponemos una publicación y son los suscriptores los que se encargan de suscribirse/desuscribirse a nuestra publicación.

 

0 Shares:
5 comments
  1. Hola

    Soy nuevo en el mundo de la replicacion y tengo algunas dudas que espero me puedas ayudar a resolverlas, de antemano agradesco tu tiempo.

    1.- Como puedo configurar el hecho de que al reiniciar la suscripcion por medio de una snapshot esta sólamente suba los datos que no están en el suscriptor y no me suba articulos duplicados ( no puedo configurar que borre los datos en primera porque hay información de varios publicadores en la mismaa base)
    2.- Si por algún error el suscriptor queda como inactivo y hay que quitarlo (unicamente el suscriptor) y volverlo a configurar, que no me duplique los datos, que de igual forma que la pregunta anterior sólamente suba los datos creados en el publicador y que no hayan sido entregados al suscriptor.

    Espero me apoyes con estas dudas saludos y gracias.

  2. Gracias por la magnífica explicación, me cabe una duda, para eliminar las publicaciones y distribuciones creadas ¿como puedo hacerlo?, ¿hay algún orden a seguir?

    1. Hasta donde yo sé no existe límite alguno en el número de bases de datos a replicar. Sí existen ciertas limitaciones respecto al número de artículos o de columnas por tabla, pero son valores realmente muy elevados y que nunca me han resultado una limitación. Obviamente esto no significa que tener publicaciones y suscripciones tenga 0 coste para el servidor. Es decir, debemos tener en cuenta que ejecutar los agentes de réplica supone una carga extra sobre el servidor, así como también no podemos despreciar la carga generada sobre la base de distribución cuando el número de publicaciones o suscripciones son elevadas. En resumen, que no creo que vayas a tener problemas en replicar un número elevado de bbdd simplemente por su número.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like

Sobre la nueva certificación MCDBA

Si has leido el mensaje Microsoft Certified Database Administrator for Yukon de Clemens Reijnen , ya sabres que Microsoft está cambiando esta certificación para hacerla m;as cercana a la realidad de las tareas que los administradores de bases de datos realizan cada día en su puesto de trabajo.