Los servidores vinculados ó linked servers en SQL Server son una característica bastante utilizada en la mayoría de entornos actualmente.

¿Qué es un servidor vinculado?

Un servidor vinculado es una configuración que permite ejecución de comandos contra orígenes OLEDB remotos. En este artículo nos vamos a centrar en servidores vinculados hacia orígenes de datos SQL Server.

¿Qué beneficios tiene utilizar un servidor vinculado?

El utilizar un servidor vinculado nos da la ventaja de:

  • Acceso a servidores remotos desde SQL Server sin necesidad de abrir explícitamente conexión en nuestras aplicaciones
  • Lanzar consultas distribuidas, actualizaciones, comandos y transacciones entre uno o varios de dichos servidores vinculados y el servidor local propiamente dicho
  • La habilidad de acceder a varios orígenes de datos simultáneamente

Mitos y leyendas de los servidores vinculados

Existe un mito que le leido por ahí (no pondré fuentes para no ser el dedo acusador) que dice que usar servidores vinculados da mal rendimiento siempre porque blah blah blah….

La realidad es que, aunque no van mal encaminados, todo tiene un por qué y aquí es donde lo vamos a analizar, demostrar y ver como evitarlo.

El siguiente texto forma parte de la documentación oficial hablando de linked servers :

To create the best query plans when you are using a table on a linked server, the query processor must have data distribution statistics from the linked server.Users that have limited permissions on any columns of the table might not have sufficient permissions to obtain all the useful statistics, and might receive a less efficient query plan and experience poor performance. If the linked server is an instance of SQL Server, to obtain all available statistics, the user must own the table or be a member of the sysadmin fixed server role, the db_owner fixed database role, or the db_ddladmin fixed database role on the linked server

Y aquí por tanto nos está diciendo que debemos cumplir una premisa relativa a la seguridad del servidor vinculado. En el siguiente punto veremos qué implicaciones tiene el enunciado anterior.

¿Qué debemos tener en cuenta al utilizar un servidor vinculado?

Lo que debemos tener muy presente a la hora de utilizar un servidor vinculado es que si no cumplimos el requisito anterior, los valores de las estadísticas que se utilizan para generar el plan de ejecución que SQL Server genera son incorrectos y terminan produciendo un grave problema de rendimiento “desapercibido”.

La razón es ni mas ni menos, que se necesitan permisos sysadmin, db_owner o db_ddadmin del login remoto que se usa para logearse en el servidor remoto. De lo contrario, no se tienen permisos suficientes para poder acceder a las estadísticas de los objetos remotos y por tanto el plan de ejecución será generado con información incorrecta y potencialmente se generará ineficientemente.

El siguiente ejemplo ilustra bastante bien el problema y su solución

crear login en destino
  1. :connect 192.168.9.9sql2008r2 -Usa -Ppassword
  2. USE [master]
  3. GO
  4. CREATE LOGIN [userLimited] WITH PASSWORD=N’password’,
  5.         DEFAULT_DATABASE=[AdventureWorks],
  6.         CHECK_EXPIRATION=OFF, CHECK_POLICY=OFF
  7. GO
  8. USE [AdventureWorks]
  9. GO
  10. CREATE USER [userLimited] FOR LOGIN [userLimited]
  11. GO
  12. USE [AdventureWorks]
  13. GO
  14. EXEC sp_addrolemember N’db_datareader’, N’userLimited’
  15. GO

 

Crear servidor vinculado
  1. :connect (local)sql2008r2
  2. USE [master]
  3. GO
  4. EXEC master.dbo.sp_addlinkedserver @server = N’192.168.9.9SQL2008R2′, @srvproduct=N’SQL Server’
  5. GO
  6. USE [master]
  7. GO
  8. EXEC master.dbo.sp_addlinkedsrvlogin @rmtsrvname = N’192.168.9.9SQL2008R2′,
  9. @locallogin = NULL , @useself = N’False’, @rmtuser = N’userLimited’, @rmtpassword = N’password’
  10. GO

Ahora lanzamos la consulta y vemos su plan de ejecución

query
  1. :connect (local)sql2008r2
  2. — 2362
  3. SELECT l.*
  4. FROM AdventureWorks.Sales.SalesOrderHeader l
  5.     JOIN [192.168.9.9SQL2008R2].AdventureWorks.Sales.SalesOrderHeader r ON l.SalesOrderID = r.SalesOrderID
  6. WHERE r.CustomerID = 666
  7. go

Su plan de ejecución

Linked servers: optimización

y más concretamente, si vemos los detalles del operador “Remote Query”

Linked servers: optimización

Es importante darse cuenta de la gran disparidad entre “Actual Number of Rows” y “Estimated Number of Rows”.

Esa disparidad viene dada porque el plan de ejecución remoto no ha podido acceder al histograma de distribución de datos y ha devuelto el nº de filas estimado.

No es mi intención ahora explicar como leer y acceder las estadísticas de SQL Server (eso será fruto de un futuro post), pero creo conveniente que se vea que si se añade por ejemplo el rol db_owner al login remoto, el plan de ejecución cambia (para mejor) puesto que se puede acceder al histograma de distribución:

Dar permisos db_owner
  1. :connect 192.168.9.9sql2008r2 -Usa -Ppassword
  2. USE [AdventureWorks]
  3. GO
  4. EXEC sp_addrolemember N’db_owner’, N’userLimited’
  5. GO

Volviendo a lanzar la misma query de antes, ahora obtenemos el siguiente plan de ejecución:

Query
  1. :connect (local)sql2008r2
  2. DBCC DROPCLEANBUFFERS
  3. go
  4. SELECT l.*
  5. FROM AdventureWorks.Sales.SalesOrderHeader l
  6.     JOIN [192.168.9.9SQL2008R2].AdventureWorks.Sales.SalesOrderHeader r
  7.     ON l.SalesOrderID = r.SalesOrderID
  8. WHERE r.CustomerID = 666
[box type=”info”] NOTA: El DROPCLEANBUFFERS es simplemente para forzar que se produzca un nuevo plan de ejecución…teóricamente no haria falta…pero bueno [/box]

Linked servers: optimización

De entrada vemos que el operador principal utilizado ahora es un Nested Loops…y lo es simplemente porque sabe que el nº de filas que van a venir de la query remota es extremadamente bajo:

Linked servers: optimización

Como vemos, ahora ya el nº de filas estimadas es bastante acercado a la realidad, simple y llanamente porque se ha podido acceder al histograma:

Ver histograma
  1. :connect 192.168.9.9sql2008r2 -Usa -Ppassword
  2. DBCC SHOW_STATISTICS(N'”AdventureWorks”.”Sales”.”SalesOrderHeader”‘, “IX_SalesOrderHeader_CustomerID”) WITH HISTOGRAM_STEPS
  3. go

Linked servers: optimización

[box type=”info”] NOTA: En futuros posts, se darán nociones para comprender la lectura de las estadísticas en SQL Server.[/box]

Conclusión

Si estas utilizando servidores vinculados, ten muy presente los requerimientos de seguridad mencionados en este post, si no quieres llevarte sorpresas desagradables en el rendimiento de tu sistema.

 

0 Shares:
9 comments
  1. Hola:

    Tengo una duda después de leer su post, y es sobre la ejecución remota de un scan (REMOTE SCAN) que he visto varias veces.

    ¿Se hace un scan en el server remoto y se envían al local solo las filas que cumplan una posible condición WHERE? ¿O se envían todas las filas (de remoto a local) y es en el local donde se aplica el WHERE?

    Gracias,

    Ignacio

    1. Hola Ignacio, efectivamente lo ideal es que se haga el scan en el server remote y se envien las filas que cumplen la condición. El problema como comento es que si no se tienen los permisos necesarios, al no poder ir a las estadísticas para estimar qué filas devolver…el scan se lee todo y lo envia todo, teniendose que filtrar en local, no en remote con el consiguiente problema de Rendimiento que eso ocasiona (bloqueos, lentitud, consumo de RAM, ancho de banda de red,…)

  2. hola tengo una consulta más bien una pregunta
    tengo dos servidores linkedados server1 y server2
    voy a hacer una select al server 1 y el resultado lo quiero guardar en una tabla con WITH y quiero hacer un update en el server dos la consulta esta corriendo en el server dos pero son 26mil registros y se tarda mas de una 1

    y creando la tabla local sin el WITH se tarda 4 segundos

    es conveniente el uso de WITH en servidores linkeados?

    1. La cláusula WITH en principio no es el problema. El problema habría que ver si es porque tienes latencias de red, microcortes, falta de ram, saturación de discos,…o simplemente está mal indexado. Si una opción tarda 1h y la otra 4s, algo le pasa al servider2 🙂

  3. Hola.
    Y como el doy seguridad a ese linked server ?
    Me explico, el usuario userLimited solo quiero que tenga permisos de lectura a una tabla especifica, al darle permisos OWNER la seguridad como la manejo desde el servidor que accede al Linked Server ?

    Saludos.

    1. la seguridad se la das luego al login que uses para crear ese linked server. Si el login para el linked server se llama “cristian”, podrias darsela a ese login en el servidor destino, como le darias a un usuario cualquiera.

      un saludo.

  4. Hola,
    Tengo una duda, ejecuto una consulta con un linkserver,
    Por ejemplo
    SELECT l.*
    FROM AdventureWorks.Sales.SalesOrderHeader l
    JOIN [192.168.9.9SQL2008R2].AdventureWorks.Sales.SalesOrderHeader r
    ON l.SalesOrderID = r.SalesOrderID
    WHERE r.CustomerID = 666

    Y esa misma consulta la ejecuto, pero en el servidor vinculado directamente, que causa que en el servidor vinculado me indique que hace falta un indice y ejecutándola con el linkserver no.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like

Power BI Dataflows: Machine Learning en dos clicks!

En esta entrada continuaremos con la saga "en dos clicks", en la entrada anterior explicamos como hacer análisis de sentimiento en dos clicks con Power BI dataflows y ahora es el turno de mostrar cómo crear modelos de machine learning de forma automática utilizando la nueva funcionalidad abierta a través de los Power BI Dataflows.