Seguro que más de una vez vuestros usuarios os han hecho una pregunta del estilo “¿Cómo es posible que pueda buscar en Internet y obtener resultados al instante y no es posible realizar una búsqueda similar sobre nuestros datos?” Y si lo analizamos desde el punto de vista del usuario, y de su experiencia de utilización de este tipo de herramientas, seguro que llegamos a su misma conclusión. Los usuarios está acostumbrados a poder realizar este tipo de búsquedas en Internet, por lo que deberíamos de ser capaces de proporcionarles un mecanismo similar para que puedan realizar ese tipo de búsqueda, entre la información almacenada en los sistemas de información de la empresa. Ese concepto se denomina Búsqueda Empresarial, cuyo principal objetivo es proporcionar a los usuarios la capacidad de buscar y encontrar información que le permita ser más productivo en sus tareas cotidianas.
Microsoft y la Búsqueda Empresarial
Si tuviésemos que definir los requisitos que una organización necesita para implementar con éxito una herramienta de búsqueda empresarial, desde el punto de vista del usuario final, podríamos resumirlos en los siguientes:
- Capacidad de indexar contenidos independientemente de donde estén almacenados. Si queremos que una aplicación de estas características tenga éxito, debemos de proporcionarle al usuario la posibilidad de realizar búsquedas entre todos los contenidos de la organización.
- Interfaz único y amigable. En concordancia con lo comentado en el punto anterior, los usuarios deberían de disponer de un interfaz único desde el que poder realizar las búsquedas, sin necesidad de conocer de antemano, donde está almacenada la información.
- Capacidades avanzadas de búsqueda, que permitan definir palabras clave, mejores coincidencias, definiciones de términos o corrección de las consultas son herramientas que los usuarios están acostumbrados a ver en los buscadores tradicionales.
- Posibilidad de suscribirse a los resultados de la búsqueda, de modo que cuando esos resultados varíen se le notifique al usuario.
En este nuevo frente que se abre para implementar sistemas de indexación y búsqueda dentro de la organización, Microsoft dio su primer paso con la Búsqueda Empresarial de SharePoint, que en la nueva versión 2007, dio lugar a una edición del producto, denominada Microsoft Office SharePoint for Search. Esta versión, como su propio nombre indica, proporcionaba solo las características de búsqueda de SharePoint, permitiéndonos desplegar una infraestructura para soportar entornos de búsqueda empresarial. Sin embargo Microsoft ha decidido ir un poco más allá y está preparando una familia de productos pensados única y exclusivamente para dar soporte a este tipo de necesidades de búsqueda empresarial: Search Server 2008, que cumple con todos los requisitos enumerados anteriormente. A día de hoy ya podemos probar una versión CTP de Microsoft Search Server 2008 Express, la versión gratuita de la familia, que podéis descargar desde http://www.microsoft.com/enterprisesearch/serverproducts/searchserverexpress/default.aspx y cuya versión final está anunciada para la primavera de 2008. Al igual que ha ocurrido en otros productos, esta versión gratuita proporciona toda la funcionalidad necesaria para implementar una aplicación de búsqueda empresarial, y nos proporcionará la opción de actualizarnos a la versión Search Server 2008, si tenemos requisitos adicionales de Alta Disponibilidad o Escalabilidad. Del mismo modo, podremos actualizar a Microsoft Office SharePoint Server 2007, si necesitamos algunas de las características de gestión de contenidos o colaboración adicionales.
Microsoft Search Server 2008 Express
Como hemos comentado, el primero de los productos que podemos analizar es Microsoft Search Server 2008 Express. Construido sobre la base de Windows SharePoint Services, proporciona un interfaz amigable, tanto desde el punto de vista de usuario final, como desde el punto de vista del administrador, para el que existe un cuadro de control unificado desde el que se puede ver el estado del sistema y de los trabajos planificados. Así mismo, el administrador dispone de accesos directos para las tareas más habituales, como agregar orígenes de datos o gestionar la seguridad de los usuarios.
Para el usuario final, de forma predeterminada Search Server 2008 Express incorpora el denominado Search Center, un sitio de Windows SharePoint Services, que actúa como fachada para el usuario y desde el que se pueden realizar todo tipo de búsquedas. Como se puede apreciar en la Figura 2, este centro de búsqueda no contiene ningún tipo de información, tan solo un cuadro de búsqueda, y la opción de búsqueda avanzada, puesto que el objetivo es que las capacidades de Search Server se integren dentro de alguna aplicación corporativa, habitualmente, la intranet de la organización, aunque proporciona la funcionalidad suficiente como para que puede ser utilizada directamente.
¿Qué podemos buscar?
Lo más relevante para una aplicación de Búsqueda Empresarial, es la capacidad de dicha aplicación para indexar y facilitar las búsquedas en el mayor número de fuentes de datos posibles, de modo que seamos capaces de integrar la mayor cantidad de información. De este modo, podremos proporcionar a nuestros usuarios una única ubicación desde la que poder realizar búsquedas, lo más relevantes posibles para sus necesidades diarias. El mecanismo utilizado para indexar el contenido de estas ubicaciones es el mismo que utiliza SharePoint desde sus inicios, los iFilters, que permiten extraer el texto de diferentes formatos de documentos y contenidos para su indexación conjunta. Con respecto a Microsoft Search Server 2008 Express, este proporciona la posibilidad de trabajar, de forma nativa con los siguientes orígenes de datos:
- Sitios de SharePoint, por lo que podremos indexar cualquier contenido de los sitios de SharePoint agregados, no solo documentos, sino también contenidos de las listas. De este modo, podemos utilizar Search Server de forma centralizada, indexando contenidos de nuestros servidores SharePoint, independientemente de las búsquedas que tengamos habilitadas en dichos servidores.
- Sitios Web. Podemos indexar cualquier sitio web, que contenga información relevante para nuestro y que queramos hacer disponible para nuestros usuarios. El único requisito para poder indexar estos sitios, es que dispongamos de un iFilter que sea capaz de analizar las páginas del sitio. De forma predeterminada, Search Server dispone (realmente están instalados a nivel del Sistema Operativo) de iFilters para indexar páginas html y asp, en todas sus variantes.
- Recursos Compartidos. Podemos indexar el contenido de recursos compartidos de red, sin necesidad de incorporar el contenido de esos recursos compartidos dentro del servidor de búsqueda o un sitio de SharePoint. DE este modo, podemos proporcionar a los usuarios la capacidad de realizar búsquedas sobre documentos que se encuentran en recursos compartidos de red y que ellos utilizan en su día a día. Search Server, lee los contenidos de esos documentos, utilizando los correspondientes iFilters, y los indexa, almacenando esos índices en el servidor Search Server.
- Carpetas Públicas de Exchange. Es común que las organizaciones que utilizan Microsoft Exchange, dispongan de aplicaciones que almacenen información en carpetas públicas de Exchange. Search Server posibilita la indexación y búsqueda dentro de estas carpetas.
- Bases de Datos Lotus Notes. Al igual que ocurre con las carpetas públicas de Exchange, las organizaciones que utilizan Lotus Notes disponen de aplicaciones que almacenan datos en repositorios de Lotus Notes. Esta característica permite, a las organizaciones que utilicen Lotus Notes, extender estas aplicaciones con capacidades de búsqueda utilizando Search Server.
Además, de estas ubicaciones, una de las grandes novedades de Search Server, es la posibilidad de utilizar Ubicaciones Federadas. Estas ubicaciones federadas, posibilitan extender las búsquedas a otras ubicaciones, reutilizando los índices creados para ellas. Para ello se utilizan los Conectores de Búsqueda Federada, que están basados en el estándar Open Search y actúan como conector con esas ubicaciones. De forma predeterminada, Search Server incorpora el conector para Live.com y lo configura para que cada vez que un usuario realiza una búsqueda, esta se haga también en Live.com. Entre los conectores que pueden descargarse de la web de Microsoft, destacan los de Google News, MSDN, TechNet, Youtube, la Enciclopedia Británica o Technorati. Estos conectores permiten proporcionar al usuario una experiencia de búsqueda lo más completa posible, de modo que le proporcione los resultados agrupados por cada uno de estos conectores, sin necesidad de que el usuario debe de realizar diferentes búsqueda. Además, la especificación para el desarrollo de nuevos conectores permite que otras empresas hayan anunciado el desarrollo de estos conectores para Search Server, entre las que podemos destacar Business Objects, EMC para el gestor documental Documentum, Cognos o Symantec. Puedes obtener un listado completo y actualizado desde http://www.microsoft.com/enterprisesearch/connectors/federated.aspx. EL hecho de que todos estos fabricantes están adoptando esta especificación, augura un prometedor futuro a la misma, y por consiguiente a Search Server, que podrá beneficiarse de estos conectores para extender su funcionalidad de un modo muy sencillo para el usuario.
Características Avanzadas
Como cualquier motor de búsqueda, Search Server nos proporciona la posibilidad de realizar búsquedas avanzadas, en las que podemos especificar filtros (además de todas las combinaciones posibles de frase exacta, que no contenga el término, etc.). De entre estas capacidades de búsqueda avanzada destacan:
- Idioma de la búsqueda, para filtrar por el idioma de los contenidos.
- Tipo de Resultado, en el que podemos filtrar el tipo de contenido sobre el que queremos delimitar la búsqueda, como por ejemplo los tipos de documentos que queremos obtener.
- Propiedades del contenido, pudiendo buscar por las propiedades de metadatos del contenido indexado.
Además de la posibilidad de realizar búsquedas avanzadas, podemos mejorar las posibilidades de los usuarios utilizando algunas de las características proporcionadas por Search Server y que enumeramos antes como imprescindibles para una aplicación de Búsqueda Empresarial, como por ejemplo:
- Ámbitos de Búsqueda. Podemos facilitar la búsqueda a los usuarios, de modo que agrupemos los orígenes de datos, permitiendo al usuario restringir la búsqueda en uno de estos grupos. La creación de estos ámbitos de búsqueda está basada en reglas que pueden ser
- Por la dirección Web del origen de datos, de modo que podamos agrupar determinados sitios en un único ámbito de búsqueda para poder realizar búsquedas únicamente en esos sitios.
- Por una propiedad de la consulta, por ejemplo, los documentos de un determinado autor. En el caso de que tengamos alguna propiedad relevante para nuestros usuarios, podemos utilizarla para definir un ámbito de búsqueda.
- Origen de Datos, para permitir la búsqueda solo en un determinado tipo de origen de datos, como Sitios de SharePoint o Recursos Compartidos.
- Palabras Clave. Podemos definir palabras clave, para las que queramos agregar un contexto dentro de las búsquedas del usuario. Así, para estas palabras clave, podemos especificar una definición, así como una fecha de caducidad para esa palabra clave. Habitualmente, estas palabras clave se utilizan para proporcionar información a los usuarios sobre términos relevantes para el negocio, permitiendo así unificar el discurso y la visión sobre estos temas. Además a estas palabras clave se le pueden asignar una o varias Mejores Coincidencias.
- Mejores Coincidencias. Las mejores coincidencias son enlaces directos que podemos agregar dentro de una palabra clave, de modo que cuando la búsqueda de un usuario coincida con una palabra clave, además de los resultados normales de la búsqueda, se le ofrezcan estas mejores coincidencias, que sabemos de antemano que pueden ser útiles para el usuario. Es un proceso laborioso, pero que nos permite reutilizar el conocimiento dentro de la organización y hacer una mejor gestión del mismo, así como guiar al usuario en cuáles son los contenidos y las definiciones que debe de tener en cuenta, evitando que haga uso de fuentes de información no confiables.
- Suscripción a los resultados de la búsqueda. Quizás una de las características más interesantes para el usuario final, reside en la posibilidad de suscribirse, bien por correo electrónico, bien a través de RSS. De ese modo, el usuario será notificado cuando los resultados de esa búsqueda se modifiquen, debido a una re-indexación, bien sea parcial o completa, del contenido, permitiéndole en todo momento obtener la información más actualizada, prácticamente en tiempo real.
Estas opciones avanzadas tienen dos objetivos. Por un lado, proporcionar a los usuarios capacidades para gestionar las búsquedas y facilitarle la reutilización de las mismas. Por otro, complementar la herramienta con capacidades de gestión de conocimiento, que proporcionan contexto a las búsquedas. En este segundo grupo, debemos de englobar las características de Palabras Clave y Mejores Coincidencias. Requieren de bastante trabajo para llegar a agregar el contenido deseado al portal para que esté disponible para los usuarios, pero una vez generado ese contenido, se convierten en dos puntales fundamentales para mejorar la usabilidad del usuario y proporcionar información de una forma coherente dentro de la organización.
Conclusiones
Con Microsoft Search Server 2008 Express, Microsoft entra de lleno en el mundo de las aplicaciones de búsqueda empresarial, con una herramienta gratuita, sin límite teórico en la cantidad y tamaño de contenidos a indexar. Además, Search Server, se construye sobre la base de Windows SharePoint Services, plataforma suficientemente probada y por tanto fiable, con una instalación muy sencilla y un interfaz de usuario, que aunque simple, proporciona todas las características deseables en un motor de búsqueda. Si a ello le sumamos la integración con el estándar Open Search, permitiendo la búsqueda en todos aquellos orígenes de datos externos que también soporten dicho estándar, estamos ante una herramienta lo suficientemente flexible como para cumplir con la mayor parte de nuestros requisitos.