Saipem

Optimizar el proceso de búsqueda documental gracias al Smart Data Hub

  • IA & Data Solutions
industry
Energy & Utilities
know how
  • AI & Machine Learning

1 Starting Point

1 Need

Saipem, empresa líder en el sector de la ingeniería avanzada y de la transición energética, tenía las siguientes necesidades:

  • Permitir la búsqueda rápida y precisa de información entre más de 100.000 documentos distribuidos en múltiples repositorios
  • Extraer insights relevantes de los documentos, valorizando el conocimiento empresarial oculto
  • Integrar la solución con sistemas cloud (SharePoint Online) y on-premise (SharePoint On-Premise y Documentum)
  • Reducir tiempos y costos asociados a la búsqueda de información, mejorando los procesos de toma de decisiones

2 Discovery

2 Direction

Dinova colaboró con Saipem para crear un Smart Data Hub, una solución avanzada para la búsqueda documental basada en tecnologías de Natural Language Processing (NLP). Este sistema permitió:

  • Realizar búsquedas por conceptos, destacando fragmentos de texto relevantes
  • Automatizar la clasificación y reclasificación de documentos
  • Sugerir automáticamente TAG y metadatos gracias a técnicas de machine learning
  • Guardar consultas recurrentes entre los favoritos para un acceso rápido
  • Gestionar grandes volúmenes de documentos multilingües, organizativos y técnicos, provenientes de fuentes heterogéneas

3 How

3 The challenge

Con más de 100.000 documentos distribuidos en múltiples repositorios, Saipem necesitaba encontrar de forma sencilla y rápida información específica y extraer de ella insights relevantes para el contexto de búsqueda, poniendo finalmente en valor el conocimiento empresarial, a menudo oculto.

Para hacerlo, era necesario crear una solución específica para mejorar la búsqueda y la difusión de la información empresarial. En este caso concreto, la solución debía implementarse sobre tecnología Microsoft Azure y ser capaz de integrarse con una pluralidad de fuentes documentales.

4 What

4 Solution by Dinova

En colaboración con Dinova, Saipem implementó un Smart Data Hub para optimizar el proceso de búsqueda documental y de información en términos de pertinencia y precisión de las respuestas. Esto permite buscar información muy específica dentro de cualquier documento, incluso en aquellos que los operadores aún no saben que tienen disponibles, aprovechando los modelos más avanzados de Natural Language Processing (NLP).

La solución diseñada es:

  • multicloud
  • multiplataforma
  • contenedorizada
  • replicable
  • escalable

 

El Smart Data Hub logra gestionar un gran volumen de documentos organizativos, de calidad y técnicos, como manuales y normativas, procedentes de numerosas fuentes y divididos en 4 tipologías en distintos idiomas. Los documentos compatibles provienen de sistemas en cloud (como SharePoint Online) o on-premise (como SharePoint On-Premise y Documentum).

Las técnicas de NLP implementadas permiten leer e interpretar el lenguaje natural gracias a modelos de aprendizaje automático. La solución es capaz así de ofrecer no solo el documento más pertinente a la búsqueda, sino también de destacar insights personalizados relacionados con el concepto buscado.

Sus principales características avanzadas son:

  • Automatización de clasificación y reclasificación
  • Búsqueda por conceptos
  • Cosine similarity
  • Sugerencia automática de TAG y metadatos
  • Snippet de texto del concepto buscado
  • Guardado de las consultas más utilizadas entre los favoritos.

 

Este proyecto se realizó siguiendo la metodología Cloud Native DevOps y se basa en servicios PaaS y IaaS. La hoja de ruta de implementación seguida puede resumirse en estos 3 pasos:

  • Realización de un PoC de 3 meses orientado a la validación del modelo
  • Implementación de la solución en 3 entornos (Dev, Test y Prod) siguiendo una lógica DevOps
  • Liberación en producción de la main release
  • Mejora continua mediante el análisis de los key user

 

El proyecto avanza mediante lanzamientos incrementales, optimizando la solución a partir de la experiencia del usuario. El siguiente paso contempla la introducción de funcionalidades de text summarization y virtual assistant.

5 Why

5 Why Dinova?

Una nueva forma de investigar y de trabajar juntos

El Smart Data Hub representa para Saipem un activo estratégico capaz de generar una mayor conciencia sobre los documentos y la información disponible en la empresa.

Esta solución permite una mayor depuración de la base de datos, la eliminación de duplicados y pone a disposición de los operadores documentos completos de cientos de páginas que se resumen en pocas líneas. Es coherente con las políticas de seguridad de Saipem y garantiza una experiencia de uso intuitiva que facilita y simplifica el trabajo de los operadores.

Gracias a la escalabilidad y a la replicabilidad de la plataforma, el sistema se adapta perfectamente a las necesidades específicas de la empresa y de las personas. La hoja de ruta del proyecto, estructurada en fases incrementales, garantiza una mejora constante de las funcionalidades ofrecidas.

Este proyecto demuestra el impacto positivo de la innovación digital en la mejora del trabajo cotidiano y en hacer que las organizaciones sean más eficientes y conscientes.

Otras historias de éxito