Definición de inteligencia de datos: inteligencia sobre datos, no de datos
IDC ha estado utilizando la frase «software de inteligencia de datos» para describir una categoría de capacidades que brindan inteligencia sobre datos, y el término «inteligencia de datos» se ha generalizado en la industria. Pero no todas las definiciones de inteligencia de datos son iguales. Echemos un vistazo más de cerca a cómo IDC define el término y algunas permutaciones que han surgido.
La definición de IDC de inteligencia de datos es:
“La inteligencia de datos aprovecha los metadatos comerciales, técnicos, relacionales y operativos para proporcionar transparencia de los perfiles de datos, clasificación, calidad, ubicación, linaje y contexto; Permitir a las personas, los procesos y la tecnología con datos confiables y confiables «.
La inteligencia de datos es inteligencia sobre los datos, según lo informado por los metadatos. La inteligencia de datos no es inteligencia informada por los datos. Como se define en varias publicaciones de IDC, la inteligencia de datos ayuda a las organizaciones a responder seis preguntas fundamentales:
- ¿Quién está utilizando qué datos?
- ¿Dónde están los datos y de dónde provienen (linaje y procedencia)?
- ¿Cuándo se accede a los datos y cuándo se actualizaron por última vez ?
- ¿Por qué tenemos datos? ¿Por qué necesitamos mantener (o descartar) datos?
- ¿Cómo se usan los datos, o quizás más específicamente, cómo se deben usar los datos?
- Relaciones: ¿qué relaciones son inherentes a los datos y a los consumidores de datos?
Me encontré por primera vez con esta idea de inteligencia de datos en 2016 cuando formé parte de un seminario web con ASG Technologies, que había comenzado a usar el término «Inteligencia de datos empresariales» para referirse al conjunto de productos que tenían para capturar y administrar el linaje de datos dentro de una organización. Simplemente comenzamos a llamarlo «inteligencia de datos», porque lo que podemos aprender de los metadatos se aplica en todos los niveles de la empresa, también es más corto en 10 caracteres, lo cual es importante para aquellos de nosotros que hablamos en hashtags y tweets.
La gobernanza de datos está habilitada por el software de inteligencia de datos
A medida que recibí más y más consultas sobre dónde comprar una solución de gobierno de datos, tuve que decirles a los clientes que el gobierno de datos es una disciplina organizacional con múltiples dimensiones de personas, procesos, políticas y respaldados por la tecnología. El software de inteligencia de datos es parte de la tecnología requerida para habilitar y soportar las disciplinas de gobierno de datos
La inteligencia de datos informa al gobierno de datos para que se puedan reducir los riesgos de seguridad y cumplimiento, pero la inteligencia de datos también está agregando valor a las organizaciones al permitir el análisis de autoservicio de datos y el soporte de decisiones, siendo parte de la mejora de la alfabetización de datos, la gestión de la calidad de los datos y proporcionando contexto para aprendizaje automático (ML) e inteligencia artificial (IA) para ayudar a evitar situaciones de entrada y salida de basura.
La inteligencia de datos también está comenzando a ayudar a las organizaciones a comprender cómo trabajan con los datos, y promete mejorar la eficiencia de la organización. En 2019, una encuesta de trabajadores de datos identificó que ahora pasamos el 90% de nuestro tiempo buscando, preparando y protegiendo datos, mientras que solo el 10% de nuestro tiempo lo dedicamos al análisis de datos.
El software de inteligencia de datos tal como lo define IDC incluye la definición de datos, la creación de perfiles y la administración; inteligencia de datos maestros (dónde están los sistemas de registro, referencia y entrada, y cuáles son las reglas de coincidencia y supervivencia); catalogación de datos; y funcionalidad de linaje de datos. Dentro de la taxonomía del mercado de software de IDC , estamos contando el software de inteligencia de datos dentro del mercado de integración de datos y software de inteligencia, y como tal se centra principalmente en la inteligencia sobre datos estructurados y semiestructurados. La inteligencia de datos también podría incluir metadatos sobre datos no estructurados, que cuando se combinan con metadatos sobre datos estructurados, brindan nuevas oportunidades de integración, análisis y conocimiento.
Definiciones de inteligencia de datos en el mercado
La inteligencia de datos ahora se ha popularizado en el mercado. Los compradores de tecnología han respondido positivamente porque comprenden mejor qué son los metadatos, cómo pueden agregar valor y reducir el riesgo. Muchos proveedores de software con capacidades de inteligencia de datos se han aferrado al término, incluyendo:
- Alation
- Tecnologías ASG
- Collibra (anteriormente la compañía de gobernanza de datos, ahora se hace llamar «la compañía de inteligencia de datos»)
- erwin, Inc.
- Experian
- Infogix
- Informatica
- Qlik
- Reltio
- Talend
- Software unifi
Esta no es una lista exhaustiva, pero demuestra el impulso de la inteligencia de datos ya que muchos de estos proveedores se encuentran dentro de los 20 principales proveedores de integración de datos y mercados analíticos.
En cada familia o círculo de amigos, hay uno o dos que deben ser diferentes. Este es el caso en las definiciones de inteligencia de datos que han surgido de SAP y Teradata: donde la inteligencia de datos se trata de los metadatos, pero está orientada hacia los resultados de la ciencia de datos y el aprendizaje automático. En el caso de SAP, se trata de construir tuberías en SAP Data Hub conectadas a un banco de trabajo de ciencia de datos, y operacionalizar algoritmos de aprendizaje automático con datos confiables en contexto y con confianza.
En el caso de Teradata, se trata de aplicar la ciencia de datos y el aprendizaje automático a los datos en el almacén de datos de la empresa, sin necesidad de llevarlos a un lago de datos o caja de arena. En ambos casos, la inteligencia de datos parece estar más relacionada con la inteligencia de los datos, no con la inteligencia de los datos. Todos tienen la libertad de tomar sus propias decisiones y definiciones: ¿SAP y Teradata han ampliado la definición, tal vez para agregar más valor a la ecuación, o tal vez estaban buscando una etiqueta hash más corta para el aprendizaje automático y la inteligencia artificial?
Recientemente presenté mis perspectivas sobre la inteligencia de datos en el 13 ° simposio anual MITCDOIQ en los Institutos Tecnológicos de Massachusetts en Cambridge MA, «Evolución de la inteligencia de datos para el desempeño organizacional». y prácticas de habilitación, métodos, tecnologías y construcciones organizacionales.
Además de recibir comentarios positivos de los asistentes sobre mi definición y perspectivas sobre la inteligencia de datos, las mismas perspectivas se hicieron eco en las sesiones principales impartidas por los directores de datos de las industrias de servicios de salud, sector público, defensa y servicios financieros. A menos que se mantenga una definición ampliada de inteligencia de datos en el mercado, IDC continuará aferrándose a nuestra definición porque nos proporciona una taxonomía mediante la cual podemos dimensionar y pronosticar este mercado de software. Nuestra definición ha sido adoptada por los mercados financieros tanto en el lado de venta como en el de compra, y proporciona una piedra angular en el futuro de los programas de investigación de inteligencia en los que IDC se centrará en nuestro propio futuro.
Traducción del artículo original de IDC
https://blogs.idc.com/2019/11/25/defining-data-intelligence-intelligence-about-data-not-from-data/
Nov 25,2019 / por Stewart Bond