El desafío de los datos para la Inteligencia Artificial

El desafío de los datos para la Inteligencia Artificial

Inteligencia Artificial

Los datos son fundamentales para la inteligencia artificial (IA) y, por suerte, son omnipresentes. El tema es cómo los gestionamos. Pensemos en nuestra propia organización: ¿Podemos manejarlos? ¿Son accesibles? ¿Los tenemos unificados o por el contrario los hemos ido acumulando en múltiples silos y distintos formatos dentro de la organización? 

En este momento entra en juego la plataforma de datos y la arquitectura de datos.

La plataforma de datos

La plataforma de datos es la máquina que accede, mueve, analiza, correlaciona y valida los datos para los usuarios finales. 

Una situación muy habitual en las empresas es la implantación de soluciones puntuales que se usan para proporcionar servicios de datos en distintos departamentos. Muchas veces se trata de soluciones de tipo producto, que limitan la capacidad de escalar y no ofrecen una visión holística de la empresa. En cambio, una verdadera plataforma de datos (o plataforma big data) integra las capacidades de esas soluciones y reúne todos los datos de forma centralizada, en un solo lugar donde se pueden proteger, compartir y usar de la manera más efectiva.

Arquitectura de datos

La arquitectura de datos es el plan para ingerir, almacenar y entregar los datos. Una arquitectura de datos es esencialmente un marco para el entorno de datos de una organización. 

Una correcta arquitectura de datos sigue siendo un auténtico desafío para las empresas. Y con el volumen creciente de datos y tecnologías como 5G y el Internet de las cosas (IoT), disponer de unos principios arquitectónicos sólidos es cada vez más importante.

end to end IoT journey

Las funciones de transmisión en tiempo real, como un mecanismo de suscripción como es el caso de Sentilo en el Ayuntamiento de Barcelona, permiten suscribirse a "temas" para que puedan obtener una fuente constante de las transacciones que necesitan.

Un datalake común, normalmente, sirve como el "cerebro" para tales servicios. Más allá, existe una tendencia a recuperar un sentido de negocio o dominio que pasa por avanzar desde un datalake central, a diseños "basados ​​en dominios" que se pueden personalizar por parte de “data owners” o “product owners”. 

Con este enfoque llamado “data mesh”, si bien los conjuntos de datos aún pueden residir en la misma plataforma física, los "propietarios de productos" en cada dominio empresarial (por ejemplo, marketing, RRHH, etc.) tienen la tarea de organizar sus conjuntos de datos en un formato fácilmente consumible.

Finalmente, cabe destacar la nube como el impulsor más disruptivo de un enfoque de arquitectura de datos radicalmente nuevo, ya que ofrece a las empresas no solo una forma de escalar rápidamente, sino también una serie de servicios adicionales de un gran valor como veremos más adelante. Las plataformas de datos serverless de los cloud públicos permiten a las organizaciones crear y operar aplicaciones centradas en datos que se auto administran y con una escala infinita. Además del escalado horizontal y facilidades de despliegue que nos ofrecen las soluciones de datos en contenedores.

Más información

Si quieres seguir avanzando, te proponemos que leas 4 tipos de datos para aplicar Inteligencia Artificial y si necesitas ayuda en la adopción de Inteligencia Artificial y Machine Learning, contáctanos.

Martí Fàbrega

Martí es Consultor de Transformación Digital y Senior Manager de Desarrollo de Negocio en Opentrends. Su propósito es transformar la tecnología en valor de negocio para sus clientes, poniendo el mayor foco posible en la innovación.