El análisis de datos con Machine Learning

Machine Learning o aprendizaje automatizado se llama al sistema informático capaz de aprender por sí mismo.

Pero realmente, ¿qué significa aprender por sí mismo?

Empecemos por el primero de los términos: aprender. Según la RAE, aprender es la capacidad de adquirir conocimiento o aptitudes a través del estudio, las instrucciones y la experiencia.

El estudio conlleva en gran medida la memorización de datos.
Las instrucciones son los modos o formas con los que debemos de utilizar los datos para la realización de algo.
Por último, la experiencia es el historial que hemos adquirido al utilizar los datos con diferentes instrucciones.

Para alguien experimentado en programación, no debería de parecer a simple vista muy complicado realizar una máquina que aprenda. Para ello, la receta es sencilla. Muchos datos, un listado de diferentes instrucciones de cómo manipularlos, revisar y analizar los resultados y… ¡listo! La próxima vez que deba tomar una decisión de qué hacer con unos datos, miro el historial y tomo las instrucciones que mejor resultado me hayan dado anteriormente.

¿Dónde está el problema?

El problema estriba, ahora, en el segundo término de los que estamos estudiando: por sí mismo. Esto significa que las instrucciones no tienen que venir predefinidas con anterioridad, sino que los propios algoritmos deben de ser los que se encarguen de “inventarse” esas instrucciones y de catalogar el análisis. Es decir, tenemos que ser capaces de crear “historiales” de ocasiones que nunca se hayan dado, inventarnos muchos casos posibles, pero no al azar, sino que, probabilísticamente, se puedan dar.

Bueno, todo esto suena realmente vago, difuso, muy abstracto y poco real. Por ello, pongamos un ejemplo en el que llevamos trabajando desde hace algún tiempo.

Ejemplo de Machine Learning

Imaginemos una agencia de medios (ya saben, una empresa que gestiona y compra espacios publicitarios en los distintos medios de comunicación) que necesita saber dónde colocar la publicidad de uno de sus clientes de manera efectiva. Para ello debería conocer, por un lado, lo que la marca quiere transmitir y, por otro, lo que transmite el espacio que está comprando (el banner de un artículo de prensa, un blog, un tweet… por ejemplo).

Hoy en día, somos capaces de analizar en tiempo real un conjunto inimaginable de datos (de artículos, blogs, tweets en este caso), para obtener ese “estudio” del que hablábamos antes. Somos capaces de clasificar de manera automática[1] los datos para dotarnos de esa experiencia, de manera que, si ahora tenemos que decidir si un artículo determinado es un buen lugar para insertar publicidad, podamos contrastar con los resultados obtenidos (experiencia) y determinar si nos va a dar un mejor o peor rendimiento.

Realmente, podríamos decir que, la gran diferencia de lo que hacemos de manera automática a lo que podría hacer el ser humano, radica en muchos aspectos, pero hay uno que es diferencial. Está claro que los sistemas informáticos son capaces de adquirir mucha más información y mucho más rápidamente. También es evidente que pueden procesar esa información con una eficiencia, en algunos casos, superior a la humana. Pero, sobre todo, la gran diferencia es que son capaces de captar las tendencias y los cambios de una manera más sensible.

A los seres humanos, una vez que hemos aprendido algo, nos cuesta cambiar nuestra forma de ver la realidad. A una máquina no. Por ello, para evaluar si un artículo es un buen lugar para insertar determinada publicidad, nos dejamos guiar por nuestro instinto, por la aparición de alguna palabra, del título… cuando, a lo mejor, hay otros matices escondidos que no somos capaces de evaluar, o que nuestra sociedad va cambiando tan rápidamente que no somos capaces de darnos cuenta, y una máquina sí.

Una máquina no tiene prejuicios, ni ideales. Se rige únicamente por lo que significan los datos, y estos hoy en día van cambiando muy rápidamente. Por ello, casi podríamos decir que el aprendizaje automatizado hace posible la famosa frase de Groucho Marx: “Tengo unos principios, pero si no le gustan, denme más datos que tengo otros…”[2]

_____________________________________________________________________________

[1] Cuando decimos automáticamente (unsupervised en inglés) queremos decir que realmente no se presupone nada, no se filtra ningún dato ni se busca nada en especial.

[2] La verdadera frase es “Tengo unos principios, pero si no le gustan, tengo otros…”. En este caso hemos añadido “denme más datos” haciendo alusión a la influencia de los datos en las tomas de decisiones en de las máquinas.

______________________

¿Necesitas ayuda mantener segura a tu empresa? En Mr. Houston protegemos tu negocio y tu información con nuestros servicios de ciberseguridad. Juntos, fortaleceremos tu defensa contra los ataques cibernéticos y garantizaremos la continuidad de tu negocio.

Contacta con nosotros en el correo soluciones@mrhouston.net o en el teléfono 91 432 0286

Si quieres enterarte de todo tipo de novedades y temas técnicos y más, síguenos en nuestras redes X y LinkedIn.

Un mejor análisis de datos con Machine Learning

Pero realmente, ¿qué significa aprender por sí mismo?

¿Dónde está el problema?

Ejemplo de Machine Learning

Entradas relacionadas

El universo de la IA

Suscríbete a nuestro blog y no te pierdas nada

ISO 27001

Pyme Innovadora

Bitwok: Desarrollos Ágiles

Financia

Empresa registrada en INCIBE