Machine Learning o aprendizaje automatizado se llama al sistema informático capaz de aprender por sí mismo.

Pero realmente, ¿qué significa aprender por sí mismo?

Empecemos por el primero de los términos: aprender. Según la RAE, aprender es la capacidad de adquirir conocimiento o aptitudes a través del estudio, las instrucciones y la experiencia.

  • El estudio conlleva en gran medida la memorización de datos.
  • Las instrucciones son los modos o formas con los que debemos de utilizar los datos para la realización de algo.
  • Por último, la experiencia es el historial que hemos adquirido al utilizar los datos con diferentes instrucciones.

Para alguien experimentado en programación, no debería de parecer a simple vista muy complicado realizar una máquina que aprenda. Para ello, la receta es sencilla. Muchos datos, un listado de diferentes instrucciones de cómo manipularlos, revisar y analizar los resultados y… ¡listo! La próxima vez que deba tomar una decisión de qué hacer con unos datos, miro el historial y tomo las instrucciones que mejor resultado me hayan dado anteriormente.

El problema estriba, ahora, en el segundo término de los que estamos estudiando: por sí mismo. Esto significa que las instrucciones no tienen que venir predefinidas con anterioridad, sino que los propios algoritmos deben de ser los que se encarguen de “inventarse” esas instrucciones y de catalogar el análisis. Es decir, tenemos que ser capaces de crear “historiales” de ocasiones que nunca se hayan dado, inventarnos muchos casos posibles, pero no al azar, sino que, probabilísticamente, se puedan dar.

Bueno, todo esto suena realmente vago, difuso, muy abstracto y poco real. Por ello, pongamos un ejemplo en el que llevamos trabajando desde hace algún tiempo.

Ejemplo de Machine Learning

Imaginemos una agencia de medios (ya saben, una empresa que gestiona y compra espacios publicitarios en los distintos medios de comunicación) que necesita saber dónde colocar la publicidad de uno de sus clientes de manera efectiva. Para ello debería conocer, por un lado, lo que la marca quiere transmitir y, por otro, lo que transmite el espacio que está comprando (el banner de un artículo de prensa, un blog, un tweet… por ejemplo).

Hoy en día, somos capaces de analizar en tiempo real un conjunto inimaginable de datos (de artículos, blogs, tweets en este caso), para obtener ese “estudio” del que hablábamos antes. Somos capaces de clasificar de manera automática[1] los datos para dotarnos de esa experiencia, de manera que, si ahora tenemos que decidir si un artículo determinado es un buen lugar para insertar publicidad, podamos contrastar con los resultados obtenidos (experiencia) y determinar si nos va a dar un mejor o peor rendimiento.

Realmente, podríamos decir que, la gran diferencia de lo que hacemos de manera automática a lo que podría hacer el ser humano, radica en muchos aspectos, pero hay uno que es diferencial. Está claro que los sistemas informáticos son capaces de adquirir mucha más información y mucho más rápidamente. También es evidente que pueden procesar esa información con una eficiencia, en algunos casos, superior a la humana. Pero, sobre todo, la gran diferencia es que son capaces de captar las tendencias y los cambios de una manera más sensible.

A los seres humanos, una vez que hemos aprendido algo, nos cuesta cambiar nuestra forma de ver la realidad. A una máquina no. Por ello, para evaluar si un artículo es un buen lugar para insertar determinada publicidad, nos dejamos guiar por nuestro instinto, por la aparición de alguna palabra, del título… cuando, a lo mejor, hay otros matices escondidos que no somos capaces de evaluar, o que nuestra sociedad va cambiando tan rápidamente que no somos capaces de darnos cuenta, y una máquina sí.

Una máquina no tiene prejuicios, ni ideales. Se rige únicamente por lo que significan los datos, y estos hoy en día van cambiando muy rápidamente. Por ello, casi podríamos decir que el aprendizaje automatizado hace posible la famosa frase de Groucho Marx: “Tengo unos principios, pero si no le gustan, denme más datos que tengo otros…”[2]

_____________________________________________________________________________

[1] Cuando decimos automáticamente (unsupervised en inglés) queremos decir que realmente no se presupone nada, no se filtra ningún dato ni se busca nada en especial.

[2] La verdadera frase es “Tengo unos principios, pero si no le gustan, tengo otros…”. En este caso hemos añadido “denme más datos” haciendo alusión a la influencia de los datos en las tomas de decisiones en de las máquinas.

About Nicolás Franco

Socio fundador y Director de Desarrollo en mrHouston y Bitwok.

Más información en su Linkedin.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies