Técnicas de Inteligencia Artificial

Distinguir entre IA, ML y data mining.
Definifr IA y tareas básicas

Conceptos

La inteligencia artificial es una rama de la informática, se trata que las máquinas reproduzcan el comportamiento y forma de pensar de los humanos. Deben de aprender conceptos, de reproducir el comportamiento de los humanos.

Rama de la informática que estudia la creación de agentes computaciones (programas informáticos, que reciben estímulos externos, y en base a estos estímulos sumados al conocimiento previo almacenado en este agente, se produce un resultado o acción que maximiza el rendimiento. Para valorar este resultado se pueden tomar diversas medidas de rendimiento, que busquen maximizar esta medida de rendimiento. El conocimiento almacenado en el agente o programa informático puede ser aprendido por el mismo programa o incorporado con alguien experto en la materia.

Minería de datos: usa técnicas de IA sobre grandes volúmenes de datos. Trata de descubrir y describir patrones en los datos. Una vez que tenemos el patrón, podemos sacar los beneficios de esos datos. Estas técnicas de IA aplicadas sobre grandes cantidades de datos también se les conoce como técnicas de aprendizaje automático. De hecho este ML es parte de IA.

El aprendizaje automático (machine learning, ML) es un programa informático que incluye un conjunto de técnicas de la IA que permiten mejorar el rendimiento en una tarea determinada con la experiencia de un modo automático. Está el ML supervisado, en el que se parte de una información previa introducida, y el ML no supervisado, el cuál es capaz de identificar clases con datos en crudo.

Por lo tanto, un programa aprende con la experiencia (E) relacionada con unas tareas (T) y esto ofrece una medida de rendimiento (P). El software aprende siempre que la P mejore la T en base a la E.

Elementos del aprendizaje de un concepto

Primero las instancias (los datos). Le pasamos unos datos de entrenamiento.

  • Concepto (clase): es un conjunto de elementos que comparten un conjunto de características que pueden nombrarse específicamente.
  • Instancia: ilustraciones específicas de un objeto, símbolo, o evento.
  • Ejemplo: es una instancia miembro del concepto en consideración.
  • No-ejemplo: es una instancia no-miembro del concepto en consideración.
  • Datos de entrenamiento: es el conjunto de instancias que forman parte de la E y que se emplean para aprender la tarea.
  • Atributos: Características de las instancias.

Si empleamos el ejemplo de aprender a detectar transacciones fraudulentas con tarjetas de crédito, el concepto (o clase) sería el conjunto completo de transacciones fraudulentas, el ejemplo sería una transacción fraudulenta y el no-ejemplo sería una transacción legal. Una instancia sería una transacción, independientemente de si es legal o fraudulenta, mientras que los datos de entrenamiento sería una base de datos de las transacciones (legales o fraudulentas) que se emplea para poder detectar a las fraudulentas.

Un concepto se aprende cuando un objeto se identifica correctamente a ese concepto (o clase), lo que permite generalizar la aplicación del nombre de la clase a todos los objetos que compartan esa clase, y discrimine a los que no pertenecen. Esto permite distinguir tres elementos principales:

  • Clasificación: determinar la clase de un objeto o evento.
  • Generalización: se determina la clase de un objeto desconocido en base a las características que contiene en relación con los objetos conocidos de la muestra de entrenamiento.
  • Discriminación: es lo opuesto a generalización.

Aprendizaje de conceptos y tipos de aprendizaje

Las tareas que resuelve el aprendizaje automático:

  • Descripción de conceptos teniendo en cuenta los atributos de los ejemplos.
  • Formación de nuevos conceptos en base a ejemplos.

El aprendizaje automático puede ser de dos tipos:

  • Aprendizaje supervisado: son técnicas para la descripción de conceptos. Su intención es caracterizar un concepto a partir de instancias del mismo.
  • Aprendizaje no supervisado: son técnicas para la formación de nuevos conceptos. Su intención es caracterizar un concepto desconocido a partir de sus instancias. El clustering sería una técnica no supervisada. No existe experiencia previa.

Las etapas del aprendizaje automático:

  1. Selección de datos de entrenamiento.
  2. Selección de la función objetivo.
  3. Selección del algoritmo de aprendizaje.
  4. Evaluación y validación de los resultados.

Etapas del descubrimiento de conocimiento:

  1. Primero neceistamos los datos, bien de ficheros planos o bases de datos relacionales.
  2. Coger los datos y homogeneizarlos, y almacenarlos en un sitio común (data warehouse).
  3. Para el problema que queremos resolver, seleccionamos los datos.
  4. Adaptamos los datos para poder aplicar los diferentes procesos de IA, teniendo datos limpios y transformados.
  5. Después aplicamos la minería de datos para ver los patrones.
  6. Por último queda la interpretación y evaluación para generar el conocimiento.

Deja un comentario