Esta es una lista de verificación para ayudarte a evitar el dolor de aprender de la manera más dura.

Traducido por Carlos Secada del original por Cassie Kozyrkov

Si estás a punto de embarcarte en un proyecto de Machine Learning (ML) o de Inteligencia Artificial (IA), aquí tienes una lista de verificación que debes seguir antes de sumergirte en algoritmos, datos e ingeniería. Piensa en esto como tu amigo consultor de bolsillo.

No pierdas tu tiempo en IA sólo porque está de moda. Déjate motivar por lo que hará por ti, y no por que suena a ciencia ficción.

Esta es una versión súper corta de mi monstruo de 18 minutos Guía definitiva para iniciar AI. Si estás a punto de embarcarte en ML / IA, espero que puedas responder “sí” a todas estas preguntas.

Si respondes “no” a cualquiera de las preguntas de la lista de verificación, esta podría ser una foto de tu proyecto.

Paso 1 de ML/AI en 22 partes: Resultados, Objetivos y Factibilidad

  1. Delegación correcta: ¿La persona que ejecuta tu proyecto y completa esta lista de verificación, entiende realmente tu negocio? Delega la toma de decisiones a la persona experta en tu negocio, no al nerd de los algoritmos.
  2. Conceptualización centrada en resultados: ¿Puedes explicar cuáles serán los resultados de tu sistema, y por qué vale la pena tenerlos? Enfócate primero en lo que estás haciendo, no en cómo lo estás haciendo; No confundas el fin con los medios.
  3. Fuente de inspiración: ¿Has al menos considerado la minería de datos como una opción para obtener inspiración sobre posibles casos de uso? Aunque no es obligatorio, podría ayudarte a encontrar una dirección adecuada.
  4. Tarea apropiada para ML / IA: ¿Estás automatizando muchas decisiones/etiquetas? ¿Son tareas donde no puedes saber la respuesta correcta siempre? Contestar “no” es una señal bastante fuerte de que ML/IA no es lo adecuado.
  5. Perspectiva de Experiencia de Usuario: ¿Puedes definir quiénes son tus usuarios objetivo? ¿Cómo usarán tus datos e información? Si no estás pensando en tus usuarios desde un inicio, sufrirás por culpa de un diseño de la experiencia de mala calidad.
  6. Desarrollo ético: ¿Has pensado en todos los seres humanos que tu creación podría impactar? Esto es especialmente importante para todas las tecnologías con el potencial de escalar rápidamente.
  7. Expectativas razonables: ¿Tienes claro que tu sistema podrá ser excelente, pero no será perfecto? ¿Puedes convivir con errores ocasionales? ¿Has pensado en lo que esto significa desde un punto de vista ético?
  8. Posible en producción: independientemente de la procedencia de las decisiones/etiquetas, ¿podrás implementarlas en producción? ¿Puedes obtener los recursos de ingeniería para hacerlo a la escala que estarás necesitando?
  9. Datos para aprender: ¿Existen datos de entrada (inputs) potencialmente útiles? ¿Puedes acceder a ellos? (Está bien si los datos aún no existen, siempre y cuando tengas un plan para obtenerlos pronto).
  10. Ejemplos suficientes: ¿Le has preguntado a un estadístico o ingeniero de Machine Learning si la cantidad de datos que tienes es suficiente para el aprendizaje? Suficiente no se mide en bytes, así que tómate un café con alguien que tenga experiencia y deja que te ayuden.
  11. Computadoras: ¿Tiene acceso a suficiente capacidad de procesamiento para manejar el tamaño de tu conjunto de datos? (Las tecnologías en nube hacen que esto sea un “sí” automático para cualquier persona que esté dispuesta a considerar su uso).
  12. Equipo: ¿Confías en que puedan formar un equipo con las habilidades necesarias?
  13. Precisión de datos de entrenamiento: a menos que estés buscando un aprendizaje sin supervisión, ¿tienes acceso a los resultados? Si no, ¿puedes pagar a humanos para que lo hagan por ti, realizando el trabajo una y otra vez?
  14. Registro de cordura: es posible saber qué entrada (input) va con qué resultado (output), ¿verdad?
  15. Registro de calidad: ¿Confías en que los datos son realmente lo que tus abastecedores afirman que son? (Para aprender de los ejemplos, necesitas buenos ejemplos para aprender de ellos).
  16. Curvas de indiferencia: dado que tu sistema cometerá errores, ¿has considerado cuánto peor es un tipo de error en relación con otro?
  17. Simulación: ¿Has considerado trabajar con un experto en simulación para ayudarte a visualizar lo que estás pidiendo? No es obligatorio, pero sí útil.
  18. Creación de métricas: ¿Has asociado los puntajes de los resultados individuales de tu sistema, a una métrica relacionada al rendimiento de negocio para los distintos casos?
  19. Revisión de métricas: ¿Se ha revisado la métrica del rendimiento de tu negocio para garantizar que no sea posible obtener una buena puntuación de una manera perversa y dañina ?
  20. Comparación de pérdidas de métricas: (Opcional.) ¿La métrica de rendimiento de tu negocio se correlaciona bien con una función estándar de pérdida? Si no, lo que estás pidiendo puede ser muy difícil.
  21. Población: ¿Has pensado detenidamente en qué casos necesitas que funcione tu sistema? La población estadística de interés define qué grupo de casos serán cubiertos por las pruebas de rendimiento de tu sistema.
  22. Rendimiento mínimo: ¿Has definido un estricto criterio de rendimiento mínimo para las pruebas y te has comprometido a descartar tu sistema si no supera ese mínimo?

Una vez que hayas respondido “sí” a todo eso, estarás listo para pasar al siguiente paso de ML/IA, que involucra datos y hardware (e ingenieros, ¡ye!). Estaré publicando una guía sobre eso pronto.

Si eso fue un resumen demasiado breve, la guía completa para comenzar un proyecto de IA está aquí. ¡A disfrutar!

Obtén más información sobre ciencia de datos e inteligencia artificial en español aquí.

Source: Artificial Intelligence on Medium