Atributos para la retroalimentación del clasificador

Translation into Spanish of an interesting article by Devi Parikh Associate Professor @Georgia Tech. Research Director @Meta AI. Co-founded Caliper. Generative artist stateoftheheart.ai.

machine learningsortertranslation into spanish
20 June, 2022 New interactive learning paradigm.
20 June, 2022 New interactive learning paradigm.

A free translation by Chema, a Spain-based translator specializing in English to Spanish translations.

An original text written by Devi Parikh, originally published in
https://faculty.cc.gatech.edu/~parikh/attribute_feedback/

* * *

Autores

Arijit Biswas
Amar Parkash
Devi Parij

Resumen

El aprendizaje activo nos da herramientas útiles que permiten reducir los costes de anotación sin que disminuya el rendimiento del clasificador. Sin embargo, la máquina ve al supervisor simplemente como una etiquetadora. Proponemos un nuevo modelo de aprendizaje interactivo que permita al supervisor plasmar conocimientos útiles en el tema, utilizando una serie de atributos. Primero, la máquina transmite lo que ve en la imagen que ha escogido, de forma activa; dice, por ejemplo: “Creo que esto es un bosque, ¿tú qué crees?”. Si la máquina está equivocada, el supervisor le da una explicación: “No, es un espacio demasiado abierto para ser un bosque”. Al tener acceso a un conjunto ya retroalimentado de predictores de atributos similares, la máquina recupera todas las imágenes sin etiquetar donde aparezcan espacios verdes abiertos, y las usa como ejemplos erróneos de bosques, para actualizar el clasificador. Este tipo de proceso le va a dar a la máquina mejor rendimiento para, más adelante, poder clasificar correctamente.

Vamos a proponer tres mejoras para este framework básico. En primer lugar, introducir un esquema de ponderación que, en vez de tomar una decisión difícil, de razones por las cuales el ejemplo puede ser erróneo. A continuación, eliminar los atributos alimentados previamente y, en su lugar, hacer que vaya recopilando información de dichos atributos sobre la marcha, para que no haya una sobrecarga ni se restrinjan tantos atributos predeterminados. Finalmente, proponer un framework de aprendizaje activo que tenga en cuenta no solo las etiquetas, sino también los comentarios que se han hecho sobre ​​estos atributos al seleccionar la imagen inicial. De esta manera, logramos una mejora significativa en la precisión de la detección de caras y zapatos, por ejemplo. También nos permite recopilar y poner a disposición un conjunto más grande de atributos que llegue a contener hasta 29 características de rostros de 60 categorías.

Documentos

Amar Parkash, Devi Parikh.
“Atributos para la retroalimentación del clasificador”.
En European Conference on Computer Vision (ECCV), 2012 (Oral).
PDF bibtex

Arijit Biswas, Devi Parikh.
“Aprendizaje activo simultáneo de clasificadores y atributos a través de feedback”.
En IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2013.
PDF bibtex

Presentaciones

ECCV 2012, presentación oral:
Diapositivas Charla (video)

CVPR 2013, presentación de un póster:
Póster

Conjunto de datos

Hemos recopilado un conjunto de datos de atributos relativos para 60 tipos de rostro, y 29 atributos (subconjunto de PubFig) utilizando Amazon Mechanical Turk. Para cada par de categorías, mostramos unas imágenes de ejemplo a 10 usuarios en Amazon Mechanical Turk y les preguntamos en qué categoría tenían más presencia cada uno de los atributos. Después retroalimentamos unos predictores de atributos similares para estas 29 imágenes. El conjunto de datos, incluidas las anotaciones, los predictores de atributos retroalimentados y los resultados de los predictores en 1.800 imágenes, se puede descargar aquí: Conjunto de datos de rasgos faciales similares.

Si utilizas este conjunto de datos, por favor cita a: bibtex

Demo

Presentamos este trabajo en CVPR 2013. Se puede encontrar aquí.

Comentarios y preguntas a Arijit Biswas

.

Valora este artículo