Cómo usar las APIs de Machine Learning de Google Cloud mediante python (parte 2)

Translation into Spanish of an interesting article by Subrahmanya Joshi, AIOps Engineer (Artificial Intelligence for IT Operations) at HPE | Google Cloud Certified Machine Learning Engineer.

google apimlpythontranslation into spanish
MACHINE TRANSLATION 28 October, 2022
MACHINE TRANSLATION
28 October, 2022

A free translation by Chema, a Spanish translatorworking at Ibidem Group

An original text written by Subrahmanya Joshi, originally published in
https://towardsdatascience.com/using-google-cloud-machine-learning-apis-programmatically-in-python-part-2-8867d272edf0

* * *

Introducción

En la parte anterior (Parte 1) del artículo, exploramos las API de Google Cloud Vision, Text to Speech y Speech to Text en python.

En esta parte del artículo, analizaremos las otras APIs de Google.

  1. API de traducción
  2. API de video intelligence
  3. API de lenguaje natural

NOTA. En Medium, los widgets de Jupyter Notebook no se ven bien en pantallas pequeñas como las de los teléfonos. Solo se ven correctamente en pantallas más grandes.

API de Machine Learning de Google Cloud

1. API de traducción

Como su propio nombre indica, esta API se utiliza principalmente para la traducción, y puede detectar el idioma del texto. Debes habilitar esta API en Google Cloud Console antes de usarla.

Aquí una lista de las funciones de esta API que he probado:

  • Traducción

Esta función permite traducir texto a cientos de idiomas. Es muy preciso, ya que los investigadores de Google han construido y entrenado el modelo con conjuntos de datos extremadamente grandes. Aquí puedes consultar una lista de todos los idiomas soportados.

Aquí tenéis un pequeño ejemplo para ver lo bien que funciona. En este caso usamos la API de traducción de Google para traducir un artículo del francés al inglés y al japonés:

  • Detección de idioma

Esta función detecta el idioma del texto que le proporcionamos. Aquí podéis ver un ejemplo:

2. API de video intelligence

La API de video intelligence se utiliza para errores comunes de procesamiento de video. Debes habilitar esta API en Google Cloud Console antes de usarla.

Aquí una lista de las funciones de esta API que he probado:

  • Detección de cambio de toma

Esta función detecta cambios de tomas en el video y te da la hora en la que empieza y acaba cada toma.

Para esta prueba, usaré un anuncio de Audi de su coche eléctrico e-tron descargado de YouTube. El resultado ocupa demasiado como para poder visualizarlo en un portátil y he tenido que ponerlo en un archivo aparte. Echa un vistazo de los resultados aquí.

  • Transcripción de voz

Esta característica transcribe el habla en los videos. No es necesario convertir manualmente un video en audio para alimentarlo en la API de voz a texto.

Usaré aquí nuevamente el video publicitario de Audi como ejemplo.

  • Detección de etiquetas

Esta característica detecta etiquetas de videos. Detecta todo lo que puede encontrar en el video y lo devuelve.

Usaremos una vez más el video publicitario de Audi para este ensayo.

  • Detección de logotipo

Detecta los logotipos populares que aparecen en un video.

Para este experimento, usamos un video publicitario de Pepsi tomado de Youtube .

  • Detección de personas

Esta función detecta personas en los videos y proporciona coordenadas para dibujar cuadros delimitadores alrededor de las personas detectadas. Da el intervalo de tiempo en el que cada persona detectada ha aparecido en el vídeo. También brinda detalles adicionales como qué tipo de tela usa cada persona detectada, de qué color es la tela, etc.

Usaré aquí de nuevo el video publicitario de Pepsi. El resultado era demasiado grande para mostrarlo en el bloc de notas y hemos tenido que plasmarlo en un archivo de texto. Echa un vistazo aquí .

  • Detección de rostro

Esta característica detecta rostros en los videos. Devuelve las coordenadas y dibuja cuadros delimitadores alrededor de cada rostro detectado, el intervalo de tiempo en el que apareció cada rostro detectado y detalles como si la persona lleva cintas en la cabeza, si sonríe o no, y mucho más. También hace anotación de caras.

También usaré el video publicitario de Pepsi para este experimento. Aquí también el output era demasiado grande y he tenido que volcarlo en un archivo de texto. Echa un vistazo aquí al resultado.

3. API de lenguaje natural

La API de lenguaje natural se utiliza para resolver algunos de los problemas comunes de NLP. Habilite esta API en Google Cloud Console antes de usarla.

Listado de características con las que he experimentado:

  • Análisis de entidades

Esta función analiza el texto de entrada en busca de entidades conocidas como nombres propios o sustantivos comunes. Aquí hay un ejemplo:

  • Análisis de los sentimientos

Esta característica detecta el sentimiento del texto de entrada. Un ejemplo:

  • Análisis de sintaxis

Esta característica analiza el texto de entrada y devuelve detalles sintácticos. Un ejemplo:

  • Clasificación de texto

Esta característica clasifica el texto de entrada en diferentes categorías conocidas. Un ejemplo:

Un ejemplo de caso de uso

Se pueden combinar varias API para resolver un problema complejo. Imagine un problema en el que necesitemos leer textos de imágenes y detectar los sentimientos de esos textos. Así es como se puede resolver este problema usando solo API:

  • Lea el texto de las imágenes usando la función de detección de texto de Vision API .
  • Compruebe si el texto está en inglés utilizando la función de detección de idioma de Translation API .
  • Si el texto no está en inglés, tradúzcalo utilizando la función de traducción de Translation API .
  • Luego obtenga la opinión del texto traducido utilizando la función de análisis de opinión de Natural Language API .

Resolvimos el problema usando una combinación de tres API diferentes. Además, tenga en cuenta que crear un sistema de aprendizaje automático personalizado para este problema sería demasiado complejo.

Notas finales

Lo mejor de estas API es que dejamos que Google se encargue de todo. Desde construir y entrenar modelos precisos hasta administrar y escalar la infraestructura de implementación. Las únicas dos cosas que nos preocupan son enviar la solicitud y manejar la respuesta.

En la mayoría de los experimentos anteriores, he usado solo un ejemplo. También es posible enviar un lote de ejemplos en una solicitud y la API devolverá los resultados de cada uno de esos ejemplos en una sola respuesta.

Los clientes de Python no son la única forma de acceder a estas API. También se puede acceder a estos a través de comandos curl. Se debe crear un archivo JSON en un formato específico, que contenga rutas a ejemplos y también especificaciones sobre qué característica/método de la API usar. Luego, esto se puede enviar a los puntos finales de la API usando el comando curl y la respuesta se mostrará en la línea de comando.

Esto concluye la lista de API de aprendizaje automático y sus características con las que he experimentado. Como hemos visto en este artículo, la mayoría de los problemas comunes de aprendizaje automático se pueden resolver utilizando estas API.

Muchas industrias ya están utilizando estas API para automatizar varias tareas manuales. Puede encontrar información sobre ellos en el sitio web oficial de Google Cloud.

Gracias

Valora este artículo