
En los últimos años, las videoconferencias han dejado de ser una herramienta ocasional para convertirse en una parte esencial de la vida cotidiana. Actualmente, es habitual utilizarlas para reuniones de trabajo, actividades educativas e incluso consultas médicas a distancia (Fig. 1).
La inteligencia artificial (IA) es un campo que ha beneficiado a las videoconferencias, transformando la forma en que se da la comunicación a distancia e impulsando mejoras en su calidad y eficiencia. Entre estas mejoras se encuentran la traducción de voz a texto, la detección y clasificación de imágenes, así como la reducción de ruido ambiental utilizando modelos de aprendizaje profundo y redes neuronales.
Otro aporte, relacionado con el procesamiento del lenguaje natural, es la posibilidad de realizar la traducción y subtitulado de videoconferencias en tiempo real, permitiendo la comunicación entre personas de distintos países sin necesidad de hablar el mismo idioma.
Actualmente plataformas de videoconferencias como Zoom, Google Meet, Microsoft Teams, han incluido mejoras en sus servicios al utilizar algoritmos de IA, entre sus principales ventajas son: contar con un asistente virtual, crear correos electrónicos de acuerdo con parámetros establecidos, generar transcripciones, identificar puntos clave al hacer un seguimiento en tiempo real de la reunión y generar el resumen de la reunión.

En el caso de Zoom, Microsoft Teams y Google Meet se tiene adicionalmente la opción de utilizar un avatar, “Un avatar de IA es una representación digital realista de un humano, creada mediante IA generativa. Puede hablar y mostrar expresiones faciales realistas, y algunos incluso pueden simular conversaciones con humanos…”. Este avatar puede usarse para generar videos cortos para presentaciones.

La incorporación de IA en las videoconferencias no se limita únicamente al software o a la plataforma a utilizada, también está presente en el hardware necesario para realizar la reunión. Un ejemplo de ello son los dispositivos de audio como los micrófonos que permiten la reducción de ruido y las cámaras que, con la incorporación de algoritmos de visión computacional, han incorporado tecnología que permite el seguimiento automático de personas, ajustar la posición y el zoom de la cámara para localizar y encuadrar a los participantes en la sala, entre otras funciones. Entre estos dispositivos se encuentran cámaras como la Logitech Scribe y las OBSBOT TINY.
En el Instituto de Ecología, el uso de estas cámaras junto con las herramientas que ofrece zoom ha permitido mejorar la calidad de las videoconferencias entre la comunidad estudiantil, el personal académico y administrativo.
Referencias
- Russell, S. &. (2021). Deep Learning. En S. &. Russell, Artificial Intelligence: A Modern Approach (págs. 826-36). United Kingdom: Peterson.
- Nogales, A., J. Caracuel-Cayuela & A.J. García-Tejedor. 2024. Analyzing the Influence of Diverse Background Noises on Voice Transmission: A Deep Learning Approach to Noise Suppression. Applied Sciences. 14(2), 740. DOI: https://doi.org/10.3390/app14020740
- Zoom. 2025. Zoom AI Companion: Asistente con IA que ayuda a mejorar la productividad. Zoom. Recuperado de https://www.zoom.com/es/products/ai-assistant/?lang=es-ES
- Microsoft 2025. Información general sobre IA en Microsoft Teams para administradores de TI. Recuperado de https://learn.microsoft.com/es-es/microsoftteams/copilot-ai-agents-overview
- Gemini 2025. Gemini en Google Meet. Recuperado de https://workspace.google.com/intl/es-419_mx/resources/ai-for-meetings/