El contexto lo es todo: Mapeo de datos entre dominios para la realidad aumentada

La IA está en pleno apogeo, aunque aún no se ha allanado el camino en cuanto a cómo puede aprovecharse para experiencias inmersivas. La IA no es la solución a todos los problemas, pero proporciona el eslabón que falta para crear experiencias aumentadas de nueva generación.
Teniendo en cuenta este auge de la IA, me gustaría hablar del concepto de "contexto" en relación con la creación de experiencias de realidad aumentada (RA). Un contexto es una colección de parámetros que describen un dominio y que pueden codificarse en datos procesables por una máquina. Un dominio puede ser literalmente cualquier cosa, pero en el espacio de la RA existen tres dominios críticos: físico, virtual y humano.
El ámbito físico es el mundo en el que vivimos. El contexto de una ubicación concreta puede incluir coordenadas mundiales (es decir, una posición geográfica), datos de escaneado del entorno, posiciones de objetos, condiciones meteorológicas o imágenes del entorno: cualquier parámetro del mundo real que sea relevante para apoyar la generación de una solución a una necesidad concreta.
El dominio virtual contiene cualquier dato que tenga una correlación útil con una ubicación en el mundo real. Es una definición amplia, pero esa es la idea: Las experiencias de RA no necesitan activos o modelos 3D complejos para aportar valor. Cualquier tipo de metadato de localización puede servir de base para una experiencia, por ejemplo, los datos pluviométricos o la ubicación de las existencias en una tienda.
Por último, el dominio humano es el conjunto de requisitos humanos, expresados en términos comprensibles para una máquina. Este es el punto de partida de la IA, donde el procesamiento del lenguaje natural (PLN) y los modelos de transformadores generativos preentrenados (GPT) desempeñan un papel clave para convertir el contexto humano en lenguaje de máquina. El ámbito humano también abarca cómo se comunican los datos generados por las máquinas.
Generar un contexto de dominio es una tarea relativamente sencilla. Lo difícil es garantizar que las relaciones entre los componentes sean utilizables: los sistemas de coordenadas físicos y virtuales deben estar alineados, los gemelos digitales deben estar actualizados con el mundo físico, las descripciones humanas deben poder asignarse a comportamientos entrenables, etc.
Tanto el software como el hardware relacionados con las tecnologías emergentes, incluidas la IA, la robótica y la Internet de los objetos, evolucionan rápidamente. Mientras no existan normas (de interoperabilidad, por ejemplo) y mejores prácticas que regulen su aplicación, el uso eficaz y la compatibilidad dependen del hábil diseño de los componentes en red. Pero una vez diseñado este sistema, se dispone de la base generalizada para crear experiencias de realidad aumentada para cualquier aplicación, ya sea la industria, el comercio minorista o la mejora general de la productividad.
Un ejemplo de cómo la IA hace posible el mapeo entre dominios sería el de una persona que señala un objeto en la distancia. Se trata de un contexto físico que muchas tecnologías pueden proporcionar, pero el gesto en sí mismo no tiene un significado intrínseco y no basta para definir el problema que hay que resolver. Puede referirse a una dirección de desplazamiento o a una pregunta sobre un objeto. El contexto, cuando se correlaciona con un lenguaje como "¿Cómo llegar?", forma ahora una consulta completa. Así, la IA puede procesar los datos físicos guiada por los datos contextuales humanos para "entender" las interacciones naturales que todos realizamos a diario sin pensar en ellas y generar una respuesta adecuada. Esa transparencia de solicitud/respuesta está elevando todas las formas de experiencia de RA, con el objetivo último de hacernos la vida más fácil.
Veamos algunos ejemplos de cómo definir el contexto para distintas aplicaciones. El papel principal de la IA es en el ámbito humano, procesando las peticiones de los usuarios, anticipándose a sus necesidades, recurriendo a los datos pertinentes y facilitando la comunicación entre personas y dispositivos.
Pintura de habitaciones: Un usuario quiere pintar un espacio y le gustaría saber la cantidad de materiales que necesita. Específicos: Tienen un dispositivo que puede medir el espacio y emitir una orden de voz preguntando cuánta pintura se necesita.
- Físico: Escaneado Lidar del espacio físico
- Virtual: Gemelo digital del espacio creado sobre la marcha a partir de un escaneado físico que incluye ventanas, puertas y paredes para determinar con precisión la superficie de las paredes.
- Humanos: La correlación entre los metros cuadrados y la superficie que puede cubrir un bote de pintura
Rutas de fitness: Un usuario solicita una variación del recorrido habitual. Específicos: El usuario dispone de unos auriculares que son capaces de determinar su ubicación, tienen un registro de rutas anteriores y pueden proyectar información visual.
- Físico: Localización del usuario y grabaciones de recorridos anteriores
- Virtual: Mapas de la zona con información sobre senderos y aceras
- Humanos: Comprensión de lo que constituye una ruta para permitir el cálculo de una nueva
Optimización del aeropuerto: Conocimiento de la situación y automatización para mejorar la gestión de las operaciones. Un usuario necesita indicaciones justo a tiempo para llevar a cabo actividades en el aeródromo de forma segura. Específicos: El usuario dispone de un wearable de muñeca que puede determinar su ubicación y tiene una conexión de datos con un gemelo digital operativo central.
- Físico: Localización de usuarios, aeronaves, activos y objetos del mundo físico
- Virtual: Gemelo digital de aeropuerto que permite la predicción de simulaciones, navegación, localización de puntos de interés y procesamiento geoespacial.
- Humanos: Comprensión de la misión, los retos y los objetivos clave de seguridad
Como puede verse en estos ejemplos, el valor del 3D en tiempo real va mucho más allá de la generación de impresionantes efectos visuales. Es el motor central para procesar contextos entre dominios con el fin de generar soluciones espaciales a los problemas. Dado que vivimos en un mundo 3D, no es de extrañar que el 3D en tiempo real desempeñe un papel central.
Unity, como motor de datos central, tiene una enorme tracción en el mercado de los juegos, por lo que a menudo se pasa por alto su aplicabilidad a casos de uso ajenos a los juegos. A medida que los wearables, los dispositivos y los modelos de IA avancen tecnológicamente, capturando más y mejores datos, se definirán contextos cada vez más ricos, generando soluciones más precisas. Unity será la principal herramienta de recopilación de estos datos para crear las experiencias que mejoren nuestras vidas en el trabajo y el ocio.
Estamos entusiasmados con lo que crearán nuestros desarrolladores y esperamos que esta entrada del blog les haya proporcionado algunas ideas sobre cómo estructurar sus experiencias de próxima generación.
Para más inspiración sobre cómo la IA puede impulsar experiencias inmersivas, echa un vistazo al potencial de los gemelos digitales. Y no olvides inscribirte en el programa beta de Unity AI.
