PC ver y escuchar

Intel y los principales fabricantes trabajan para que los PCs sean receptivos a nuestra voz, gestos o mirada. Algo que será una realidad este mismo año.

La salida en 2007 de la primera versión del iPhone marcó un antes y un después en el campo de la interacción con los dispositivos. Antes del popular teléfono de Apple, ya existían pantallas táctiles y desde hace décadas hay empresas desarrollando software de reconocimiento de voz que hace que, por ejemplo, no tengamos que teclear un texto, sino que lo podamos dictar a nuestro PC, como si de una secretaria se tratara.

Sin embargo, estas tecnologías nunca llegaron a popularizarse hasta el lanzamiento del teléfono de la manzana. En los últimos años, tanto el iPhone como el iPad han demostrado que cualquier mejora relevante en la manera en la que nos comunicamos con las máquinas es mucho más agradecida por los usuarios que el mayor avance en potencia de sus componentes.

PC ver y escuchar 2

En cualquier caso, todavía está por llegar al mundo del PC una catarsis parecida a la que vivió el teléfono con el iPhone. En primer lugar, el ordenador sigue sin ser táctil. Es verdad que Windows 8 y la aparición de los híbridos (portátil+tableta) harán que en breve los paneles sensibles al roce de los dedos se generalicen, pero en 2012 solo un 1% de los portátiles que se vendieron en España llevaban, según HP, este tipo de pantalla y este año solo llegarán a un 10%.

Pero no queda ahí la cosa. La reinvención del PC pasa por ponerle ojos y oídos. Firmas como Intel, Microsoft o HP están trabajando en sistemas para que deje de ser lo que grosso modo ha sido desde su invención a principios de los 80 (una máquina de escribir muy potente) y sea capaz de emular y superar a smartphones de última generación como el Samsung Galaxy S4, que incorpora reconocimiento de voz y responde incluso a los movimientos del ojo del propietario, que, dirigiendo la mirada arriba o abajo o apartándola, puede hacer scroll por webs o detener la reproducción de un vídeo.

 

Un PC ciego y sordo de nacimiento

«Siempre nos ocupamos de generar más capacidad de proceso y más autonomía, pero no nos planteamos demasiado para qué lo hacíamos. Ahora trabajamos para que esa capacidad dé lugar a una máquina realmente más inteligente», asegura Jorge Lang, responsable de Innovación en Intel España. El PC sigue, después de tres décadas, ciego y sordo, es decir, no responde a comandos de voz ni a las señales que le podemos hacer con nuestras manos, con los brazos o con los ojos.

Por eso, Intel trabaja para que durante este año y el que viene la revolución que trajo el iPhone al mundo de la telefonía móvil sea una realidad en el ordenador de casa. Es el perceptual computing, un término que volvió a salir en las charlas de los directivos del fabricante de procesadores en la pasada edición del CES de Las Vegas, y que ahora necesita de desarrollos para dejar de ser un eslogan y convertirse en una realidad.

En un primer momento, Intel preparará a la industria para dotar a los PCs de reconocimiento de voz. Es una tarea complicada, en la que llevan embarcados muchos años especialistas como Nuance, que colabora con Intel, y en la que ni el exitoso iPhone, con el asistente personal Siri, ha tenido mucha suerte. Esta funcionalidad será una realidad, según Lang, en algunas configuraciones de Ultrabooks provistos de los nuevos chips Haswell, que tienen que salir al mercado en los próximos meses. «Estamos trabajando para distinguir la voz del usuario del ruido de fondo a un metro o dos de distancia del aparato», reconoce.

PC ver y escuchar 3

En cualquier caso, Intel y los fabricantes de equipos quieren que el ordenador se convierta en un asistente personal en toda regla, pero no con un software que trabaje contra la Nube, como en los móviles, sino que se ejecute desde la máquina gracias a un potente procesador. Según estos planes, en un primer momento, la máquina escuchará y responderá a ciertas órdenes y comandos de voz, pero a más largo plazo deberá interactuar, comprando entradas para el cine si ha oído que su dueño quiere ver una película o mostrando la previsión meteorológica si pregunta por el tiempo.

Gonzalo Díe, director de Desarrollo y Plataformas de Microsoft Ibérica, barre para casa y dice que la unión del comando de voz y los gestos «se materializa a la perfección en Kinect», el mando pensado en principio para la Xbox y que desde 2011 está disponible para ordenadores con Windows 7 y 8. Desde los Laboratorios de HP, sin embargo, son prudentes y reconocen que los programas actuales de reconocimiento son limitados y tendrán que combinarse con los gestos.

PC ver y escuchar 4

 

Unas gafas para no ver mejor, sino mucho más

Las gafas de Google también innovan en el campo de las interfaces. El buscador lleva un tiempo empeñado en convertir al ojo en protagonista. Para el año que viene, está previsto que salgan a la venta sus gafas interactivas, aunque los desarrolladores ya tienen sus especificaciones técnicas y hay quien dice que ya han entrado en producción.

El ingenio, muy refinado en su y que costará más de 1.000 euros, lleva una diminuta pantalla aumentada por una lente (será como ver un monitor de 25") que permite ver todos los contenidos del móvil (Android, por supuesto), navegar por Internet o sacar fotos y grabar vídeos gracias a una cámara de 5 Mpíxeles. Las gafas, que también responden a la voz, van provistas de conexión WiFi y Bluetooth, e incluso de una memoria Flash de 16 Gbytes.

PC ver y escuchar 1

Capturas en 3D de cara y manos

Durante 2014, en una segunda etapa, ya podremos ver sobremesas y notebooks provistos de webcams y sensores de profundidad, que harán que las imágenes planas actuales dejen paso a capturas del rostro del usuario o de sus manos en 3D. «De esta forma, la realidad aumentada dejará de ser la cosa cutre que es en la actualidad y el rostro de la persona se podrá convertir, por ejemplo, en un password seguro de entrada al equipo. Además, el usuario podrá meter literalmente su brazo en la pantalla», explica Jorge Lang.

En consecuencia, el sistema operativo responderá también a gestos, como mover de un lado para otro la mano para pasar una página o el chasquido de los dedos para entrar en una aplicación. Fuentes de los laboratorios de HP en California aseguran que los sensores para capturar con precisión milimétrica nuestros gestos no serán exclusivos de Xbox, sino que llegarán en breve al ordenador de casa, aunque los desarrollos iniciales están dirigidos a la industria del videojuego o el diseño profesional en CAD.

No en vano, en abril, el fabricante firmó un acuerdo comercial para vender conjuntamente el sensor de Leap Motion en algunos de sus equipos y, como nos adelantaba la presidente de HP España, Helena Herrero, en el número pasado, durante el próximo año, «los Ultrabooks ya vendrán acompañados de cámaras especiales que permitirán que el usuario interactúe mediante gestos con su dispositivo».

PC ver y escuchar 5

Desde hace unos meses, Intel pone a disposición de los creadores de aplicaciones un paquete de desarrollo (o SDK), el Perceptual Computing Software Development Kit, para que empiecen a construir programas de reconocimiento de voz y gestos. En verano, Intel empezará a mover este kit entre empresas de informática de España y Europa, e incentivará la creatividad con premios. La cámara web que recogerá las imágenes en 3D tendrá alcance para determinar el volumen de los objetos situados en el metro cúbico que queda frente a la pantalla, y será tan discreta como las actuales.

Exclusivamente para desarrolladores, Intel ofrece ya una cámara de la marca Creative, por 150 dólares, que se conecta al PC a través del puerto USB. La webcam de alta definición va provista de un sensor de profundidad, así como de un sistema dual de micrófonos para facilitar el reconocimiento de voz. Cuando salga al mercado, Intel asegura que está tecnología no subirá el precio actual de los equipos, aunque previsiblemente entrará por la gama alta y luego se extenderá a las demás. Desde esta compañía también dicen que los grandes desarrollos no están en el hardware de captación de las imágenes, sino en el software que hace «la analítica de vídeo».

El reconocimiento de volúmenes permitirá hablar por videoconferencia mientras que por detrás aparece un paisaje o una presentación. También permitirá hacer login con el rostro y crear aplicaciones que permitan a una óptica que sus clientes se prueben unas gafas por Internet, o a una tienda de ropa vender una corbata con todas las garantías. Gonzalo Díe adelanta que los laboratorios de Microsoft también están trabajando para llevar la tecnología de reconocimiento en 3D a Kinect.

PC ver y escuchar 6

Uno de los proyectos más llamativos es KinÊtre, presentado el verano pasado y que permite trasladar el movimiento de un humano a un objeto inanimado, como un mueble, escaneando las extremidades de una persona y amoldándolas a las formas del objeto.

A más largo plazo, la combinación de bajo consumo y mayor capacidad de proceso podría hacer que al PC le salgan patas y acabe teniendo forma de robot doméstico o de asistente para personas incapacitadas, avanza Lang. En fin, por todo lo dicho, no estamos tan lejos de aquel parlanchín HAL 9000 de la inolvidable Odisea del Espacio, de Stanley Kubrick, aunque esperemos que la cosa, en esta ocasión, no acabe mal.

PC ver y escuchar 8

 

Movimiento y órdenes por voz

Leap Motion vende ya en EE UU por 80 dólares un sensor de reconocimiento de movimientos -del tamaño de una caja de cerillas- que se venderá de forma independiente y que también vendrá con portátiles de HP o de Asus. El sensor, que funciona por ultrasonidos y que se conecta por un cable al puerto USB del PC, es seis veces más pequeño que Kinect, pero más preciso. De todas formas, no abarca todo el cuerpo, sino las manos y los dedos.

El emprendedor vasco Xabier Uribe Etxebarría ha lanzado en el mercado estadounidense Sherpa, un asistente de voz para Android que va camino del medio millón de descargas. Este émulo de Siri en español está disponible en dos versiones (para smartphones y tabletas) y utiliza una interfaz gráfica desarrollada con HTML 5 y un algoritmo con el que atina en las respuestas. Y es que si el usuario dice que tiene hambre, le enseñará los restaurantes más cercanos y cómo llegar a ellos.

 

El futuro inmediato

La tecnología táctil es útil en dispositivos de bolsillo, pero no tiene mucho sentido para otras superficies, como la de los televisores que controlamos desde el sofá, porque nos obligaría a levantarnos a cada momento y estampar nuestras huellas grasientas en la pantalla mientras vemos una película. Además, para formatos grandes, lo táctil es prohibitivo. Según HP, un panel de 27 pulgadas es hasta cuatro veces más caro que los de 10 pulgadas habituales en las tabletas.

El telespectador cambiará la manera de interactuar con el televisor. LG vende un mando, Magic Control, que permite al usuario navegar por los menús del aparato con su voz, con gestos, pulsando el puntero o usando el scroll. El sistema ha sido mejorado recientemente para que sea capaz de reconocer órdenes con un tono normal, sin impostar la voz.

PC ver y escuchar 10

No habrá que preocuparse por encender el dispositivo que nos va a proporcionar la información. Para los expertos de los laboratorios de HP en California, serán las máquinas las que reaccionen de forma autónoma para adaptarse a las necesidades de los usuarios. Así, si entramos en casa mientras tenemos una videoconferencia por el móvil, inmediatamente esa conversación se transferirá al televisor o al PC, de tal manera que podamos seguir la charla sentados en el sofá, y sin ninguna interrupción.

Por su parte, para Gonzalo Díe, de Microsoft, el futuro consiste en que cualquier superficie se transformará en una pantalla. De esta forma, la encimera de la cocina dejará de ser una pieza de madera o mármol para convertirse en un panel digital que nos mostrará recetas o nos avisará de las próximas citas médicas.

 

 

Relacionados

Otros relacionados

Nos encanta escucharte ¿Nos dejas tu opinión?

Desconectado

Desconectado