Redes neuronales se han utilizado para traducir automáticamente idiomas perdidos

wordvect-001

Jiaming Luo y Regina Barzilay del MIT y Yuan Cao del laboratorio de inteligencia artificial de Google en Mountain View, California, han desarrollado un sistema de aprendizaje automático capaz de descifrar idiomas perdidos, y lo han demostrado en un manuscrito de la isla mediterránea de Creta. El manuscrito, Linear B, apareció después de 1400 aC, cuando la isla fue conquistada por los micénicos del continente griego.

La idea detrás de la traducción automática es comprender que las palabras están relacionadas entre sí de manera similar, independientemente del idioma involucrado. El proceso comienza al trazar estas relaciones para un lenguaje específico. Esto requiere enormes bases de datos de texto. Luego, una máquina busca en este texto para ver con qué frecuencia aparece cada palabra junto a otras. Este patrón de aparición es una firma única que define la palabra en un espacio de parámetros multidimensional. De hecho, la palabra puede considerarse como un vector dentro de este espacio. Y este vector actúa como una poderosa restricción sobre cómo puede aparecer la palabra en cualquier traducción.

Luo y sus colegas pusieron a prueba la técnica con dos idiomas perdidos, Linear B y Ugaritic. Los lingüistas saben que Linear B codifica una versión temprana del griego antiguo y que Ugaritic, que fue descubierto en 1929, es una forma temprana de hebreo. Dada la información y las restricciones impuestas por la evolución lingüística, la máquina de Luo y sus colegas puede traducir ambos idiomas con notable precisión. “Pudimos traducir correctamente el 67,3% de Linear B en sus equivalentes griegos”. “Por lo que sabemos, nuestro experimento es el primer intento de descifrar Linear B automáticamente”.

Es un trabajo impresionante que lleva la traducción automática a un nuevo nivel. Pero también plantea la interesante cuestión de otros idiomas perdidos, particularmente aquellos que nunca se han descifrado, como Linear A. En este documento, Linear A brilla por su ausencia. Luo y sus colegas ni siquiera lo mencionan, pero debe tener una gran importancia en su pensamiento, como lo hace para todos los lingüistas. Sin embargo, aún se necesitan importantes avances antes de que este manuscrito sea susceptible de traducción automática. Por ejemplo, nadie sabe qué idioma codifica. Los intentos de descifrarlo en griego antiguo han fracasado. Y sin el lenguaje progenitor, la nueva técnica no funciona.

 

Machine Learning Has Been Used To Automatically Translate Long-Lost Languages.

 

Anuncios

AI entrenada en viejos artículos científicos hace descubrimientos que los humanos pasaron por alto

41586_2019_1335_fig4_esm

Usando solo el lenguaje en artículos científicos antigüos, un algoritmo de aprendizaje automático fue capaz de hacer descubrimientos científicos completamente nuevos. En un estudio publicado en Nature el 3 de julio, los investigadores del Laboratorio Nacional Lawrence Berkeley utilizaron un algoritmo llamado Word2Vec para analizar artículos científicos buscando conexiones que los humanos hubieran pasado por alto. Su algoritmo arrojó predicciones para posibles materiales termoeléctricos, que convierten el calor en energía y se utilizan en muchas aplicaciones de calefacción y refrigeración. Sin embargo, el algoritmo no conocía la definición de termoeléctrico. No recibió formación en ciencia de los materiales. Usando solo asociaciones de palabras, el algoritmo pudo proporcionar candidatos para futuros materiales termoeléctricos, algunos de los cuales pueden ser mejores que los que utilizamos actualmente.

Para entrenar el algoritmo, los investigadores evaluaron el lenguaje en 3.3 millones de resúmenes relacionados con la ciencia de los materiales y terminaron con un vocabulario de aproximadamente 500,000 palabras. Alimentaron los resúmenes a Word2vec, que utiliza redes neuronales artificiales para analizar las relaciones entre las palabras. El algoritmo vinculó las palabras que se encontraron juntas, creando vectores de palabras relacionadas que ayudaron a definir conceptos. En algunos casos, las palabras estaban vinculadas a conceptos termoeléctricos, pero nunca habían sido escritas como termoeléctricas en ningún resumen considerado. Esta brecha en el conocimiento es difícil de atrapar con un ojo humano, pero es fácil de detectar para un algoritmo.

Después de mostrar su capacidad para predecir materiales futuros, los investigadores llevaron su trabajo en el tiempo, virtualmente. Desecharon datos recientes y probaron el algoritmo en documentos antiguos, viendo si podía predecir descubrimientos científicos antes de que sucedieran. Una vez más, el algoritmo funcionó. En un experimento, los investigadores analizaron solo los artículos publicados antes de 2009 y pudieron predecir uno de los mejores materiales termoeléctricos modernos cuatro años antes de que se descubriera en 2012.

Esta nueva aplicación de aprendizaje automático va más allá de la ciencia de los materiales. Debido a que no está atado a un conjunto de datos específicos, podría ser aplicado fácilmente a otras disciplinas, y volver a entrenarlo en la literatura de cualquier tema que se desee.

 

AI Trained on Old Scientific Papers Makes Discoveries Humans Missed.

 

El aprendizaje automático puede usar tweets para detectar fallas de seguridad críticas

textnews-002

Investigadores de la Universidad Estatal de Ohio, la compañía de seguridad FireEye y la firma de investigación Leidos publicaron un artículo que describe un nuevo sistema que lee millones de tweets para detectar menciones de vulnerabilidades de seguridad de software utilizando un algoritmo entrenado con aprendizaje automático, y luego evalúa qué tan grande es la amenaza que representa en función de cómo se describe. Descubrieron que Twitter no solo puede predecir la mayoría de las fallas de seguridad que aparecerán días más tarde en la base de datos de vulnerabilidad nacional, el registro oficial de vulnerabilidades de seguridad rastreadas por el Instituto Nacional de Estándares y Tecnología, sino que también podían usar procesamiento de lenguaje natural para predecir aproximadamente a cuál de esas vulnerabilidades se le otorgará una calificación de gravedad “alta” o “crítica” con una precisión superior al 80 por ciento.

Un prototipo del trabajo en progreso que pusieron en línea, por ejemplo, mostró tweets de la última semana sobre una nueva vulnerabilidad en MacOS conocida como “BuggyCow”, así como un ataque conocido como SPOILER que podría permitir a las páginas web explotar vulnerabilidades asentadas en la profundidad de los chips de Intel. Ninguno de los ataques, que el escáner de Twitter de los investigadores etiquetó como “probablemente severos”, se ha presentado aún en la Base de Datos Nacional de Vulnerabilidad. El prototipo, admiten, no es perfecto. Se actualiza solo una vez al día, incluye algunos duplicados y, no se detectaron algunas vulnerabilidades que luego aparecieron en el NVD. Pero los autores argumentan que el verdadero avance de la investigación consiste en clasificar con precisión la gravedad de las vulnerabilidades basadas en un análisis automatizado del lenguaje humano.

En su experimento, los investigadores comenzaron tomando un subconjunto de 6000 tweets que identificaron como que discutían vulnerabilidades de seguridad. Estos fueron etiquetados con clasificaciones de gravedad generadas por el humanos, filtrando los resultados de cualquier valor atípico que discrepara drásticamente con otros. Luego, los investigadores utilizaron esos tweets etiquetados como datos de entrenamiento para un motor de aprendizaje automático y probaron sus predicciones. Anticipándose cinco días a la inclusión de una vulnerabilidad en el registro nacional, pudieron predecir la severidad de las 100 vulnerabilidades más críticas, basándose en la misma clasificación de la NVD, con un 78% de precisión. Para las 50 principales, podrían predecir la gravedad con un 86% de precisión y 100% de precisión para las 10 vulnerabilidades más graves del NVD.

Ritter advierte que, a pesar de los resultados prometedores, su herramienta automatizada probablemente no debería ser utilizada como la única fuente de datos de vulnerabilidad, y que al menos un humano debe hacer clic en el tweet subyacente y su información vinculada para confirmar sus hallazgos.

Machine Learning Can Use Tweets to Spot Critical Security Flaws.

 

Interfaz de computadora traduce señales cerebrales directamente al habla

41598_2018_37359_fig1_html

Los neuroingenieros de Columbia han creado por primera vez un sistema que traduce el pensamiento en un discurso inteligible y reconocible. Al monitorear la actividad cerebral de alguien, la tecnología puede reconstruir las palabras que una persona escucha con una claridad sin precedentes. Este avance, que aprovecha el poder de los sintetizadores de voz y la inteligencia artificial, podría llevar a nuevas formas para que las computadoras se comuniquen directamente con el cerebro. También sienta las bases para ayudar a las personas que no pueden hablar, como aquellas que viven con esclerosis lateral amiotrófica (ELA) o que se están recuperando de un derrame cerebral, a recuperar su capacidad de comunicarse con el mundo exterior.

La investigación ha demostrado que cuando las personas hablan, patrones de actividad aparecen en su cerebro. Las señales también emergen cuando escuchamos a alguien hablar, o nos imaginamos escuchando. Registrar y decodificar estos patrones podría traducirse a un discurso verbal a voluntad. Pero lograr esta hazaña ha resultado ser un desafío. La decodificación de las señales cerebrales mediante modelos informáticos simples que analizan los espectrogramas no ha logrado producir nada que se parezca al habla inteligible. Este equipo, en cambio, recurrió a un vocoder, un algoritmo de computadora que puede sintetizar el habla luego de ser entrenado en grabaciones de personas que hablan.

Para enseñar al vocoder a interpretar la actividad cerebral, se asociaron con un neurocirujano que trata pacientes de epilepsia, algunos de los cuales deben someterse a cirugías regulares. “Le pedimos a los pacientes con epilepsia que ya se sometían a una cirugía cerebral que escucharan oraciones pronunciadas por diferentes personas, mientras medíamos los patrones de actividad cerebral. Estos patrones neuronales entrenaban al vocoder”.

Luego, los investigadores les pidieron a esos mismos pacientes que escuchen a los oradores recitar dígitos entre 0 y 9, mientras registraban las señales cerebrales que luego podrían ejecutarse a través del vocoder. El sonido producido por el vocoder en respuesta a esas señales fue analizado y limpiado por redes neuronales, un tipo de inteligencia artificial que imita la estructura de las neuronas en el cerebro biológico.

El resultado final fue una voz de sonido robótico que recitaba una secuencia de números. Para probar la precisión de la grabación, el equipo encargó a las personas que escucharan la grabación e informaran lo que escucharon. “Descubrimos que las personas podían entender y repetir los sonidos aproximadamente el 75% del tiempo, lo que está muy por encima y más allá de cualquier intento anterior”. La mejora en la inteligibilidad fue especialmente evidente al comparar las nuevas grabaciones con los intentos anteriores basados en espectrogramas. “El sensible vocoder y las poderosas redes neuronales representaban los sonidos que los pacientes habían escuchado originalmente con sorprendente precisión”.

 

Columbia Engineers Translate Brain Signals Directly into Speech.

 

 

La IA de IBM pierde el debate ante un humano

ibmdeb-001

El tema en debate era si el gobierno debería subsidiar la educación preescolar. Pero la pregunta real era si una máquina llamada IBM Debater podría superar a un líder humano de alto rango. La respuesta, el lunes por la noche, fue no.

Harish Natarajan, el gran finalista en los Campeonatos del Mundo de Debate 2016, pudo inclinar más a una audiencia de cientos de personas hacia su punto de vista que el IBM Debater impulsado por AI hacia el suyo. Los seres humanos, al menos aquellos equipados con títulos de las universidades de Oxford y Cambridge, aún pueden prevalecer en lo que respecta a las sutilezas del conocimiento, la persuasión y el argumento. No fue una victoria titular tan importante como la que vimos cuando las computadoras Deep Blue de IBM vencieron al mejor jugador de ajedrez humano en 1997 o el AlphaGo de Google derrotó a los mejores jugadores humanos del antiguo juego de Go en 2017. Pero IBM mostró que la inteligencia artificial aún puede ser útil en situaciones donde hay ambigüedad y debate, no solo una puntuación simple para juzgar quién ganó un juego. “Lo que realmente me llamó la atención es el valor potencial de IBM Debater cuando se [combina] con un ser humano”, dijo Natarajan después del debate. La IA de IBM fue capaz de explorar montañas de información y ofrecer un contexto útil para ese conocimiento, dijo.

IBM’s AI loses debate to a human, but it’s got worlds to conquer.

 

Aprendizaje Automático para hacer que un robot canino sea más rápido y ágil.

Un equipo de investigadores del Robotic Systems Lab en Suiza y del Intelligent Systems Lab en Alemania y los EE. UU han encontrado una manera de aplicar el aprendizaje por refuerzo a la robótica para otorgarle a tales máquinas mayores habilidades. En su artículo publicado en la revista Science Robotics, el grupo describe cómo aplicaron el aprendizaje automático a la robótica y al hacerlo le dieron más agilidad y velocidad a un robot parecido a un canino.

El aprendizaje por refuerzos funciona al establecer objetivos para un sistema y luego darle un medio para probar maneras de alcanzar esos objetivos, mejorando continuamente a medida que se alcanzan los puntos de referencia. Las pruebas se realizan una y otra vez, a veces miles de veces. Tales pruebas son difíciles con un robot tanto por los muchos factores involucrados (como todos los atributos involucrados en mantener el equilibrio) y por la enorme inversión de tiempo. Después de encontrar una manera de abordar el primer problema, los investigadores encontraron una forma de solucionar el segundo problema. En lugar de tener a ANYmal (un robot parecido a un perro) luchando a través de su régimen de aprendizaje en el mundo real, los investigadores crearon una versión virtual del robot que podía ejecutarse en una simple computadora de escritorio.

Los investigadores señalan que permitir que el robot aprendiera mientras estaba en su encarnación virtual era aproximadamente 1000 veces más rápido de lo que habría sido en el mundo real. Dejaron que el perro virtual se entrenara por hasta 11 horas y luego descargaron los resultados al robot físico. Las pruebas mostraron que el enfoque funcionó muy bien. La nueva y mejorada versión de ANYmal era más ágil (capaz de evitar que un humano lo pateara y podía enderezarse si se caía) y corría aproximadamente un 25 por ciento más rápido.

ANYmal lleva baterías para más de 2 horas de autonomía y diferentes equipos sensoriales, como cámaras ópticas y térmicas, micrófonos, sensores de detección de gases e iluminación activa. Con esta carga útil, la máquina pesa menos de 30 kg y, por lo tanto, puede ser transportada y desplegada fácilmente por un solo operador.

 

Using a machine learning technique to make a canine-like robot more agile and faster.

 

El ejército quiere enseñarle a las IA algo de sentido común

Las empresas tecnológicas están ocupadas comercializando técnicas de aprendizaje automático que son poderosas pero fundamentalmente limitadas. El aprendizaje profundo, por ejemplo, hace posible reconocer palabras en el habla u objetos en imágenes, a menudo con una precisión increíble. Pero el enfoque generalmente se basa en la alimentación de grandes cantidades de datos etiquetados (una señal de audio o los píxeles de una imagen) en una gran red neuronal. El sistema puede aprender a elegir patrones importantes, pero puede cometer errores fácilmente porque no tiene un concepto del mundo más amplio.

El nuevo programa Machine Common Sense (MCS) de DARPA llevará a cabo una competencia que pide a los algoritmos de AI que le den sentido a preguntas como esta:

Un estudiante pone dos plantas idénticas en el mismo tipo y cantidad de suelo. Les da la misma cantidad de agua. Una de estas plantas está cerca de una ventana y la otra en una habitación oscura. La planta cerca de la ventana producirá más (A) oxígeno, (B) dióxido de carbono, (C) agua.

Un programa de computadora necesita cierta comprensión de la forma en que funciona la fotosíntesis para abordar la cuestión. Simplemente alimentar a una máquina con un montón de preguntas anteriores no resolverá el problema de manera confiable.

Estas pruebas se centrarán en el lenguaje porque puede hacer que las máquinas se confundan fácilmente, y porque hace que las pruebas sean relativamente sencillas. Las preguntas ofrecen una manera de medir el progreso hacia la comprensión del sentido común, lo que será crucial.

Sin embargo, está lejos de ser obvio cómo resolver el problema del sentido común. Los intentos anteriores para ayudar a las máquinas a comprender el mundo se han centrado en construir grandes bases de datos de conocimiento a mano. Esta es una tarea difícil de manejar y esencialmente interminable. El esfuerzo más famoso de este tipo es Cyc, un proyecto que ha estado en marcha durante décadas.

El problema puede resultar enormemente importante. La falta de sentido común, después de todo, es desastrosa en ciertas situaciones críticas, y en última instancia podría restringir a la inteligencia artificial. DARPA tiene un historial de inversión en investigación fundamental de IA. Los proyectos anteriores ayudaron a generar los autos automáticos de hoy, así como el asistente personal más famoso operado por voz, Siri.

“La ausencia de sentido común impide que un sistema inteligente comprenda su mundo, se comunique de forma natural con las personas, se comporte razonablemente en situaciones imprevistas y aprenda de nuevas experiencias”, dijo Dave Gunning, gerente de programas de DARPA, en un comunicado emitido esta mañana. “Esta ausencia es quizás la barrera más importante entre las aplicaciones de inteligencia artificial estrechamente enfocadas que tenemos hoy y las aplicaciones de inteligencia artificial más generales que nos gustaría crear en el futuro”.

 

> The US military wants to teach AI some basic common sense.