IA logra hallazgos científicos que humanos no pudieron
En un estudio publicado en Nature, el 3 de julio, los investigadores del 'Laboratorio Nacional Lawrence Berkeley', Estados Unidos, utilizaron un algoritmo llamado 'Word2Vec' para analizar las conexiones que los humanos pudieran haber pasado por alto en los artículos científicos.
Su algoritmo arrojó nuevas predicciones para posibles materiales termoeléctricos, los cuales convierten el calor en energía.

"Puede leer cualquier documento sobre ciencia material, así que puede hacer conexiones que ningún científico podría hacer", dijo Anubhav Jain, uno de los investigadores.
“A veces hace lo que un investigador haría; otras veces realiza asociaciones interdisciplinarias". recalcó el investigador.
Para capacitar al algoritmo, los investigadores evaluaron el lenguaje de 3.3 millones de resúmenes científicos y terminaron con un vocabulario de aproximadamente 500,000 palabras. Después le transmitieron los resúmenes a Word2vec, quien usó el aprendizaje automático para analizar las relaciones entre las palabras.

"La forma en que funciona el algoritmo Word2vec es que capacitas a un modelo de red neuronal para eliminar cada palabra y predecir cuáles serán las siguientes palabras", dijo Jain. "Al entrenar a una red neuronal con una palabra, obtienes representaciones de palabras que realmente pueden conferir conocimiento".
Utilizando solo las palabras encontradas en los resúmenes científicos, el algoritmo fue capaz de entender conceptos como la tabla periódica y la estructura química de las moléculas.
En uno de sus experimentos, los investigadores analizaron solo los artículos publicados antes de 2009 y pudieron predecir uno de los mejores materiales termoeléctricos modernos cuatro años antes de que fuera descubierto en 2012.
"Este algoritmo no está supervisado y crea sus propias conexiones", dijo Tshitoyan, el autor del estudio. "Podría utilizarse para la investigación médica o el descubrimiento de medicamentos. La información está allá afuera. Simplemente no hemos realizado estas conexiones todavía porque no se pueden leer todos los artículos".