El próximo gran avance en IA estará en torno al lenguaje

La década de 2020 traerá importantes avances en las tareas de IA basadas en lenguaje.
El próximo gran avance en IA estará en torno al lenguaje
El próximo gran avance en IA estará en torno al lenguaje

GPT-3, una herramienta de procesamiento de lenguaje natural de última generación desarrollada por OpenAI, pronto será capaz de producir cuentos, canciones, comunicados de prensa, manuales técnicos, textos al estilo de escritores particulares e incluso códigos informáticos. Los servicios de inteligencia artificial en la nube permitirán el desarrollo de una nueva clase de aplicaciones empresariales que sean más creativas (o «generativas», la «G» en GPT) que cualquier otra cosa que hayamos visto antes. Ellos harán que el proceso de sintetizar palabras, intenciones e información en el lenguaje sea más barato, lo que hará que muchas actividades empresariales sean más eficientes, estimulando el crecimiento y la innovación. A la luz de estos cambios venideros, las empresas no solo necesitarán repensar los recursos de IT, sino también los recursos humanos. Pueden comenzar analizando los paquetes de tareas en los roles actuales, descubriendo tareas específicas que la IA puede aumentar y desatando tanto a los trabajadores técnicos como a los no técnicos para innovar más rápidamente. El momento de prepararse es ahora.


La mayoría de las empresas reconocen que la adopción agresiva de tecnologías digitales es cada vez más crítica para ser competitiva. Nuestro investigación muestra que el 10% de los primeros en adoptar tecnologías digitales ha crecido al doble de la tasa del 25% inferior, y que están utilizando sistemas en la nube, no sistemas heredados, para permitir la adopción, tendencia que esperamos acelerar entre los líderes de la industria en los próximos cinco años. Muchas empresas atrasadas y intermedias, en comparación, están subestimando drásticamente los recursos en la nube que necesitarán para acceder, alimentar o entrenar a una nueva generación de aplicaciones inteligentes presagiadas por avances como GPT-3, una herramienta de procesamiento de lenguaje natural (PNL) de última generación.

Los grandes avances en la IA serán sobre el lenguaje.

La década de 2010 produjo avances en tecnologías habilitadas para la visión, desde búsquedas precisas de imágenes en la web hasta sistemas de visión por computadora para análisis de imágenes médicas o para detectar piezas defectuosas en la fabricación y el montaje, como describimos extensamente en nuestro libro e investigación. GPT3, desarrollado por OpenAI, indica que la década de 2020 se tratará de grandes avances en idioma Tareas de IA. Los modelos anteriores de procesamiento del lenguaje utilizaban reglas codificadas a mano (para sintaxis y análisis), técnicas estadísticas y, cada vez más en la última década, redes neuronales artificiales, para realizar el procesamiento del lenguaje. Las redes neuronales artificiales pueden aprender de los datos sin procesar, lo que requiere mucho menos etiquetado de datos rutinarios o ingeniería de características. Los GPT (transformadores generativos preentrenados) van mucho más profundamente, confiando en un transformador, un mecanismo de atención que aprende las relaciones contextuales entre palabras en un texto. Investigadores que tuvieron acceso a GPT-3 a través de una beta privada fueron capaces de inducirlo a producir cuentos cortos, canciones, comunicados de prensa, manuales técnicos, texto al estilo de escritores particulares, pestañas de guitarra e incluso código informático.

GPT-3 está lejos de ser perfecto. Sus numerosos defectos incluyen a veces producir tonterías o respuestas parciales, responder incorrectamente preguntas triviales y generar contenido plausible pero falso. Incluso uno de los líderes de OpenAI advirtió contra el exceso de exageración GPT-3. Todo esto sugiere que queda mucho trabajo por hacer, pero la escritura, por así decirlo, está en la pared: una nueva etapa de la IA está sobre nosotros.

GPT-3 es sólo uno de los muchos transformadores avanzados que están emergiendo. Microsoft, Google, Alibaba y Facebook están trabajando en sus propias versiones. Estas herramientas están entrenadas en la nube y sólo son accesibles a través de una interfaz de programación de aplicaciones (API) en la nube. Las empresas que desean aprovechar el poder de la IA de próxima generación cambiarán sus cargas de trabajo de computación de servicios heredados a servicios de IA en la nube como GPT-3.

Las aplicaciones de última generación permitirán la innovación en toda la empresa.

Estos servicios de Cloud-AI permitirán el desarrollo de una nueva clase de aplicaciones empresariales que sean más creativas (o «generativas», la «G» en GPT) que cualquier otra cosa que hayamos visto antes. Harán más barato el proceso de sintetizar palabras, intenciones e información en lenguaje, lo que hará que muchas actividades empresariales sean más eficientes y estimulará la innovación y el crecimiento que vemos con los primeros adoptantes.

Nuestro análisis de más de 50 pruebas de concepto (demostraciones) relevantes para el negocio de GTP-3 indica que las aplicaciones empresariales de vanguardia del futuro caerán en al menos tres grandes categorías creativas, todas vinculadas a la comprensión del lenguaje: escritura, codificación, y razonamiento específico de la disciplina.

La capacidad de GPT-3 para escribir texto significativo basado en unas pocas indicaciones simples, o incluso una sola oración, puede ser extraña. Por ejemplo, uno de los probadores beta privados de GTP-3 lo usó para producir un blog convincente sobre el tema de bitcoin. Entre las demostraciones que analizamos, había aplicaciones para desarrollar nuevos podcasts, generar campañas de correo electrónico y anuncios, sugerir cómo organizar reuniones de la junta directiva y responder de forma inteligente preguntas que confundirían los sistemas lingüísticos anteriores.

Basado en las indicaciones de los seres humanos, GPT-3 también puede codificar — escribir instrucciones para computadoras o sistemas. Incluso puede convertir el lenguaje natural al lenguaje de programación. En un idioma natural (inglés, español, alemán,.), usted describe lo que desea que haga el código, como desarrollar un sitio web interno o orientado al cliente. GPT luego escribe el programa.

La capacidad de pensar en contenido, procedimientos y conocimientos en un campo científico o técnico sugiere otras aplicaciones potencialmente fértiles del GPT-3. Puede responder química preguntas — en una demostración, predijo correctamente cinco de seis reacciones de combustión química. Puede Autoplot gráficos basados en descripciones verbales, quitando gran parte de la labor ardua de tareas como la creación de presentaciones. Otro probador beta creó un bot GPT-3 que permite a las personas sin habilidades contables generar estados financieros. Otra aplicación puede responder a una deliberadamente difícil pregunta médica y examinar los mecanismos biológicos subyacentes. La aplicación recibió una descripción del conjunto de síntomas respiratorios de un niño de 10 años y se le informó de que se le diagnosticó una enfermedad obstructiva y se le administró medicación. Luego se le preguntó en qué receptor de proteínas podría actuar el medicamento. El programa identificó correctamente al receptor y explicó que el niño tenía asma y que normalmente se trata con broncodilatadores que actúan sobre ese receptor.

Este potencial de razonamiento general a través de la escritura, la codificación y la ciencia sugiere que el uso de transformadores impulsados por la nube podría convertirse en una meta-disciplina, aplicable a todas las ciencias de la administración, las ciencias de datos y las ciencias físicas y biológicas. Además, en los trabajos no técnicos, la nube en combinación con GPT3 reducirá la barrera para escalar las innovaciones digitales. El personal no técnico podrá utilizar el lenguaje natural diario en lugar de los lenguajes de programación para crear aplicaciones y soluciones para los clientes.

Los puestos de trabajo reinventados aumentarán la productividad.

A la luz de estos cambios venideros, las empresas no solo necesitarán repensar los recursos de IT, sino también los recursos humanos. Pueden comenzar analizando los paquetes de tareas en los roles actuales, descubriendo tareas específicas que la IA puede aumentar y desatando tanto a los trabajadores técnicos como a los no técnicos para innovar más rápidamente. Utilizando la herramienta Red de Información Ocupacional (O*NET), basado en un estándar del gobierno estadounidense utilizado para clasificar a los trabajadores en categorías ocupacionales, analizamos 73 categorías de empleo en 16 clústeres de carreras, y descubrimos que todos los clústeres serían afectados por GPT-3. Excavando en categorías de puestos de trabajo, descubrimos que 51 se pueden aumentar o complementar con GPT-3 en al menos una tarea, y 30 pueden usar GTP-3 para complementar dos o más tareas.

Algunas tareas se pueden automatizar, pero nuestro análisis muestra que la mayor oportunidad será aumentar y ampliar la productividad humana y el ingenio. Por ejemplo, los profesionales de la comunicación verán que la mayoría de sus tareas de trabajo involucran la generación de texto rutinario automatizada, mientras que las comunicaciones más críticas como el texto publicitario y los mensajes de las redes sociales se verán aumentadas por la capacidad de GPT-3 para ayudar a desarrollar líneas de pensamiento. Los científicos de la compañía podrían usar GPT-3 para generar gráficos que informen a sus colegas sobre el proceso de desarrollo de productos. Mientras tanto, para aumentar la investigación básica y la experimentación, podrían consultar el GPT-3 para extraer los hallazgos de un conjunto específico de artículos científicos. Las posibilidades a través de disciplinas e industrias están limitadas sólo por la imaginación de su gente.

No te dejes atrás.

El tiempo para preparar es ahora. La próxima generación de aplicaciones empresariales no se ejecutará en sistemas heredados, y las empresas tendrán que pasar a la nube de forma más agresiva de lo que son ahora. Esperar y ver no servirá. El 1 de octubre, OpenAI lanzará GPT como servicio, haciendo que la API esté disponible para los usuarios beta. Los líderes adoptarán y adaptarán GPT-3 en cuestión de meses, aprenderán dónde funciona mejor o dónde no funciona en absoluto. Tendrán una ventaja en el rediseño de los puestos de trabajo y en los temas de privacidad, seguridad y responsabilidad social que rodean a toda la IA. Y en los próximos dos años, puede esperar verlos poniendo todo tipo de aplicaciones en producción, encontrando oportunidades de innovación que pondrán rezagados aún más.

 

Los autores desean reconocer las contribuciones de nuestro equipo de investigación en Accenture Research, especialmente Thijs Deblaere, Surya Mukherjee y Prashant Shukla.


Via HBR.org

Related Posts
Necesitamos transparencia en algoritmos

Necesitamos transparencia en algoritmos, pero demasiado puede contraproducente

Las empresas y los gobiernos dependen cada vez más de algoritmos para tomar decisiones que afectan la vida y los medios de vida de las personas, desde aprobaciones de préstamos hasta reclutamiento, sentencias legales y admisiones universitarias. Las decisiones menos vitales también se están delegando a las máquinas, desde recomendaciones de productos hasta coincidencias de citas. En respuesta, muchos expertos han pedido normas y reglamentos que hagan transparente el funcionamiento interno de estos algoritmos. Pero la transparencia puede resultar contraproducente y causar confusión si no se aplica con cuidado. Afortunadamente, hay una manera inteligente de avanzar. Los usuarios deben poder exigir los datos detrás de las decisiones algorítmicas tomadas para ellos, incluidos los sistemas de recomendación, los sistemas de riesgo de crédito y seguro, los programas de publicidad y las redes sociales. Esto aborda el «ocultamiento intencional» por parte de las corporaciones. Pero no aborda los desafíos técnicos asociados con la transparencia en los algoritmos modernos. Aquí, un movimiento llamado IA explicable (XAI) podría ser útil. Los sistemas XAI trabajan analizando varias entradas utilizadas por un algoritmo de toma de decisiones, midiendo el impacto de cada una de las entradas individualmente y en grupos, y finalmente reportando el conjunto de entradas que tuvieron el mayor impacto en la decisión final.

Leer más