De los creadores de Sam Altman lidera el comité que vigila los desarrollos de Sam Altman, llega GPT-4 supervisará a GPT-4

Lobos News junio 27, 2024 0 Comments Ciencia, Tecnología

“GPT-4 para detectar los errores de GPT-4”, con estas palabras ha presentado el presidente de OpenAI, Greg Brockman, la más reciente propuesta de la compañía de inteligencia artificial para mejorar su modelo insignia en el campo de la programación. Estamos hablando de CriticGPT, un modelo basado en GPT-4 diseñado específicamente para detectar errores en la salida de código de ChatGPT.

La firma respaldada por Microsoft asegura que CriticGPT ha demostrado ser muy efectivo para ayudar a las personas a detectar errores en las respuestas del famoso chatbot. En pruebas internas, explican, los resultados de las personas que recibieron la ayuda de CriticGPT superaron en un 60% a las que hicieron el trabajo en solitario. Ahora, este modelo está listo para pasar a la siguiente etapa.

Una nueva herramienta para el aprendizaje por refuerzo

En las tareas de entrenamiento de modelos como GPT-4 entra en escena lo que se conoce como aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). Se trata de una técnica de machine learning que, en líneas generales, utiliza respuestas creadas por humanos, los llamados entrenadores de la IA, para mejorar la precisión del modelo para determinadas tareas.

{“videoId”:”x8jpy2b”,”autoplay”:false,”title”:”¿Qué hay DETRÁS de IAs como CHAT GPT 4, DALL-E o MIDJOURNEY? | INTELIGENCIA ARTIFICIAL”, “tag”:”Webedia-prod”}

OpenAI comenzará a desplegar modelos similares a CriticGPT entre sus entrenadores para ayudarles a detectar los errores cada vez más sutiles que suele reproducir GPT-4 a través de ChatGPT. “Este es un paso para poder evaluar los resultados de los sistemas avanzados de IA que pueden ser difíciles de calificar para las personas sin mejores herramientas”, ha dicho la compañía en su blog.

Pero, ¿cómo funciona CriticGPT? Como podemos ver en la imagen de arriba, el modelo escribe “críticas” a las respuestas de ChatGPT. Estas críticas no siempre son correctas, pero pueden ayudar a los entrenadores humanos a visibilizar problemas que podrían haber pasado desapercibidos. OpenAI describe a esta mecánica como una “asistencia” para el proceso de RLHF.

CriticGPT, al estar basado en GPT-4, también pasó por el proceso de aprendizaje por refuerzo a partir de la retroalimentación humana. Por curioso que parezca, a la luz de las pruebas, parece ser una buena idea para que ChatGPT basado en GPT-4 mejore en tareas de programación, campo donde algunos estudios han alertado el importante porcentaje de respuestas incorrectas del modelo.

En Xataka

Una cadena de jugueterías acaba de publicar el primer spot publicitario creado con Sora: el realismo se queda a medio camino

La compañía también está tratando de mejorar la seguridad de sus modelos después de la disolución de su equipo de “superalineación”. Para ello tiene un comité que está liderado por Sam Altman. Una de las misiones de este comité es presentar recomendaciones al consejo de administración presidido por Greg Brockman, pero de la compañía que tiene como CEO a Sam Altman.

Imágenes | OpenAI | Milad Fakurian | Village Global

En Xataka | YouTube ve un futuro en el que la IA clonará la música actual. Convencer a las discográficas no va a ser nada fácil

–
La noticia De los creadores de Sam Altman lidera el comité que vigila los desarrollos de Sam Altman, llega GPT-4 supervisará a GPT-4 fue publicada originalmente en Xataka por Javier Marquez .

Fuente: Xataka

Últimas Noticias

Más del 25% del nuevo código de Google ya se genera con IA. Es un mensaje inquietante para todos los desarrolladoresoctubre 30, 2024

Alphabet presentó los resultados financieros del tercer trimestre del año, pero lo interesante vino después: en la tradicional conversación con inversores para discutir esos resultados, Sundar Pichai, CEO de Alphabet y Google, presumió de algo inquietante: el código que gobierna todos sus productos cada vez está más desarrollado no por humanos, sino por máquinas. En

Antes era la habitación más importante, ahora está desapareciendo de las casas. Y Netflix tiene parte de la culpaoctubre 30, 2024

“En la mayoría de los casos, los pisos están construidos para Netflix and chill” dice el experto en planificación de viviendas Bobby Fijan a The Atlantic, haciendo referencia al popular slogan que durante unos años empleó la plataforma. Consecuencia: dice Fijan en este artículo sobre la reducción progresiva del tamaño de los apartamentos, que los

¿Cusco FC jugará con la reserva ante Alianza Lima en definición del Torneo Clausura 2024?: algunos futbolistas tienen contrato hasta el 31 de octubreoctubre 30, 2024

Se desató una nueva polémica a poco del Alianza Lima vs Cusco FC, la cual ha sido muy resonante. Y es que este duelo, que se llevará a cabo el domingo 3 de noviembre a las 15:00 horas en el estadio Alejandro Villanueva, podría definir el futuro de los ‘blanquiazules’ en la actual temporada de

Maligno Torres reclamó más inversión del Estado en el deporte: “Estoy un poco desilusionado”octubre 30, 2024

Cuatro meses después de conseguir la medalla de oro en BMX Freestyle en los Juegos Olímpicos de París y de su encuentro con el presidente Javier Milei en Casa Rosada, José “Maligno” Torres, habló de su presente económico y se mostró decepcionado por los aportes que recibe por parte del Gobierno. Si bien agradeció la

Trump vs. Harris: qué activos subirán tras las elecciones en EE.UU.octubre 30, 2024

A una semana de las elecciones presidenciales en Estados Unidos, las encuestas anticipan una disputa muy reñida entre Donald Trump y Kamala Harris, aunque con leve inclinación a favor del candidato republicano, por lo que los inversores del mercado bursátil empiezan a ajustar posiciones de cara a los posibles resultados. De acuerdo con PPI, las

Una nueva herramienta para el aprendizaje por refuerzo

You May Also Like

Deja un comentario Cancelar respuesta