Persiste la controversia: una filtración revela que OpenAI utilizó millones de videos de YouTube para entrenar al modelo GPT-4.

La controversia persiste en el ámbito de la inteligencia artificial, ya que una reciente filtración ha revelado que OpenAI, reconocida empresa en este campo, utilizó millones de videos de YouTube para entrenar a su modelo GPT-4. Esta revelación ha generado un intenso debate en la comunidad científica y tecnológica, poniendo en tela de juicio los métodos y ética de las grandes compañías en la creación de sistemas de IA avanzados. El uso de datos masivos provenientes de plataformas públicas como YouTube plantea interrogantes sobre la privacidad de los usuarios y la transparencia en el desarrollo de estas tecnologías. OpenAI, conocida por sus avances en el campo de la IA, se enfrenta ahora a cuestionamientos sobre la responsabilidad y el uso ético de los datos en la creación de sus modelos.

Index

Controversia en IA: OpenAI habría utilizado millones de videos de YouTube para entrenar GPT

Una semana atrás, surgieron rumores acerca de que OpenAI estaba empleando la plataforma de YouTube, propiedad de Google, para entrenar a Sora, una herramienta de IA generativa que crea vídeos realistas a partir de una descripción de texto. El CEO de YouTube, Neal Mohan, advirtió a Sam Altman, CEO de Open AI, sobre las posibles infracciones que esto representaría. Sin embargo, en un principio, tales afirmaciones eran solo especulaciones.

Por otro lado, una investigación realizada por el medio The New York Times revela que OpenAI habría utilizado más de un millón de horas de video para entrenar a Whisper, su inteligencia artificial encargada de convertir audio en texto, con la finalidad de emplear estas transcripciones para el desarrollo de GPT-4.

Investigación revela: OpenAI habría empleado videos de YouTube en el entrenamiento de GPT

Investigación revela: OpenAI habría empleado videos de YouTube en el entrenamiento de GPT

Las primeras sospechas sobre el uso de YouTube por parte de OpenAI para entrenar a Sora se vieron reforzadas tras una entrevista a Mira Murati, CTO de la compañía de inteligencia artificial, en The Wall Street Journal. Al ser consultada acerca de esta posibilidad, su respuesta fue ambigua: “No estoy segura de eso”.

De acuerdo con The New York Times, las transcripciones obtenidas a través de Whisper han sido empleadas para el entrenamiento de GPT-4, considerado uno de los modelos de lenguaje más avanzados en la actualidad. Se destaca que las principales empresas de IA han agotado los datos públicos disponibles para entrenamiento, indicando que OpenAI se habría quedado sin fuentes en el año 2021.

Ante esta situación, los directivos de la compañía decidieron utilizar alrededor de un millón de horas de videos de YouTube para extraer el audio y utilizarlo en el entrenamiento de Whisper. Argumentan que se han ceñido al uso razonable al emplear solo una fracción de las enormes cantidades de horas de video disponibles en la plataforma.

Matt Bryant, portavoz de Google, ha confirmado haber recibido informes no confirmados sobre la actividad de OpenAI, reiterando que sus términos de servicio prohíben la descarga no autorizada de contenido de YouTube. Ante esto, queda por verse cómo evolucionará este caso y si alguna de las compañías involucradas decidirá recurrir a acciones legales.

Luisa Herrera

Hola, soy Luisa, periodista de la página web El Noticiero, un periódico independiente de actualidad nacional e internacional. Mi pasión es descubrir las últimas novedades y presentarlas con la más rigurosa objetividad a nuestros lectores. Con mi pluma, busco informar, analizar y contextualizar la información para que todos puedan estar al tanto de lo que sucede en el mundo. Mi compromiso es con la verdad y la imparcialidad, para ofrecer un periodismo de calidad que contribuya al debate y la reflexión. ¡Gracias por seguirnos en nuestras noticias!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir