Noruega está en camino de avanzar en su programa de LLM

- Noruega ha desarrollado recientemente tres grandes modelos lingüísticos.
- La Universidad de Oslo ha desarrollado los modelos con fines de investigación y desarrollo.
- Lumi, el ordenador más potente de Europa, se utilizó para formar a los LLM en Finlandia.
El Grupo de Tecnología del Lenguaje (LTG) de la Universidad de Oslo ha preparado tres grandes modelos lingüísticos (LLM) noruegos. Esto fue posible gracias a que los investigadores tuvieron tiempo para acceder al ordenador más potente de Europa, Lumi, ubicado en Finlandia. Los investigadores del LTG entrenaron sus grandes modelos lingüísticos (LLM) en Lumi antes de Navidad y procesaron una gran cantidad de datos para lanzar tres modelos lingüísticos noruegos diferentes para competir en ChatGPT. Acceder a Lumi no es fácil, ya que los investigadores deben solicitarlo con antelación y esperar su turno. Sin embargo, este potente ordenador acelera el proceso de entrenamiento de datos.
Por qué los noruegos quieren su propio modelo lingüístico extenso (LLM)
El noruego quería construir su propio modelo lingüístico, ya que existían muchos usos además de estar en la lengua materna para una mayor adopción. Al señalar los diferentes problemas asociados con las soluciones comerciales, el profesor dematicde la Universidad de Oslo, Erik Velldal, afirmó:
Existen muchos problemas asociados con los modelos lingüísticos de los gigantes tecnológicos. Para el mundo exterior, parecen cajas negras. Necesitamos alternativas noruegas
Fuente: Erik Velldal.
Anteriormente, la Biblioteca Nacional de Noruega y la Universidad de Oslo trabajaron en unos pocos modelos de idioma noruego, pero los desarrollados ahora son los más grandes hasta ahora, con más de 30 mil millones de palabras o entrenamiento.
El papel de Lumi es importante, ya que se requiere una gran potencia de procesamiento para entrenar modelos de IA, incluyendo numerosas unidades de GPU. El proceso de entrenamiento puede acelerarse si se aumenta el número de GPU, y Lumi ofrece una buena oportunidad, ya que cuenta con más de 10 000 GPU integradas.
El profesor asociado Andrey Kutuzov afirma que, entre muchas otras razones para la creación de un modelo de lenguaje noruego, se encuentra el hecho de que modelos como ChatGPT no se adaptan bien al conocimiento y los valores de Noruega. Estos modelos se entrenan principalmente con idiomas estadounidenses e inglés, por lo que defiduda reflejan también la cultura y los valores estadounidenses, y lo que los noruegos necesitaban era algo acorde a sus propias preferencias. Él dice:
“Un modelo lingüístico noruego reflejará en mucha mayor medida la sociedad tal como la conocemos en Noruega”
Fuente: Andrey Kutuzov.

Limitaciones de los modelos de lenguaje grande del noruego
Los modelos noruegos, destinados principalmente a desarrolladores e investigadores, ya se han lanzado y miles de personas los han descargado. Kutuzov explica que estos modelos no están disponibles en línea. Dado que la interfaz web se considera fácil de usar para el público general, según el profesor, estos modelos aún distan mucho de los modelos comerciales en cuanto a las posibilidades que ofrecen. Al ser modelos básicos generales,.
En el grupo de tecnología lingüística noruego, existe la percepción de que deben contar con sus propios modelos para competir con ChatGPT de OpenAI o LaMDA de Google. Además de muchas otras observaciones, se observa que los modelos comerciales solo permiten acceder a ellos a través de su interfaz web y que el modelo subyacente al sistema es de acceso restringido. Por lo tanto, en muchos contextos, puede ser arriesgado compartir datos con un proveedor de servicios externo. Como en el caso de los datos médicos, donde la privacidad es la principal preocupación.
Los modelos del idioma noruego son bastante limitados en comparación con ChatGPT. Dado que se entrenan con solo el 0,1 % de los datos de entrenamiento de ChatGPT, estos modelos no son cerrados ni restringidos, por lo que son más útiles para los investigadores.
Igualar las cualidades y estándares de los modelos lingüísticos estadounidenses sigue siendo una tarea difícil, y los modelos noruegos necesitan mayor desarrollo. Para estar a la altura de ChatGPT o Bard, necesitan capacitación instructiva para poder resolver problemas un poco más complejos. Se espera que se lancen nuevas versiones de los modelos y que el proceso continúe.
Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.
Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Aamir Sheikh
Aamir es periodista especializado en tecnología con casi seis años de experiencia en los sectores de criptomonedas y tecnología. Se graduó de la Universidad MAJ con un MBA en Finanzas y Marketing. Actualmente trabaja en Cryptopolitan, donde informa sobre las últimas novedades en los mercados de criptomonedas y realiza predicciones de precios.
CURSO
- ¿Qué criptomonedas pueden hacerte ganar dinero?
- Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
- Estrategias de inversión poco conocidas que utilizan los profesionales
- Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)














