Apple presenta OpenELM, una IA de código abierto que se puede ejecutar en un portátil o tu iPhone

Apple ha entrado en el creciente campo de los modelos de lenguaje grande (LLM) en dispositivos con el lanzamiento de OpenELM, una familia de modelos de código abierto diseñados para ejecutarse de manera eficiente en dispositivos personales como ordenadores portátiles o teléfonos móviles.

OpenELM (Modelos de Lenguaje Eficientes de Código Abierto) ofrece una ventaja significativa: a diferencia de muchos otros LLM, estos modelos no requieren una conexión constante a servidores en la nube para su procesamiento. Esto podría conducir a tiempos de respuesta más rápidos y una mejor privacidad para los usuarios.

 

La familia está conformada por ocho modelos con un tamaño que oscila entre 270 millones y 3.000 millones de parámetros. Si bien los modelos más pequeños generalmente tienen menos capacidad que sus contrapartes más grandes, el enfoque de Apple utiliza una técnica especial llamada «escalado capa por capa» para ofrecer una buena precisión a pesar del tamaño reducido.

OpenELM está diseñado para portátiles o dispositivos móviles. De acuerdo con un documento técnico, los ingenieros de Apple consiguieron ejecutarlos en un MacBook Pro con chip M2 Max y 64 GB de RAM, así como en un ordenador con procesador Intel Core i9-13900KF con 64 GB en RAM y una GPU NVIDIA RTX 4090. Tras efectuar diversas pruebas de rendimiento, una de las variantes consiguió un rendimiento por encima de lo esperado.

Los modelos fueron entrenados con un conjunto que contiene datos de Reddit, Github, Wikipedia y más. OpenELM está disponible en HuggingFace bajo una licencia de código de muestra que permite tanto el uso comercial como la modificación. Sin embargo, es importante tener en cuenta que Apple no ofrece garantías sobre la seguridad o la precisión de los resultados que estos modelos puedan generar.

Apple da un fuerte impulso al mercado de la IA en dispositivos con OpenELM

Este lanzamiento marca un movimiento sorprendente para Apple en el terreno de la inteligencia artificial. Hace unas semanas, la empresa de Cupertino presentó MGIE, un modelo de código abierto que permite editar imágenes a través de lenguaje natural. Diseñado en conjunto con investigadores de la Universidad de California en Santa Bárbara, MGIE puede interpretar una imagen y editarla sin mucho contexto. 

Apple también lanzó una herramienta para crear modelos de aprendizaje automático que se ejecuten en los chips Apple Silicon. Al igual que OpenELM y MGIE, los ingenieros de la tecnológica optaron por un modelo abierto y ofrecieron su trabajo en un repositorio de GitHub. Los años de secretismo quedaron atrás, al menos en cuestiones de la inteligencia artificial, ya que Apple está tomando una postura similar a Meta y Microsoft al abrir sus avances para que otros contribuyan.

 

OpenELM es el paso más reciente en la estrategia de Apple para posicionarse en el mercado de la IA. Si bien los nuevos modelos no alcanzan el rendimiento de GPT-4 o Gemini, se ejecutan directamente en el dispositivo. Esto significa que no requeriríamos una conexión a la nube, por lo que nuestros datos estarían más seguros.

«El lanzamiento de los modelos OpenELM tiene como objetivo empoderar y enriquecer a la comunidad de investigación abierta al brindar acceso a modelos de lenguajes de última generación.»

Apple

Apple se encuentra trabajando en una implementación de la IA que vaya en sintonía con sus necesidades y valores. Hace unos días se rumoreó que los ingenieros de la compañía diseñan un procesador de inteligencia artificial dedicado para servidores. Esto aliviaría la dependencia de terceros y otorgaría el control total a la empresa para garantizar el rendimiento y la seguridad.

El lugar de trabajo del futuro: Tres características imprescindibles de una impresora moderna

El lugar de trabajo del futuro: Tres características imprescindibles de una impresora moderna

Con interfaces intuitivas, funciones de mantenimiento simplificadas y medidas de seguridad de última generación, como el cifrado de datos y autenticación avanzada, Lexmark ofrece soluciones que permiten a tu equipo trabajar de manera más inteligente y más segura.

Schneider Electric presenta su evento virtual: “Innovación Acelerada: Soluciones para Centros de Datos Preparados para IA”

Schneider Electric presenta su evento virtual: “Innovación Acelerada: Soluciones para Centros de Datos Preparados para IA”

Schneider Electric, líder en soluciones energéticas y sostenibles, ha anunciado un exclusivo evento virtual donde revelará su visión para los centros de datos del futuro, preparados para afrontar los retos de la revolución de la inteligencia artificial (IA).

Construye una Red de Zero Trust con SD-WAN Seguro

Construye una Red de Zero Trust con SD-WAN Seguro

Un SD-WAN seguro combina capacidades avanzadas de SD-WAN con funciones de firewall de última generación, sustituyendo los firewalls tradicionales en las sucursales y reforzando la protección de las soluciones de Security Service Edge (SSE). Esta integración permite que las organizaciones implementen los primeros pasos hacia una red de confianza cero en sus ubicaciones remotas.