Anthropic lanza un nuevo modelo que podría superar a GPT-4o

lunes

1 Jul

Inteligencia Artificial, Noticias y Novedades

La pasada semana, se lanzó Claude 3.5 Sonnet, la primera versión de la próxima familia de modelos Claude 3.5. Claude 3.5 Sonnet eleva el estándar de la industria en inteligencia, superando a los modelos de la competencia y a Claude 3 Opus en una amplia gama de evaluaciones, con la velocidad y el costo de nuestro modelo de gama media, Claude 3 Sonnet.

Claude 3.5 Sonnet está disponible de forma gratuita en Claude.ai y en la aplicación Claude para iOS, mientras que los suscriptores de los planes Claude Pro y Team pueden acceder a él con límites de uso significativamente más altos. También está disponible a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. El modelo cuesta $3 por millón de tokens de entrada y $15 por millón de tokens de salida, con una ventana de contexto de 200K tokens.

Inteligencia de vanguardia al doble de velocidad

Claude 3.5 Sonnet establece nuevos puntos de referencia en la industria para el razonamiento a nivel de posgrado (GPQA), conocimiento a nivel de licenciatura (MMLU) y competencia en programación (HumanEval). Muestra una mejora notable en la comprensión de matices, humor e instrucciones complejas, y es excepcional en la redacción de contenido de alta calidad con un tono natural y dinámico.

Claude 3.5 Sonnet opera al doble de la velocidad de Claude 3 Opus. Este aumento en el rendimiento, combinado con precios rentables, hace que Claude 3.5 Sonnet sea ideal para tareas complejas como el soporte al cliente sensible al contexto y la orquestación de flujos de trabajo de múltiples pasos.

En una evaluación interna de codificación agente, Claude 3.5 Sonnet resolvió el 64% de los problemas, superando a Claude 3 Opus que resolvió el 38%. Esta evaluación prueba la capacidad del modelo para arreglar un error o agregar funcionalidad a una base de código de código abierto, dada una descripción en lenguaje natural de la mejora deseada. Cuando se le instruye y se le proporcionan las herramientas relevantes, Claude 3.5 Sonnet puede escribir, editar y ejecutar código de manera independiente con capacidades sofisticadas de razonamiento y resolución de problemas. Maneja las traducciones de código con facilidad, lo que lo hace particularmente efectivo para actualizar aplicaciones heredadas y migrar bases de código.

Visión de última generación

Claude 3.5 Sonnet es el modelo de visión más fuerte hasta la fecha, superando a Claude 3 Opus en puntos de referencia de visión estándar. Estas mejoras de cambio de paso son más notables para tareas que requieren razonamiento visual, como interpretar gráficos y diagramas. Claude 3.5 Sonnet también puede transcribir texto con precisión desde imágenes imperfectas, una capacidad central para los servicios minoristas, logísticos y financieros, donde la IA puede obtener más información de una imagen, gráfico o ilustración que del texto solo.

Artifacts: una nueva forma de usar

Artifacts en Claude.ai, es una nueva función que amplía cómo los usuarios pueden interactuar con Claude. Cuando un usuario le pide a Claude que genere contenido como fragmentos de código, documentos de texto o diseños de sitios web, estos Artifacts aparecen en una ventana aparte junto a su conversación. Esto crea un espacio de trabajo dinámico donde pueden ver, editar y construir sobre las creaciones de Claude en tiempo real, integrando sin problemas el contenido generado por IA en sus proyectos y flujos de trabajo.

Esta función de vista previa marca la evolución de Claude de una IA conversacional a un entorno de trabajo colaborativo. Es solo el comienzo de una visión más amplia para Claude.ai, que pronto se expandirá para apoyar la colaboración en equipo. En un futuro cercano, los equipos y eventualmente organizaciones enteras podrán centralizar de manera segura su conocimiento, documentos y trabajo en curso en un espacio compartido, con Claude sirviendo como un compañero de equipo a demanda.

Compromiso con la seguridad y la privacidad

Estos modelos se someten a pruebas rigurosas y han sido entrenados para reducir el uso indebido. A pesar del salto en inteligencia de Claude 3.5 Sonnet, nuestras evaluaciones de red teaming han concluido que Claude 3.5 Sonnet sigue estando en ASL-2.

Como parte del compromiso con la seguridad y la transparencia, desde Claude 3.5 Sonnet han involucrado a expertos externos para probar y perfeccionar los mecanismos de seguridad dentro de este último modelo. Claude 3.5 Sonnet se sometió al Instituto de Seguridad en Inteligencia Artificial del Reino Unido (UK AISI) para una evaluación de seguridad previa al despliegue. El UK AISI completó las pruebas de 3.5 Sonnet y compartió sus resultados con el Instituto de Seguridad en Inteligencia Artificial de EE. UU. (US AISI) como parte de un Memorándum de Entendimiento, posible gracias a la asociación entre los AISI de EE. UU. y el Reino Unido anunciada a principios de este año.

Uno de los principios constitucionales fundamentales que guía el desarrollo de este modelo de IA es la privacidad. No entrenan sus modelos generativos con datos enviados por los usuarios a menos que un usuario dé permiso explícito para hacerlo.

Fuente original: Anthropìc

Anthropic lanza un nuevo modelo que podría superar a GPT-4o