Tecnología
OpenAI anuncia la llegada de nuevas funciones que buscan impulsar la personalización en sus modelos de inteligencia artificial
La característica está disponible para brindar a los desarrolladores mayor libertad al trabajar con la inteligencia artificial.
OpenAI ha facilitado a los desarrolladores nuevas herramientas con las que personalizar sus modelos y crear aplicaciones de inteligencia artificial (IA) que incluyen conversaciones en tiempo real con voz natural e incorporen y mejoren la comprensión de imágenes.
La compañía tecnológica ha celebrado este martes en San Francisco (Estados Unidos) su evento de desarrolladores DevDay 2024, en el que ha anunciado nuevas herramientas para la personalización de sus modelos de IA.
Los desarrolladores pueden acceder a un nuevo proceso de destilación de modelos que se integra en la plataforma de OpenAI para que puedan utilizar los resultados de modelos de mayor capacidad, como o1-preview y GPT-4o, para afinar otros más pequeños y rentables, como GPT-4o mini.
Este proceso se encuentra en una nueva ‘suite’ que permite a los desarrolladores generar conjuntos de datos para destilación, crear y ejecutar evaluaciones personalizadas para medir el rendimiento del modelo en tareas específicas. Ambas herramientas están integradas en la oferta de ajuste de OpenAI.
Tendencias
Los desarrolladores también pueden realizar ajustes en GPT-4o con imágenes y texto, con la nueva herramienta de ajuste fino de visión. De esta forma, pueden incorporar capacidades de comprensión de imágenes para ofrecer funciones de búsqueda visual o de detección de objetos.
‘Prompt Caching’ es una herramienta diseñada para que los desarrolladores ahorren costes y tiempo al permitir guardar en caché el contexto usado de manera frecuente en múltiples llamadas de API. Se aplica automáticamente en las últimas versiones de GPT-4o, GPT-4o mini, o1-preview y o1-mini, y sus versiones optimizadas.
“La API almacena en caché el prefijo más largo de una solicitud que se haya calculado previamente, comenzando con 1024 tokens y aumentando en incrementos de 128 tokens. Si reutilizas solicitudes con prefijos comunes, aplicaremos automáticamente el descuento de almacenamiento en caché de solicitudes sin necesidad de que realices ningún cambio en su integración de API”, explica la compañía en el blog oficial.
Una última novedad anunciada en DevDay es ‘Realtime API’, un recurso con el que los desarrolladores pueden crear experiencias rápidas de conversión de voz a voz en sus aplicaciones. Está actualmente en una fase de beta pública, y es similar al modo de voz avanzada de ChatGPT, admite conversaciones naturales con una de las seis voces predefinidas.
¿Qué es SearchGPT y cómo funciona?
La principal ventaja de esta nueva herramienta, que ya está en funcionamiento, es que, a diferencia de Google, ofrece resultados mucho más específicos. En lugar de una larga lista de enlaces, SearchGPT proporciona respuestas directas y precisas a las consultas de los usuarios. Esto se traduce en un uso del tiempo más eficiente y en soluciones más rápidas para los internautas, quienes ya no tendrán que enfrentarse a una interminable lista de páginas, sino que recibirán información organizada y contextualizada en resúmenes claros.
Otra de las fortalezas de SearchGPT es su capacidad para acceder a información en tiempo real, algo que Google aún no ha logrado resolver por completo, ya que depende de generadores de contenido externos para ofrecer resultados que satisfagan las búsquedas.
*Con información de Europa Press.