Naver presentó un nuevo modelo de IA el día 2 que incorpora información real de publicaciones en cafés de madres y reseñas de restaurantes para mejorar la precisión de las respuestas. El modelo fue presentado durante una sesión titulada 'Del buscador a la ejecución: tecnología de IA de próxima generación que crea la búsqueda con IA de Naver' celebrada en Naver D2SF Gangnam. El modelo ligero, basado en HyperCLOVA X, aplica 'ingeniería de arneses' para reflejar información orientada a la vida real dentro del ecosistema de Naver, permitiendo que la IA proporcione respuestas fundamentadas en experiencias reales de usuarios, no en datos genéricos.
El modelo de IA implementado en el servicio de búsqueda 'AI Tab' de Naver utiliza ingeniería de arneses, una estructura que controla y dirige el comportamiento del agente de IA, como las riendas guían a un caballo. Cuando los usuarios buscan precios de academias de matemáticas, el sistema proporciona respuestas basadas en discusiones recientes de padres en cafés de madres. Cuando los usuarios preguntan sobre disponibilidad de estacionamiento en restaurantes, la IA refleja no solo la información oficial del negocio, sino también reseñas reales de clientes que han estacionado allí.
Han Seung-kyun, líder del Servicio de Búsqueda con IA de Naver, comparó la ingeniería de arneses con el 'sentido del trabajo' de la IA, afirmando que "para crear agentes de IA que funcionen bien en los servicios, es esencial la ingeniería de arneses que diseña simultáneamente eficiencia de costos y estabilidad, no solo grandes modelos de lenguaje (LLM)". Han agregó que "la experiencia de conectar la infraestructura de búsqueda y el saber hacer acumulado durante los últimos 27 años, el vasto contenido como blogs y cafés, y diversos activos de servicios como compras y lugares con tecnología de IA para guiar desde la búsqueda hasta la ejecución es la competitividad única de Naver que nadie puede seguir fácilmente".
Naver construyó una estructura de Modelo de Lenguaje Pequeño (SLM) con división del trabajo para aumentar la eficiencia del AI Tab. En lugar de un único LLM gigante que maneje todas las tareas, Naver combina SLM específicos para cada función, reduciendo costos operativos y mejorando simultáneamente la velocidad y calidad de respuesta. Con este método, Naver redujo los costos operativos de equipos hasta 3 veces y mejoró la velocidad de respuesta más de 2 veces.
Naver entrenó la IA utilizando tecnología Clarify RL (Aprendizaje por Refuerzo), que garantiza que la IA no interprete arbitrariamente solicitudes ambiguas, sino que confirme la intención del usuario mediante preguntas adicionales. Como resultado, la alucinación disminuyó hasta en 30 puntos porcentuales en comparación con HyperCLOVA X.
Lee Ki-chang, director del Modelo de IA Hiperescala de Naver Cloud, enfatizó que "el modelo aplicado al AI Tab se caracteriza por optimizar todo el proceso, desde la construcción de datos de entrenamiento hasta el diseño del modelo y el aprendizaje por refuerzo, para adaptarse a los servicios de Naver", y agregó que "el objetivo es crear un modelo que opere con la mayor precisión y eficiencia en procesos de servicio reales, como búsqueda, compra y reserva por parte de los usuarios de Naver".
Naver reveló su estrategia de avance en tecnología multimodal utilizando SmartLens, ubicado en la parte frontal de la barra de búsqueda del AI Tab. La tecnología multimodal permite que la IA comprenda y utilice diversas formas de información, incluyendo imágenes y videos, no solo texto.
Los usuarios pueden subir imágenes en lugar de texto en la barra de búsqueda y emitir comandos como 'encontrar productos similares a este' o 'reservar un lugar con este ambiente'. Si bien la búsqueda por imágenes y videos ya era posible con la IA existente, los modelos LLM primero reconocían imágenes y luego realizaban búsquedas basadas en texto. En contraste, el agente multimodal de Naver comprende todo el proceso, desde la entrada de imágenes hasta la ejecución, como una sola solicitud.
Yoon Sang-doo, líder del Centro de IA Futura de Naver, declaró que "la tecnología de búsqueda visual que Naver ha acumulado a través de SmartLens durante casi 10 años es tecnología central para crear los ojos a través de los cuales los agentes de IA ven el mundo", y agregó que "en el futuro, el servicio de agente de IA de Naver evolucionará en una dirección que entiende la intención del usuario no solo a través de texto, sino también de imágenes, y se conecta con acciones reales".
¿Qué presentó Naver el día 2? Naver presentó un nuevo modelo de IA el día 2 en Naver D2SF Gangnam que incorpora información orientada a la vida real de publicaciones en cafés de madres y reseñas de restaurantes. El modelo está basado en HyperCLOVA X y utiliza ingeniería de arneses para reflejar experiencias reales de usuarios en sus respuestas.
¿Cuánto redujo Naver los costos operativos con el nuevo modelo de IA? Naver redujo los costos operativos de equipos hasta 3 veces utilizando una estructura de Modelo de Lenguaje Pequeño (SLM). La compañía también mejoró la velocidad de respuesta más de 2 veces y redujo la alucinación hasta en 30 puntos porcentuales en comparación con HyperCLOVA X.
¿Qué es la tecnología multimodal SmartLens en la búsqueda con IA de Naver? SmartLens es la tecnología multimodal de Naver que permite a los usuarios subir imágenes en la barra de búsqueda y recibir respuestas a comandos como 'encontrar productos similares' o 'reservar lugares con este ambiente'. La tecnología entiende todo el proceso, desde la entrada de imágenes hasta la ejecución, como una sola solicitud, aprovechando la tecnología de búsqueda visual que Naver ha acumulado durante casi 10 años.
Noticias relacionadas
La entrada de Meta en la nube impulsa las perspectivas de valoración de Naver y Samsung SDS
Bancos coreanos aceleran la adopción de IA para combatir el fraude financiero
AI for Good Global Commission lanzada para expandir el acceso y la confianza
THEA recauda $8M para construir una capa de coordinación de IA basada en Solana