La cantidad de información que gestionan las empresas es enorme y, además, requiere consultar todos los documentos uno por uno. A veces son PDFs, otras Words, Excels, PowerPoints… En definitiva, la consulta de la información requiere un tiempo y también un conocimiento para saber dónde está cada documento. Cuanto más grande es la empresa, más difícil es encontrar la información y a veces se pierde el conocimiento acumulado. Si, además, se incorpora un nuevo empleado, como no conoce la documentación y prácticas de la empresa, ponerse al día le supone un largo tiempo a él y también a sus compañeros.
Los modelos de lenguaje natural son modelos de inteligencia artificial que comprenden el lenguaje humano, por lo que pueden leer miles de documentos y también responder preguntas sobre esos documentos.
El más conocido es GPT de OpenAI, que es el que utiliza la famosa herramienta ChatGPT. Sin embargo, la información que podemos consultar en ChatGPT es pública, no la información corporativa, y además hay otro riesgo: la información que proporcionamos a ChatGPT entrena el modelo de OpenAI, por lo que no es un entorno seguro para usar información interna. Lo mismo podemos decir de Google Gemini o Antrophic Claude si usamos la versión pública.
Sin embargo, se pueden hacer proyectos usando modelos de lenguaje natural que se nutran de toda la documentación interna y, además, parametrizar los modelos para que devuelvan las respuestas más adecuadas (para ello se usan las técnicas de RAG o fine-tunning).
De esta manera, los empleados pueden consultar cualquier información disponible de una manera mucho más rápida, sin tener que preguntar necesariamente a otros compañeros, y así se eliminan lo que llamamos “silos de conocimiento”.