Podcast: Atareado con Linux – Enero 2022

06.- GNU/Linux, Software Libre y Código Abierto, Todas las Entradas (Artículos) publicadas

Podcast: Atareado con Linux – Enero 2022

Podcast – Atareado con Linux – Enero 2022

16 Ene 2022

1–2 minutos

Proyecto Tic Tac: Blog y Medio noticioso TI internacional

Anuncios

¿Buscas un «Espacio Publicitario» web para tu uso personal o comercial?

Aquí, puedes dar a conocer aquí, al mayor público posible alrededor del mundo, una idea, proyecto, negocio, emprendimiento, producto, bien, servicio, activo digital y sitio web (desde un blog, vlog, pódcast, hasta un perfil, grupo, página o comunidades de alguna red social). Para así captar más seguidores y clientes, en beneficio propio o de terceros.

Visita nuestra sección de «Servicios» para más información aquí

Radio LinuxClickFM: Emisora TI sobre Informática, GNU/LINUX, Hacking Ético y Ciberseguridad.

ATA 809 Deja de subir tus PDFs a ChatGPT. Crea tu propia IA ya – Atareao con Linux

Te traigo un tema que me tiene completamente entusiasmado: cómo exprimir todos tus documentos, notas, manuales o archivos locales sin tener que compartirlos con nadie. Te voy a dar una visión general de cómo puedes montar un sistema de recuperación de información para que una inteligencia artificial local se convierta en tu asistente personal definitivo. Todo esto sin salir de tu propia casa, sin APIs de pago y de forma completamente privada.¿Reentrenar o buscar? El gran dilemaPara solucionar esta tremenda limitación, el mundo de la tecnología nos ofrece dos caminos diferentes: hacer un reentrenamiento de un modelo ya existente (lo que conocemos como fine-tuning) o bien montar un sistema RAG (Retrieval-Augmented Generation), que podríamos traducir como generación aumentada por recuperación. En este episodio te desvelo por qué el fine-tuning no es la solución para el común de los mortales: requiere de tarjetas gráficas carísimas, es un proceso lento y estático, y además tus datos privados quedan incrustados dentro del propio modelo, por lo que si se lo entregas a un tercero, estarás regalando tu privacidad. En cambio, un RAG casero es infinitamente más barato, dinámico y respeta tus datos al cien por cien. Imagina que en lugar de obligar al modelo a memorizar toda la biblioteca (que es lo que hace el fine-tuning), le pones a su lado un bibliotecario listísimo que busca la página exacta de los apuntes que necesita antes de responderte. El modelo de lenguaje lee esa página en tiempo real y te contesta basándose únicamente en hechos reales, no en invenciones.La tubería de datos para tu cerebro artificialA lo largo del episodio te explico con todo detalle las piezas que componen esta tubería de datos (o pipeline) que permite hacer magia con tus archivos:La ingestaEl troceado (o chunking)Los embeddings y vectoresLa base de datosLa búsqueda híbridaHerramientas listas para usar y errores que debes evitarSi te da miedo el código, no te preocupes. Te hablo también de alternativas como OpenWeb UI. Y si te va la marcha del desarrollo, te cuento cómo con apenas diez líneas de Python y Streamlit puedes tener una aplicación web propia y completamente funcional.Además, repasamos los tropiezos más habituales que cometemos al empezar en este mundillo, como usar modelos de vectorización que solo entienden inglés para procesar textos en español, no limpiar las cabeceras y pies de página de los PDFs antes de procesarlos, o la importancia crucial de reindexar de forma automática para que tus nuevos documentos estén disponibles al instante.Capítulos del episodio00:00:00 Introducción y de qué va este episodio00:01:54 ¿A qué problema nos enfrentamos con los LLM?00:05:08 Fine-tuning vs. RAG: ¿Cuál es mejor para tus datos?00:08:29 El Pipeline del RAG: De la ingesta a la respuesta00:10:45 ¿Qué es un "embedding" y qué modelos usar con Ollama?00:12:02 El arte de trocear el texto (Chunking)00:13:40 Búsqueda híbrida: Semántica frente a coincidencia exacta00:14:50 Re-ranking: Ordenando los resultados por relevancia00:15:53 El Stack: Ollama, PostgreSQL, pgvector y Podman00:17:25 Alternativas vectoriales: ParadeDB, ChromaDB y Qdrant00:18:36 Manos a la obra con Python y Streamlit00:20:53 OpenWeb UI: La alternativa con RAG integrado y sin código00:21:42 Cómo saber si funciona: El método de las 20 preguntas00:22:51 Errores comunes que debes evitar al montar tu RAG00:23:55 Lo que viene: GraphRAG y RAG agéntico00:24:44 Resumen final y despedidaMás información y enlaces en las notas del episodio🌐 Aquí lo puedes encontrar todo 👉 https://atareao.es✈️ Telegram (el grupo) 👉 https://t.me/atareao_con_linux✈️ Telegram (el canal) 👉 https://t.me/canal_atareao🦣 Mastodon 👉 https://mastodon.social/@atareao🐦 Twitter 👉 https://twitter.com/atareao🐙 GitHub 👉 https://github.com/atareao

¿Buscas un «Espacio Publicitario» web para tu uso personal o comercial?

Visita nuestra sección de «Servicios» para más información aquí

**Visita nuestra sección de Servicios: Costos y Tarifas**

Apóyanos con un donativo para continuar nuestra labor informativa y educativa, de forma independiente, libre, abierta y gratuita.

Descubre más desde PROYECTO TIC TAC

Suscríbete y recibe las últimas entradas en tu correo electrónico.

ATA 809 Deja de subir tus PDFs a ChatGPT. Crea tu propia IA ya – Atareao con Linux

Gracias por tus comentarios… Cancelar la respuesta

Disponible ONLYOFFICE Docs 9.4: Cambios a nivel del Licenciamiento, nuevos temas y transiciones para diapositivas, y otras novedades

Disponible ONLYOFFICE Docs 9.3: vista multipágina en documentos, Solver en hojas de cálculo y otras novedades

Cómo instalar ONLYOFFICE Docs mediante Docker: guía paso a paso

Tendencias

Disponible ONLYOFFICE Docs 9.4: Cambios a nivel del Licenciamiento, nuevos temas y transiciones para diapositivas, y otras novedades

Disponible ONLYOFFICE Docs 9.3: vista multipágina en documentos, Solver en hojas de cálculo y otras novedades

Cómo instalar ONLYOFFICE Docs mediante Docker: guía paso a paso

Glosario de Inteligencia Artificial e Ingeniería de Prompts enfocada a la Educación: ¡Conoce todo lo que hay que saber!