Estrategias de RAG de menor a mayor dificultad

Instalar dependencias:

conda create -n rag_examples
pip install --upgrade langchain langchain-community langchainhub langchain_openai langchain_pinecone langchain langchain-community langchainhub git+https://github.com/pytube/pytube git+https://github.com/openai/whisper.git

00_rag_openai_entire

Se carga entero el documento y se realizan preguntas sobre él.

Links:

Video tutorial base: https://www.youtube.com/watch?v=BrsocJb-fAo Código tutorial base: https://github.com/svpino/youtube-rag/blob/main/rag.ipynb

For fixing youtube problems change the following: pytube/pytube#1707 pytube/pytube#1894 (comment)

PROBLEMA Los costes son muy grandes si cada vez hay que cargarlo todo.

SOLUCION Pasamos al siguiente enfoque: enviar solo chunks.

01_rag_openai_pinecone

Se trocea y se envía a pinecone.
Se utiliza la estrategia de semantic chunk para mejorar

Links de text splitting:

https://community.fullstackretrieval.com/ https://github.com/FullStackRetrieval-com/RetrievalTutorials/blob/main/tutorials/LevelsOfTextSplitting/5_Levels_Of_Text_Splitting.ipynb

PROBLEMA Baja el accuracy al no tener todo el contexto.

SOLUCION Pasamos al siguiente enfoque: Probar varias veces hasta que se consigue el resultado esperado.

01_self_rag

Se utiliza la estrategia de self rag con Langgraph.

Links:

https://blog.langchain.dev/agentic-rag-with-langgraph/ https://github.com/langchain-ai/langchain/blob/master/cookbook/langgraph_self_rag.ipynb

Siguientes Pasos:

[X] Cambiar el chunk para hacerlo más inteligente --> Añadido Semantic Chunk [ ] Extraer de la mejor manera los datos de PDF [ ] Add metadata and selfquery retriever: https://medium.com/@lorevanoudenhove/enhancing-rag-performance-with-metadata-the-power-of-self-query-retrievers-e29d4eecdb73

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.env.example		.env.example
.gitignore		.gitignore
00_rag_openai_langchain_entire_text.ipynb		00_rag_openai_langchain_entire_text.ipynb
01_ rag_openai_langchain_pinecone_v2.ipynb		01_ rag_openai_langchain_pinecone_v2.ipynb
01b_ rag_multiquery_openai_langchain_pinecone_v2.ipynb		01b_ rag_multiquery_openai_langchain_pinecone_v2.ipynb
02_self_rag_openai_langchain_pinecone.ipynb		02_self_rag_openai_langchain_pinecone.ipynb
02b_self_rag_openai_langchain_pinecone_ppt.ipynb		02b_self_rag_openai_langchain_pinecone_ppt.ipynb
03_rag_self_corrective.ipynb		03_rag_self_corrective.ipynb
03_rag_self_reflection.ipynb		03_rag_self_reflection.ipynb
readme.md		readme.md
test.txt		test.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Estrategias de RAG de menor a mayor dificultad

00_rag_openai_entire

Links:

01_rag_openai_pinecone

Links de text splitting:

01_self_rag

Links:

Siguientes Pasos:

About

Releases

Packages

Languages

anllogu/rag_tests

Folders and files

Latest commit

History

Repository files navigation

Estrategias de RAG de menor a mayor dificultad

00_rag_openai_entire

Links:

01_rag_openai_pinecone

Links de text splitting:

01_self_rag

Links:

Siguientes Pasos:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages