We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
No 1. 最新完整RAG 实现流程:从基础知识到高级功能 No 2. [447星]DeepSeek-RAG-Chatbo... No 3. 2025 LLM 入门+进阶路线图 by Sebastian Raschka No 4. Understanding GPU Architecture:康奈尔“理解GPU架构”课程,为初学者提供深入浅出的GPU架构学习路径。亮点:1. 从基础到进阶,涵盖GPU特性、内存、实例分析;2. 提供标准NVIDIA样例程序,无需并行编程经验;3. 专为GPGPU开发设计,助力高效计算 No 5. [383星]Deepdive-llama3-from-scratch:从零开始实现Llama3推理,带你深入理解模型核心原理。亮点:1. 从头实现Llama3推理,代码详细注释,零基础也能轻松上手;2. 详细推导模型过程,不仅知其然,更知其所以然;3. 提供中英文双语文档,避免翻译误差,学习无障碍 No 6. (免费书)优化算法:一本关于优化算法的书籍,涵盖了... No 7. [3.5k星]Bananas Screen Sharing:跨平台屏幕共享从未如此简单!Bananas通过点对点连接,无需账号和服务器即可轻松共享屏幕,让远程协作和演示变得轻而易举。亮点:1. 支持Mac、Windows和Linux多平台;2. 无需账号,零配置;3. 多光标支持,协作更高效 No 8. Vector Calculus:免费的多变量微积分教材,为完成单变量微积分课程的学生提供全面深入的学习资源。亮点:1. 覆盖传统多变量微积分所有主题,包括向量代数、多元函数、多重积分等;2. 包含420道练习题及部分答案;3. 提供Java、MATLAB/Octave和Sage代码示例,助力实践学习 No 9. Namo-R1:一款仅需CPU即可实时运行的500M参数视觉语言模型,轻松超越Moondream2和SmolVLM。亮点:1. CPU友好,无需GPU即可快速运行;2. 500M参数却能实现多语言OCR、图像描述等复杂任务;3. 完全开源,训练脚本和数据一应俱全 No 10. 随机微积分入门:用直观和易懂的方式带你走进随机微积分的世界!亮点:1. 避免复杂的概率论形式主义,专注于物理直觉和推导;2. 丰富的可视化内容,包括3D动画和随机过程模拟;3. 从离散到连续的过渡,帮助初学者更好地理解布朗运动和伊藤微积分 No 11. LLM Data Scrapers:为LLM训练和推理提供开源数据抓取工具的宝藏清单。亮点:1. 汇集了9种开源工具,覆盖代码、网页、PDF等多种数据源;2. 简化数据收集流程,助力高效训练;3. 提供从网页到结构化数据的直接转换 No 12. [80星]r1-ktransformers-guide:让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点:1. 性能提升近2倍,比llama.cpp更快;2. 支持多GPU和内存映射,灵活适配不同硬件;3. 优化配置丰富,轻松实现高效推理 No 13. [103星]Baichuan-M1-14B:百川智能开发的首个专为医疗场景优化的开源大语言模型,助力医疗领域智能化升级。亮点:1. 20万亿token高质量数据训练,性能卓越;2. 医疗推理能力提升5倍,精准高效;3. 创新模型结构,长序列任务表现更出色 No 14. [121星]Deep Research:一个多智能体AI研究系统,帮助研究者高效开展研究并精准定位知识盲区。亮点:1. 能识别自身知识边界,精准规划研究路径;2. 智能评估研究质量,提供详细质量指标;3. 结合多种AI工具,提升研究效率 No 15. [455星]Markdownify MCP:将几乎所有内容轻松转换为Markdown格式的神器!亮点:1. 支持多种文件类型,包括PDF、音频、图片等;2. 轻松将网页内容(如YouTube视频、Bing搜索结果)转为Markdown;3. 开箱即用,简单几步即可启动 No 16. [2.8k星]WhoDB:下一代轻量级数据探索工具,用自然语言与数据库对话,告别复杂SQL!亮点:1. 支持多种数据库,涵盖Postgres、MySQL、MongoDB等8种主流数据库;2. 交互式界面,轻松可视化数据库架构;3. 轻量级设计,仅20MB,性能卓越 No 17. [30k星]SiYuan:一款隐私优先、自托管、开源的知识管理软件,帮助你高效整理和管理个人知识。亮点:1. 支持块级引用和双向链接,让知识关联更紧密;2. 提供Markdown WYSIWYG编辑器,支持百万字级大文档编辑;3. 拥有强大的数据库功能,支持SQL查询嵌入 No 18. [1.5M+问题,268k+思维链] General Reasoning:为开放模型训练提供海量推理数据的平台。亮点:1. 涵盖数学、医学、化学等10大领域,超156万问题;2. 提供26.8万条思维链,助力模型深度学习;3. 持续更新,覆盖竞赛、学术、工程等多场景 No 19. [567星]Fluent-M3U8:跨平台的M3U8/MPD下载神器,让视频下载变得轻松又高效。亮点:1. 完全兼容M3U8和MPD视频下载;2. 多线程下载,速度提升高达数倍;3. 界面简洁美观,操作简单易上手 No 20. [15.3k星]PandasAI:用自然语言与数据对话,让数据分析变得轻松又高效。亮点:1. 支持多种数据格式(SQL、CSV、Parquet);2. 通过LLMs和RAG技术实现交互式数据分析;3. 提供Docker沙箱,确保代码执行安全 No 21. [1.7k星]best-system-design-resources:为系统设计面试和学习提供一站式资源宝库。亮点:1. 汇集100+系统设计面试问题和实践案例;2. 推荐多门高评分在线课程,助力快速上手;3. 提供多份系统设计面试作弊表,复习要点一目了然 No 22. Awesome-MLLM-Datasets:为多模态大模型训练提供一站式数据集资源库。亮点:1. 涵盖预训练、指令微调和上下文学习等多种数据集;2. 收录超过50个高质量数据集,覆盖图像、文本、视频等多种模态;3. 为研究人员提供便捷的数据资源,助力多模态AI系统开发 No 23. [111星]graphrag-practice-chinese:让GraphRAG更懂中文!亮点:1. 提供替换OpenAI模型的方法,更适合中文处理;2. 优化文档切分策略,避免中文乱码;3. 使用中文提示词,让模型输出更自然 No 24. 为Python开发者提供CUDA编程入门指南,助力高效利用GPU加速深度学习任务。亮点:1. 通俗易懂的CUDA入门教程,适合Python背景开发者;2. 深入讲解GPU架构与性能优化,提升模型效率;3. 提供PyTorch与CUDA融合示例,加速模型训练 No 25. [141星]LangMem:让AI Agent能从对话中学习和适应,持续优化自身行为。亮点:1. 提供核心记忆API,兼容任何存储系统;2. 自动提取、整合和更新知识;3. 与LangGraph的长期记忆存储层深度集成 No 26. [210星]AI-Wechat-Bot:将AI产品接入微信,打造个人AI助理,解决生活日常问题。亮点:1. 支持多种AI产品接入,功能强大;2. 简单易用,扫码登录即可使用;3. 提供丰富的API接口,支持二次开发 No 27. LLM时代产品设计的趋势转变 No 28. 早![太阳] No 29. [289星]Native Sparse Attention:高效实现原生稀疏注意力的Triton代码库。亮点:1. 硬件对齐优化,性能大幅提升;2. 支持动态选择稀疏块,灵活性强;3. 比FlashAttention更快,性能提升高达数倍 No 30. [150星]Zotero-arxiv-workflow:为Zotero用户管理arXiv论文提供高效解决方案。亮点:1. 自动合并arXiv预印本和期刊发表版本;2. 一键更新arXiv论文的最新信息和PDF;3. 自定义默认打开的PDF版本 No 31. Kura:基于语言模型的用户行为分析工具,帮助你深入理解用户行为而不泄露个人隐私。亮点:1. 递归聚类,将用户行为分层归类;2. 支持自定义元数据提取,满足个性化需求;3. 开源实现,可自由应用于各类数据 No 32. Copier-uv:为Python项目提供高效、现代化的项目模板管理工具。亮点:1. 集成uv工具,简化项目配置;2. 自动化生成CHANGELOG,节省时间;3. 支持多种开发工具,提升开发效率 No 33. ]LeKiwi:低成本移动操作机器人,让机器人开发更亲民、更高效。亮点:1. 仅需12V 5A锂电池或65W充电宝即可供电;2. 3D打印部件,大幅降低成本;3. 配备双摄像头,实现精准操作 No 34. SmolLens:用SmolVLM 2实现的视觉智能应用,让手机摄像头秒变智能识别工具。亮点:1. 基于Hugging Face的强大视觉语言模型;2. 实时图像识别,快速获取信息;3. 开源项目,易于扩展和定制 No 35. [261星] Orate:AI语音工具包,让语音合成与转录变得前所未有的简单。亮点:1. 与OpenAI、ElevenLabs等顶级AI提供商无缝对接;2. 统一API,轻松实现文本转语音和语音转文本 No 36. [1.1k星]Puppeteer Real Browser:让Puppeteer像真实浏览器一样运行,轻松绕过Cloudflare等反爬虫检测。亮点:1. 成功绕过Cloudflare等复杂反爬机制;2. 提供真实浏览器行为模拟,避免被检测为机器人;3. 支持多种插件扩展,灵活应对不同需求 No 37. [LG]《Scaling Test-Time Compute Without Verification or RL is Suboptimal》 No 38. [37星]dpo-prefix-sharing:让DPO训练速度飞起来的黑科技!亮点:1. 无需牺牲精度,加速效果显著,最高可达1.41倍;2. 优化多轮对话和总结任务,效果立竿见影;3. 支持多种模型,适配性强 No 39. [185星]CM6_COBOT_ROBOT:一款开源的六轴协作机械臂,为机器人爱好者和研究人员提供了低成本、高性能的实验平台。亮点:1. 采用模块化设计,易于组装和修改;2. 使用Spectral微驱动器,成本低且软件支持好;3. 提供详细的组装手册和开源代码,助力快速上手 No 40. [LG]《Automated Hypothesis Validation with Agentic Sequential Falsifications》 No 41. [93星]Robopoker:一款用Rust编写的德州扑克AI工具,能帮助玩家学习、分析和解决无限制德州扑克问题。亮点:1. 基于蒙特卡洛反事实遗憾最小化算法,智能决策;2. 支持层级K均值聚类,高效处理复杂牌局;3. 性能卓越,手牌评估速度超快,比传统算法快数倍 No 42. [3.4k星]FlashMLA:为Hopper GPU优化的高效MLA解码内核,让变长序列服务变得飞快!亮点:1. 支持BF16格式,性能更优;2. 页式缓存,块大小达64,高效利用内存;3. 在H800 SXM5上实现高达3000 GB/s的内存带宽和580 TFLOPS的计算性能 No 43. 晚安~ [月亮] No 44. Video-R1:为视频理解带来超强推理能力的多模态大模型。亮点:1. 首次在视频理解领域实现准确率和推理长度的双重提升;2. 使用7B参数模型,训练900步仅需10小时;3. 强推理数据集助力深度思考能力的涌现 No 45. [LG]《Monte Carlo Tree Diffusion for System 2 Planning》 No 46. [165星]wild-card-ai/agents... No 47. SanDisk推出了一种名为High-Bandwi... No 48. Scira:一个极简主义的AI驱动搜索引擎,帮你快速找到互联网上的信息。亮点:1. 支持多种AI模型(如Grok 2.0);2. 集成Web搜索、天气查询、编程辅助等多功能;3. 支持本地部署,可自定义性强 No 49. [666星]GitBase:一个基于GitHub的简单网站框架,无需传统数据库即可搭建动态网站。亮点:1. 利用GitHub作为内容管理系统,无缝管理网站内容;2. 动态渲染内容,支持Markdown格式,方便编辑与版本控制;3. 一键部署到Vercel,轻松上线 No 50. [540星]AgentQL:AI驱动的网页查询语言,让数据抓取和自动化任务变得简单高效。亮点:1. 使用自然语言选择器,轻松定位网页数据;2. 查询自愈功能,UI变化也不怕;3. 支持跨站点查询,效率提升显著
The text was updated successfully, but these errors were encountered:
No branches or pull requests
No 1. 最新完整RAG 实现流程:从基础知识到高级功能
No 2. [447星]DeepSeek-RAG-Chatbo...
No 3. 2025 LLM 入门+进阶路线图 by Sebastian Raschka
No 4. Understanding GPU Architecture:康奈尔“理解GPU架构”课程,为初学者提供深入浅出的GPU架构学习路径。亮点:1. 从基础到进阶,涵盖GPU特性、内存、实例分析;2. 提供标准NVIDIA样例程序,无需并行编程经验;3. 专为GPGPU开发设计,助力高效计算
No 5. [383星]Deepdive-llama3-from-scratch:从零开始实现Llama3推理,带你深入理解模型核心原理。亮点:1. 从头实现Llama3推理,代码详细注释,零基础也能轻松上手;2. 详细推导模型过程,不仅知其然,更知其所以然;3. 提供中英文双语文档,避免翻译误差,学习无障碍
No 6. (免费书)优化算法:一本关于优化算法的书籍,涵盖了...
No 7. [3.5k星]Bananas Screen Sharing:跨平台屏幕共享从未如此简单!Bananas通过点对点连接,无需账号和服务器即可轻松共享屏幕,让远程协作和演示变得轻而易举。亮点:1. 支持Mac、Windows和Linux多平台;2. 无需账号,零配置;3. 多光标支持,协作更高效
No 8. Vector Calculus:免费的多变量微积分教材,为完成单变量微积分课程的学生提供全面深入的学习资源。亮点:1. 覆盖传统多变量微积分所有主题,包括向量代数、多元函数、多重积分等;2. 包含420道练习题及部分答案;3. 提供Java、MATLAB/Octave和Sage代码示例,助力实践学习
No 9. Namo-R1:一款仅需CPU即可实时运行的500M参数视觉语言模型,轻松超越Moondream2和SmolVLM。亮点:1. CPU友好,无需GPU即可快速运行;2. 500M参数却能实现多语言OCR、图像描述等复杂任务;3. 完全开源,训练脚本和数据一应俱全
No 10. 随机微积分入门:用直观和易懂的方式带你走进随机微积分的世界!亮点:1. 避免复杂的概率论形式主义,专注于物理直觉和推导;2. 丰富的可视化内容,包括3D动画和随机过程模拟;3. 从离散到连续的过渡,帮助初学者更好地理解布朗运动和伊藤微积分
No 11. LLM Data Scrapers:为LLM训练和推理提供开源数据抓取工具的宝藏清单。亮点:1. 汇集了9种开源工具,覆盖代码、网页、PDF等多种数据源;2. 简化数据收集流程,助力高效训练;3. 提供从网页到结构化数据的直接转换
No 12. [80星]r1-ktransformers-guide:让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点:1. 性能提升近2倍,比llama.cpp更快;2. 支持多GPU和内存映射,灵活适配不同硬件;3. 优化配置丰富,轻松实现高效推理
No 13. [103星]Baichuan-M1-14B:百川智能开发的首个专为医疗场景优化的开源大语言模型,助力医疗领域智能化升级。亮点:1. 20万亿token高质量数据训练,性能卓越;2. 医疗推理能力提升5倍,精准高效;3. 创新模型结构,长序列任务表现更出色
No 14. [121星]Deep Research:一个多智能体AI研究系统,帮助研究者高效开展研究并精准定位知识盲区。亮点:1. 能识别自身知识边界,精准规划研究路径;2. 智能评估研究质量,提供详细质量指标;3. 结合多种AI工具,提升研究效率
No 15. [455星]Markdownify MCP:将几乎所有内容轻松转换为Markdown格式的神器!亮点:1. 支持多种文件类型,包括PDF、音频、图片等;2. 轻松将网页内容(如YouTube视频、Bing搜索结果)转为Markdown;3. 开箱即用,简单几步即可启动
No 16. [2.8k星]WhoDB:下一代轻量级数据探索工具,用自然语言与数据库对话,告别复杂SQL!亮点:1. 支持多种数据库,涵盖Postgres、MySQL、MongoDB等8种主流数据库;2. 交互式界面,轻松可视化数据库架构;3. 轻量级设计,仅20MB,性能卓越
No 17. [30k星]SiYuan:一款隐私优先、自托管、开源的知识管理软件,帮助你高效整理和管理个人知识。亮点:1. 支持块级引用和双向链接,让知识关联更紧密;2. 提供Markdown WYSIWYG编辑器,支持百万字级大文档编辑;3. 拥有强大的数据库功能,支持SQL查询嵌入
No 18. [1.5M+问题,268k+思维链] General Reasoning:为开放模型训练提供海量推理数据的平台。亮点:1. 涵盖数学、医学、化学等10大领域,超156万问题;2. 提供26.8万条思维链,助力模型深度学习;3. 持续更新,覆盖竞赛、学术、工程等多场景
No 19. [567星]Fluent-M3U8:跨平台的M3U8/MPD下载神器,让视频下载变得轻松又高效。亮点:1. 完全兼容M3U8和MPD视频下载;2. 多线程下载,速度提升高达数倍;3. 界面简洁美观,操作简单易上手
No 20. [15.3k星]PandasAI:用自然语言与数据对话,让数据分析变得轻松又高效。亮点:1. 支持多种数据格式(SQL、CSV、Parquet);2. 通过LLMs和RAG技术实现交互式数据分析;3. 提供Docker沙箱,确保代码执行安全
No 21. [1.7k星]best-system-design-resources:为系统设计面试和学习提供一站式资源宝库。亮点:1. 汇集100+系统设计面试问题和实践案例;2. 推荐多门高评分在线课程,助力快速上手;3. 提供多份系统设计面试作弊表,复习要点一目了然
No 22. Awesome-MLLM-Datasets:为多模态大模型训练提供一站式数据集资源库。亮点:1. 涵盖预训练、指令微调和上下文学习等多种数据集;2. 收录超过50个高质量数据集,覆盖图像、文本、视频等多种模态;3. 为研究人员提供便捷的数据资源,助力多模态AI系统开发
No 23. [111星]graphrag-practice-chinese:让GraphRAG更懂中文!亮点:1. 提供替换OpenAI模型的方法,更适合中文处理;2. 优化文档切分策略,避免中文乱码;3. 使用中文提示词,让模型输出更自然
No 24. 为Python开发者提供CUDA编程入门指南,助力高效利用GPU加速深度学习任务。亮点:1. 通俗易懂的CUDA入门教程,适合Python背景开发者;2. 深入讲解GPU架构与性能优化,提升模型效率;3. 提供PyTorch与CUDA融合示例,加速模型训练
No 25. [141星]LangMem:让AI Agent能从对话中学习和适应,持续优化自身行为。亮点:1. 提供核心记忆API,兼容任何存储系统;2. 自动提取、整合和更新知识;3. 与LangGraph的长期记忆存储层深度集成
No 26. [210星]AI-Wechat-Bot:将AI产品接入微信,打造个人AI助理,解决生活日常问题。亮点:1. 支持多种AI产品接入,功能强大;2. 简单易用,扫码登录即可使用;3. 提供丰富的API接口,支持二次开发
No 27. LLM时代产品设计的趋势转变
No 28. 早![太阳]
No 29. [289星]Native Sparse Attention:高效实现原生稀疏注意力的Triton代码库。亮点:1. 硬件对齐优化,性能大幅提升;2. 支持动态选择稀疏块,灵活性强;3. 比FlashAttention更快,性能提升高达数倍
No 30. [150星]Zotero-arxiv-workflow:为Zotero用户管理arXiv论文提供高效解决方案。亮点:1. 自动合并arXiv预印本和期刊发表版本;2. 一键更新arXiv论文的最新信息和PDF;3. 自定义默认打开的PDF版本
No 31. Kura:基于语言模型的用户行为分析工具,帮助你深入理解用户行为而不泄露个人隐私。亮点:1. 递归聚类,将用户行为分层归类;2. 支持自定义元数据提取,满足个性化需求;3. 开源实现,可自由应用于各类数据
No 32. Copier-uv:为Python项目提供高效、现代化的项目模板管理工具。亮点:1. 集成uv工具,简化项目配置;2. 自动化生成CHANGELOG,节省时间;3. 支持多种开发工具,提升开发效率
No 33. ]LeKiwi:低成本移动操作机器人,让机器人开发更亲民、更高效。亮点:1. 仅需12V 5A锂电池或65W充电宝即可供电;2. 3D打印部件,大幅降低成本;3. 配备双摄像头,实现精准操作
No 34. SmolLens:用SmolVLM 2实现的视觉智能应用,让手机摄像头秒变智能识别工具。亮点:1. 基于Hugging Face的强大视觉语言模型;2. 实时图像识别,快速获取信息;3. 开源项目,易于扩展和定制
No 35. [261星] Orate:AI语音工具包,让语音合成与转录变得前所未有的简单。亮点:1. 与OpenAI、ElevenLabs等顶级AI提供商无缝对接;2. 统一API,轻松实现文本转语音和语音转文本
No 36. [1.1k星]Puppeteer Real Browser:让Puppeteer像真实浏览器一样运行,轻松绕过Cloudflare等反爬虫检测。亮点:1. 成功绕过Cloudflare等复杂反爬机制;2. 提供真实浏览器行为模拟,避免被检测为机器人;3. 支持多种插件扩展,灵活应对不同需求
No 37. [LG]《Scaling Test-Time Compute Without Verification or RL is Suboptimal》
No 38. [37星]dpo-prefix-sharing:让DPO训练速度飞起来的黑科技!亮点:1. 无需牺牲精度,加速效果显著,最高可达1.41倍;2. 优化多轮对话和总结任务,效果立竿见影;3. 支持多种模型,适配性强
No 39. [185星]CM6_COBOT_ROBOT:一款开源的六轴协作机械臂,为机器人爱好者和研究人员提供了低成本、高性能的实验平台。亮点:1. 采用模块化设计,易于组装和修改;2. 使用Spectral微驱动器,成本低且软件支持好;3. 提供详细的组装手册和开源代码,助力快速上手
No 40. [LG]《Automated Hypothesis Validation with Agentic Sequential Falsifications》
No 41. [93星]Robopoker:一款用Rust编写的德州扑克AI工具,能帮助玩家学习、分析和解决无限制德州扑克问题。亮点:1. 基于蒙特卡洛反事实遗憾最小化算法,智能决策;2. 支持层级K均值聚类,高效处理复杂牌局;3. 性能卓越,手牌评估速度超快,比传统算法快数倍
No 42. [3.4k星]FlashMLA:为Hopper GPU优化的高效MLA解码内核,让变长序列服务变得飞快!亮点:1. 支持BF16格式,性能更优;2. 页式缓存,块大小达64,高效利用内存;3. 在H800 SXM5上实现高达3000 GB/s的内存带宽和580 TFLOPS的计算性能
No 43. 晚安~ [月亮]
No 44. Video-R1:为视频理解带来超强推理能力的多模态大模型。亮点:1. 首次在视频理解领域实现准确率和推理长度的双重提升;2. 使用7B参数模型,训练900步仅需10小时;3. 强推理数据集助力深度思考能力的涌现
No 45. [LG]《Monte Carlo Tree Diffusion for System 2 Planning》
No 46. [165星]wild-card-ai/agents...
No 47. SanDisk推出了一种名为High-Bandwi...
No 48. Scira:一个极简主义的AI驱动搜索引擎,帮你快速找到互联网上的信息。亮点:1. 支持多种AI模型(如Grok 2.0);2. 集成Web搜索、天气查询、编程辅助等多功能;3. 支持本地部署,可自定义性强
No 49. [666星]GitBase:一个基于GitHub的简单网站框架,无需传统数据库即可搭建动态网站。亮点:1. 利用GitHub作为内容管理系统,无缝管理网站内容;2. 动态渲染内容,支持Markdown格式,方便编辑与版本控制;3. 一键部署到Vercel,轻松上线
No 50. [540星]AgentQL:AI驱动的网页查询语言,让数据抓取和自动化任务变得简单高效。亮点:1. 使用自然语言选择器,轻松定位网页数据;2. 查询自愈功能,UI变化也不怕;3. 支持跨站点查询,效率提升显著
The text was updated successfully, but these errors were encountered: