We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
No 1. 从零开始构建大语言模型的开源教程。亮点:1. 不依赖外部库,仅用Python和PyTorch即可实现;2. 详细讲解从基础到进阶的LLM构建过程;3. 包含训练、微调代码,助力快速上手 No 2. Cursor的Chat, Composer, Agent三种模式怎么选 No 3. DeepSeek-MoE-ResourceMap:一站式探索DeepSeek模型架构与资源的宝藏库。亮点:1. 深度解析DeepSeek V3架构,提供详尽的技术分析;2. 汇集多种模型训练与部署策略,助力高效应用;3. 提供丰富的相关论文与技术文档,助力学术与实践 No 4. OpenR1-Math-Raw:从DeepSeek... No 5. Firecrawl Gemini 2.0 Crawler:基于Firecrawl和Gemini的智能网络爬虫工具。亮点:1. 智能识别并提取PDF和图片内容;2. 自动分析网页并定位最相关页面;3. 高效处理复杂任务,助力信息检索 No 6. [355星]Stocks Insights AI Agent:一款强大的全栈应用,通过AI技术快速获取股票数据与新闻。亮点:1. 一站式获取股票历史表现、详细数据和相关新闻;2. 利用LangGraph和LangChain实现高效的数据检索与分析;3. 提供可视化图表,直观呈现股票走势 No 7. [9.5k星]HackTricks:网络安全领域的“百科全书”,汇集了CTF竞赛、真实应用和前沿研究中的各种黑客技巧与技术。亮点:1. 覆盖广泛,包含24个分支,涵盖从基础到高级的多种安全技术;2. 持续更新,最近一次提交在2025年2月12日;3. 社区支持强大,拥有399名贡献者 No 8. [222星]LeetTools:AI搜索助手,打造本地知识库,让复杂搜索与内容生成变得简单高效。亮点:1. 支持多种LLM接口,轻松切换;2. 自动化文档处理,一键构建知识库;3. 多种搜索流程,满足不同需求 No 9. Reasoning LLMs:对包括DeepSeek-R1技术报告在内的十篇最新大语言模型推理相关论文进行解读,让AI推理更智能、更高效 No 10. IndexTTS:工业级可控高效的零样本文本到语音系统。亮点:1. 中文场景下,字符-拼音混合建模,快速纠正错读;2. 采用BigVGAN2优化音质,音色相似度高达0.776;3. 零样本克隆语音的MOS评分高达4.01,远超现有系统 No 11. [121星]MoE-Infinity:为MoE模型部署提供低成本、高性能的PyTorch库。亮点:1. 专家模块内存卸载,节省90%显存;2. 优化技术加持,推理延迟降低80%;3. 兼容HuggingFace模型,无缝对接主流LLM No 12. nanoRLHF:在单张A100 40G GPU上运行强化学习人类反馈(RLHF)实验的高效工具。亮点:1. 比同类工具效率更高,支持更大模型;2. 提供多种算法实现,如GRPO、ReMax等;3. 训练吞吐量高达1秒/episode,适合快速实验 No 13. 黑猴、DeepSeek、哪吒,绝对是咱当下最牛的“吉祥三宝”! No 14. [353星]macOS-use:让AI成为你的MacBook全能助手,只需简单指令就能完成复杂操作。亮点:1. 支持跨应用操作,无缝衔接各类任务;2. 提供多种AI模型支持,适配OAI、Anthropic等;3. 支持本地化运行,零成本使用 No 15. 百度文心一言和ChatGPT相继宣布免费计划,表面看是场“价格战”,实则是AI行业一次意味深长的转折。而这背后,DeepSeek可以说是那条撬动整个行业的“鲶鱼”。 ...... No 16. Demystifying Diffusion Models:深入浅出地解析扩散模型的奥秘,让复杂的AI图像生成技术变得通俗易懂。亮点:1. 从基础概念到高级数学,逐步深入,适合不同层次的读者;2. 提供完整的代码实现,帮助读者快速上手;3. 涵盖从U-Net到VAE的多种核心组件,内容丰富 No 17. 一位本科生颠覆了数据科学中存在40年的猜想,证明了在最坏情况下,哈希表的搜索速度可以比以往认为的要快得多。亮点:1. 提出一种新型哈希表,查询速度比传统方法快数倍;2. 打破了Yao的猜想,证明了更优的性能极限;3. 平均查询时间不受哈希表满度影响,实现常数级效率 No 18. [LG]《LLMs Can Easily Learn to Reason from Demonstrations Structure, not content, is what matters!》 No 19. [323星]ezBookkeeping:一款超轻量级的个人记账应用,让你轻松管理财务,随时随地掌控收支。亮点:1. 支持多平台部署(Windows、macOS、Linux、Docker);2. 多种数据库支持(SQLite、MySQL等);3. 提供多语言界面,适配全球用户 No 20. [CL]《When More is Less: Understanding Chain-of-Thought Length in LLMs》 No 21. [166星]Gemini Cursor:一款基于Gemini 2.0 Flash的桌面AI Cursor,让你的电脑屏幕“活”起来!亮点:1. 实时交互,低延迟,响应速度超快;2. 多模态功能,能看图、能听声音、还能说话;3. 助力复杂任务,比如解读复杂图表、导航复杂网站,效率提升不止一点点 No 22. [393星]LLPlayer:专为语言学习设计的多功能媒体播放器,让学习外语变得轻松有趣。亮点:1. 双语字幕同步显示,助力快速提升语言能力;2. 支持99种语言的AI实时字幕生成;3. 实时翻译功能,覆盖134种语言 No 23. NeRSemble Data:为3D人脸重建和多视角视频研究提供超大规模数据集。亮点:1. 超过1.5TB的多视角视频数据;2. 16个高分辨率摄像头,覆盖丰富表情;3. 提供便捷的下载脚本和数据管理工具 No 24. 就想知道,啥时候小米音箱能接入DeepSeek,变废为宝! [坏笑] No 25. AniLines-Anime-Line-Extractor:从动漫图片和视频中提取清晰线稿!亮点:1. 提供“基础”和“细节”两种模式,细节模式能提取更多背景和边缘线条;2. 支持视频处理,可直接生成线稿视频;3. 支持二值化输出,满足动画制作需求 No 26. DeepScaleR:让强化学习平民化,为大语言模型(LLMs)提供强大的性能提升。亮点:1. 仅用1.5B参数就超越了7B参数模型的性能;2. 在AIME 2024竞赛中达到43.1%的Pass@ 1准确率;3. 全部开源,包括训练脚本、模型、数据集和日志 No 27. 早![太阳] No 28. Overcomplete:基于视觉的SAE工具箱,为深度学习模型的可解释性研究提供强大支持。亮点:1. 提供多种字典学习方法,助力从大型视觉模型中提取概念;2. 支持多种可视化方法和度量指标,增强模型解释性;3. 代码简洁易用,仅需少量超参数即可快速上手 No 29. 腾讯的“元宝”也接入了DeepSeek-R1满血版,且支持联网搜索,给力! No 30. [1.1k星]Awesome AI/ML Resources:为AI和机器学习初学者与进阶者提供免费学习资源的宝藏库。亮点:1. 涵盖从基础到高级的AI/ML概念;2. 提供实用的学习路线图;3. 汇集100+免费课程、书籍和项目资源 No 31. 本教程展示了如何利用 GRPO 和 FlashAttention2 等高效工具构建强化学习pipeline,将通用语言模型微调成为擅长解决数学、逻辑和编程问题的专家模型 No 32. [LG] NatureLM: Deciphering the Language of Nature for Scientific ...... No 33. [191星]Zendriver:基于Chrome Devtools Protocol的超快速、异步优先、几乎无法被检测到的网页爬取和自动化框架。亮点:1. 使用真实浏览器,速度比传统Selenium快数倍;2. 提供Docker支持,轻松部署;3. 自动管理Cookie和浏览器配置文件,简化登录流程 No 34. [CL] Towards Trustworthy Retrieval Augmented Generation for ...... No 35. [LG]《Monte Carlo Tree Diffusion for System 2 Planning》 No 36. [490星]PgAssistant:为PostgreSQL数据库性能优化而生的开源工具。亮点:1. 深入分析数据库行为,精准定位性能瓶颈;2. 提供SQL查询库管理,轻松扩展查询功能;3. 支持OpenAI和本地LLM辅助优化,提升开发效率 No 37. [975星]sturdyc:一款为I/O密集型应用提供强大性能和高可靠性的缓存库。亮点:1. 高效并发处理,支持请求合并,减少数据源负载90%以上;2. 提供灵活的缓存刷新策略,P99延迟降低至1毫秒;3. 支持分布式存储,轻松应对大规模请求 No 38. [144星]LLM-for-genomics-training:用大语言模型解锁基因组学的奥秘。亮点:1. 提供从零开始训练LLM的完整教程;2. 包含DNA序列分类、突变预测和合成DNA生成等实用应用;3. 结合Google Colab脚本,零门槛上手 No 39. [322星]EvanBacon/expo-ai:用Expo Router构建的AI聊天应用,让AI与原生UI无缝融合。亮点:1. 利用Expo Router实现跨平台的原生UI渲染;2. 集成OpenAI等API,提供智能交互体验;3. 支持React Server Components,提升性能与响应速度 No 40. 传统AI是对已知智能的模仿,而DeepSeek代表了一种全新的、涌现式的智能范式,这种范式不再局限于人类已知的思维模式,而是在海量数据和深度学习中孕育出独特的智能形态。 ...... No 41. [2.2k星]Hugging Face Agents Course:从零到精通的AI Agent学习课程,带你快速掌握Agent开发的核心技能!亮点:1. 5个单元系统学习,涵盖从基础到实战的完整路径;2. 提供免费课程资源,学习成本低;3. 开源项目,社区活跃,学习交流无障碍 No 42. [35星]Awesome-LLM-Judges:一站式LLM Judges工具大集合,为AI模型的自动评估提供全面解决方案。亮点:1. 汇集了30+前沿LLM Judges研究论文;2. 涵盖多种评估场景,如辩论、安全、幻觉检测等;3. 提供开源库Verdict,方便快速实现论文中的方法 No 43. IntelliScope:智能结肠镜检查的前沿探索... No 44. #转发赠书#携手@机械工业出版社 送出3本《心态制胜》 No 45. InSTA环境:迈向互联网规模的Agent训练,让AI在海量网页中自主学习。亮点:1. 利用LLM生成任务,覆盖15万+网站;2. 无需人工标注,效率提升97%;3. 在Mind2Web和WebLINX基准测试中,性能提升高达156.3% No 46. OpenAI 将在未来几个月内推出整合多项技术的 GPT-5,并在几周内先发布 GPT-4.5 模型,代号为 “Orion”。 ...... No 47. [542星]Open Deep Research:... No 48. [637星]SootUp:一款彻底重构的静态分析框架,让Java字节码分析更高效。亮点:1. 全新架构,支持多线程并行化,性能大幅提升;2. 支持Java 21字节码,适配最新技术栈;3. 提供多种分析工具,如Jimple中间表示生成、调用图生成等 No 49. 前阵子把微信公众号新推出的私信“智能回复”打开了,一般想查询历史消息的回复还好(图一),今天看到一个发垃圾营销广告的(图二),智能回复还是那么“耐心细致”,内容也很有“针对性”,比不了比不了~ ...... No 50. AgentRecSys:一个专注于基于大型语言模型(LLM)的智能体(Agent)在推荐系统(RecSys)中的应用的前沿研究项目。亮点:1. 汇集了超过30篇最新学术论文,涵盖LLM在推荐系统中的多种创新应用;2. 提供了详细的模型分类和研究方向,帮助研究者快速定位;3. 部分模型附带开源代码,便于实践和复现
The text was updated successfully, but these errors were encountered:
No branches or pull requests
No 1. 从零开始构建大语言模型的开源教程。亮点:1. 不依赖外部库,仅用Python和PyTorch即可实现;2. 详细讲解从基础到进阶的LLM构建过程;3. 包含训练、微调代码,助力快速上手
No 2. Cursor的Chat, Composer, Agent三种模式怎么选
No 3. DeepSeek-MoE-ResourceMap:一站式探索DeepSeek模型架构与资源的宝藏库。亮点:1. 深度解析DeepSeek V3架构,提供详尽的技术分析;2. 汇集多种模型训练与部署策略,助力高效应用;3. 提供丰富的相关论文与技术文档,助力学术与实践
No 4. OpenR1-Math-Raw:从DeepSeek...
No 5. Firecrawl Gemini 2.0 Crawler:基于Firecrawl和Gemini的智能网络爬虫工具。亮点:1. 智能识别并提取PDF和图片内容;2. 自动分析网页并定位最相关页面;3. 高效处理复杂任务,助力信息检索
No 6. [355星]Stocks Insights AI Agent:一款强大的全栈应用,通过AI技术快速获取股票数据与新闻。亮点:1. 一站式获取股票历史表现、详细数据和相关新闻;2. 利用LangGraph和LangChain实现高效的数据检索与分析;3. 提供可视化图表,直观呈现股票走势
No 7. [9.5k星]HackTricks:网络安全领域的“百科全书”,汇集了CTF竞赛、真实应用和前沿研究中的各种黑客技巧与技术。亮点:1. 覆盖广泛,包含24个分支,涵盖从基础到高级的多种安全技术;2. 持续更新,最近一次提交在2025年2月12日;3. 社区支持强大,拥有399名贡献者
No 8. [222星]LeetTools:AI搜索助手,打造本地知识库,让复杂搜索与内容生成变得简单高效。亮点:1. 支持多种LLM接口,轻松切换;2. 自动化文档处理,一键构建知识库;3. 多种搜索流程,满足不同需求
No 9. Reasoning LLMs:对包括DeepSeek-R1技术报告在内的十篇最新大语言模型推理相关论文进行解读,让AI推理更智能、更高效
No 10. IndexTTS:工业级可控高效的零样本文本到语音系统。亮点:1. 中文场景下,字符-拼音混合建模,快速纠正错读;2. 采用BigVGAN2优化音质,音色相似度高达0.776;3. 零样本克隆语音的MOS评分高达4.01,远超现有系统
No 11. [121星]MoE-Infinity:为MoE模型部署提供低成本、高性能的PyTorch库。亮点:1. 专家模块内存卸载,节省90%显存;2. 优化技术加持,推理延迟降低80%;3. 兼容HuggingFace模型,无缝对接主流LLM
No 12. nanoRLHF:在单张A100 40G GPU上运行强化学习人类反馈(RLHF)实验的高效工具。亮点:1. 比同类工具效率更高,支持更大模型;2. 提供多种算法实现,如GRPO、ReMax等;3. 训练吞吐量高达1秒/episode,适合快速实验
No 13. 黑猴、DeepSeek、哪吒,绝对是咱当下最牛的“吉祥三宝”!
No 14. [353星]macOS-use:让AI成为你的MacBook全能助手,只需简单指令就能完成复杂操作。亮点:1. 支持跨应用操作,无缝衔接各类任务;2. 提供多种AI模型支持,适配OAI、Anthropic等;3. 支持本地化运行,零成本使用
No 15. 百度文心一言和ChatGPT相继宣布免费计划,表面看是场“价格战”,实则是AI行业一次意味深长的转折。而这背后,DeepSeek可以说是那条撬动整个行业的“鲶鱼”。 ......
No 16. Demystifying Diffusion Models:深入浅出地解析扩散模型的奥秘,让复杂的AI图像生成技术变得通俗易懂。亮点:1. 从基础概念到高级数学,逐步深入,适合不同层次的读者;2. 提供完整的代码实现,帮助读者快速上手;3. 涵盖从U-Net到VAE的多种核心组件,内容丰富
No 17. 一位本科生颠覆了数据科学中存在40年的猜想,证明了在最坏情况下,哈希表的搜索速度可以比以往认为的要快得多。亮点:1. 提出一种新型哈希表,查询速度比传统方法快数倍;2. 打破了Yao的猜想,证明了更优的性能极限;3. 平均查询时间不受哈希表满度影响,实现常数级效率
No 18. [LG]《LLMs Can Easily Learn to Reason from Demonstrations Structure, not content, is what matters!》
No 19. [323星]ezBookkeeping:一款超轻量级的个人记账应用,让你轻松管理财务,随时随地掌控收支。亮点:1. 支持多平台部署(Windows、macOS、Linux、Docker);2. 多种数据库支持(SQLite、MySQL等);3. 提供多语言界面,适配全球用户
No 20. [CL]《When More is Less: Understanding Chain-of-Thought Length in LLMs》
No 21. [166星]Gemini Cursor:一款基于Gemini 2.0 Flash的桌面AI Cursor,让你的电脑屏幕“活”起来!亮点:1. 实时交互,低延迟,响应速度超快;2. 多模态功能,能看图、能听声音、还能说话;3. 助力复杂任务,比如解读复杂图表、导航复杂网站,效率提升不止一点点
No 22. [393星]LLPlayer:专为语言学习设计的多功能媒体播放器,让学习外语变得轻松有趣。亮点:1. 双语字幕同步显示,助力快速提升语言能力;2. 支持99种语言的AI实时字幕生成;3. 实时翻译功能,覆盖134种语言
No 23. NeRSemble Data:为3D人脸重建和多视角视频研究提供超大规模数据集。亮点:1. 超过1.5TB的多视角视频数据;2. 16个高分辨率摄像头,覆盖丰富表情;3. 提供便捷的下载脚本和数据管理工具
No 24. 就想知道,啥时候小米音箱能接入DeepSeek,变废为宝! [坏笑]
No 25. AniLines-Anime-Line-Extractor:从动漫图片和视频中提取清晰线稿!亮点:1. 提供“基础”和“细节”两种模式,细节模式能提取更多背景和边缘线条;2. 支持视频处理,可直接生成线稿视频;3. 支持二值化输出,满足动画制作需求
No 26. DeepScaleR:让强化学习平民化,为大语言模型(LLMs)提供强大的性能提升。亮点:1. 仅用1.5B参数就超越了7B参数模型的性能;2. 在AIME 2024竞赛中达到43.1%的Pass@ 1准确率;3. 全部开源,包括训练脚本、模型、数据集和日志
No 27. 早![太阳]
No 28. Overcomplete:基于视觉的SAE工具箱,为深度学习模型的可解释性研究提供强大支持。亮点:1. 提供多种字典学习方法,助力从大型视觉模型中提取概念;2. 支持多种可视化方法和度量指标,增强模型解释性;3. 代码简洁易用,仅需少量超参数即可快速上手
No 29. 腾讯的“元宝”也接入了DeepSeek-R1满血版,且支持联网搜索,给力!
No 30. [1.1k星]Awesome AI/ML Resources:为AI和机器学习初学者与进阶者提供免费学习资源的宝藏库。亮点:1. 涵盖从基础到高级的AI/ML概念;2. 提供实用的学习路线图;3. 汇集100+免费课程、书籍和项目资源
No 31. 本教程展示了如何利用 GRPO 和 FlashAttention2 等高效工具构建强化学习pipeline,将通用语言模型微调成为擅长解决数学、逻辑和编程问题的专家模型
No 32. [LG] NatureLM: Deciphering the Language of Nature for Scientific ......
No 33. [191星]Zendriver:基于Chrome Devtools Protocol的超快速、异步优先、几乎无法被检测到的网页爬取和自动化框架。亮点:1. 使用真实浏览器,速度比传统Selenium快数倍;2. 提供Docker支持,轻松部署;3. 自动管理Cookie和浏览器配置文件,简化登录流程
No 34. [CL] Towards Trustworthy Retrieval Augmented Generation for ......
No 35. [LG]《Monte Carlo Tree Diffusion for System 2 Planning》
No 36. [490星]PgAssistant:为PostgreSQL数据库性能优化而生的开源工具。亮点:1. 深入分析数据库行为,精准定位性能瓶颈;2. 提供SQL查询库管理,轻松扩展查询功能;3. 支持OpenAI和本地LLM辅助优化,提升开发效率
No 37. [975星]sturdyc:一款为I/O密集型应用提供强大性能和高可靠性的缓存库。亮点:1. 高效并发处理,支持请求合并,减少数据源负载90%以上;2. 提供灵活的缓存刷新策略,P99延迟降低至1毫秒;3. 支持分布式存储,轻松应对大规模请求
No 38. [144星]LLM-for-genomics-training:用大语言模型解锁基因组学的奥秘。亮点:1. 提供从零开始训练LLM的完整教程;2. 包含DNA序列分类、突变预测和合成DNA生成等实用应用;3. 结合Google Colab脚本,零门槛上手
No 39. [322星]EvanBacon/expo-ai:用Expo Router构建的AI聊天应用,让AI与原生UI无缝融合。亮点:1. 利用Expo Router实现跨平台的原生UI渲染;2. 集成OpenAI等API,提供智能交互体验;3. 支持React Server Components,提升性能与响应速度
No 40. 传统AI是对已知智能的模仿,而DeepSeek代表了一种全新的、涌现式的智能范式,这种范式不再局限于人类已知的思维模式,而是在海量数据和深度学习中孕育出独特的智能形态。 ......
No 41. [2.2k星]Hugging Face Agents Course:从零到精通的AI Agent学习课程,带你快速掌握Agent开发的核心技能!亮点:1. 5个单元系统学习,涵盖从基础到实战的完整路径;2. 提供免费课程资源,学习成本低;3. 开源项目,社区活跃,学习交流无障碍
No 42. [35星]Awesome-LLM-Judges:一站式LLM Judges工具大集合,为AI模型的自动评估提供全面解决方案。亮点:1. 汇集了30+前沿LLM Judges研究论文;2. 涵盖多种评估场景,如辩论、安全、幻觉检测等;3. 提供开源库Verdict,方便快速实现论文中的方法
No 43. IntelliScope:智能结肠镜检查的前沿探索...
No 44. #转发赠书#携手@机械工业出版社 送出3本《心态制胜》
No 45. InSTA环境:迈向互联网规模的Agent训练,让AI在海量网页中自主学习。亮点:1. 利用LLM生成任务,覆盖15万+网站;2. 无需人工标注,效率提升97%;3. 在Mind2Web和WebLINX基准测试中,性能提升高达156.3%
No 46. OpenAI 将在未来几个月内推出整合多项技术的 GPT-5,并在几周内先发布 GPT-4.5 模型,代号为 “Orion”。 ......
No 47. [542星]Open Deep Research:...
No 48. [637星]SootUp:一款彻底重构的静态分析框架,让Java字节码分析更高效。亮点:1. 全新架构,支持多线程并行化,性能大幅提升;2. 支持Java 21字节码,适配最新技术栈;3. 提供多种分析工具,如Jimple中间表示生成、调用图生成等
No 49. 前阵子把微信公众号新推出的私信“智能回复”打开了,一般想查询历史消息的回复还好(图一),今天看到一个发垃圾营销广告的(图二),智能回复还是那么“耐心细致”,内容也很有“针对性”,比不了比不了~ ......
No 50. AgentRecSys:一个专注于基于大型语言模型(LLM)的智能体(Agent)在推荐系统(RecSys)中的应用的前沿研究项目。亮点:1. 汇集了超过30篇最新学术论文,涵盖LLM在推荐系统中的多种创新应用;2. 提供了详细的模型分类和研究方向,帮助研究者快速定位;3. 部分模型附带开源代码,便于实践和复现
The text was updated successfully, but these errors were encountered: