We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
No 1. [323星]LLMs-from-scratch-CN:从零构建大模型的中文翻译项目,助力中文学习者深入理解大语言模型的构建与实践。亮点:1. 详细中文注释的Jupyter代码,快速上手;2. 提供丰富的附加学习材料,拓展知识边界;3. 适配国内学习习惯,优化翻译表达 No 2. Andrej Karpathy:我们正处在一个新的计算范式转变的开端,LLM将成为新的CPU,这个转变堪比上世纪80年代的个人电脑革命 No 3. [238星]Prompt Optimizer:一个强大的提示词优化工具,帮助你一键提升AI回复的准确度。亮点:1. 支持多轮智能优化,显著提升AI回答质量;2. 集成OpenAI、Gemini等主流AI模型,满足多样化需求;3. 纯客户端处理,数据安全无忧 No 4. #转发抽奖[超话]# 转发抽三本@图灵文化 的《走进具身智能》 No 5. [109星]LangGraph Swarm Py:用Python搭建智能多Agent协作系统,让AI像团队一样高效协作!亮点:1. 动态Agent切换,无缝衔接对话;2. 支持短时和长时记忆,对话历史不丢失;3. 流式处理与人机协作,交互体验更流畅 No 6. 《走进具身智能》核心八问 No 7. Phi 4 Multimodal:微软开源的多模态大模型,支持音频、视觉和文本处理。亮点:1. 使用“LoRAs混合”技术,在不微调基础模型的情况下添加模态适配器;2. 在OpenASR排行榜上排名第一,性能超越多个大型模型;3. Phi-4-Mini版本参数量达38亿,性能卓越 No 8. Search-R1:高效、可扩展的强化学习训练框架,用于训练具有推理和搜索引擎调用能力的大型语言模型(LLM)。亮点:1. 基于veRL构建,支持3B规模的基础LLM;2. 通过规则化奖励机制,让LLM自主学会推理和搜索;3. 提供完整的训练流程和工具支持,助力研究和开发 No 9. Ryan Hart 的LLM学习法:用 AI 助手 Grok 作为个人导师,实现超快速学习。亮点:1. 提供 8 种学习提示,涵盖从技能特定学习到资源整理的全方位方法;2. 强调个性化学习计划,帮助用户高效掌握任何技能;3. 结合实际案例和加速学习技巧,让学习事半功倍 No 10. AgenticMemory:为LLM Agent打造的新型动态记忆系统,助力Agent高效管理历史经验,提升任务处理能力。亮点:1. 基于Zettelkasten原则的动态记忆组织;2. 智能索引与链接,实现记忆的高效检索;3. 6大基础模型实验证明性能优于现有SOTA基线 No 11. [15星]AI2 Scholar QA:一个强大的多文档问答系统,能够从海量学术文献中提取证据并生成结构化的回答。亮点:1. 采用RAG架构,结合检索和多步生成技术;2. 支持多种LLM模型,灵活适配不同需求;3. 提供完整的Python包和Web应用,易于集成和部署 No 12. Gemini Code Assist:Google... No 13. nanoGRPO:一个轻量的Group Relative Policy Optimization (GRPO) 实现,为语言模型优化带来高效解决方案。亮点:1. 仅需8GB显存即可运行,适配RTX 4060;2. 120步训练即可显著提升模型表现;3. 独特的GRPO损失函数,优化效果显著 No 14. GRPO Reasoning Model:关于如何... No 15. [193星]Autiobooks:一键将电子书转换为有声读物,让阅读更轻松。亮点:1. 利用Kokoro高质量语音合成技术,输出自然流畅;2. 支持多种语言和语音风格,满足不同需求;3. 生成的.m4b文件可直接在有声书播放器上使用 No 16. [3.2k星]Command & Conquer Red Alert:经典即时战略游戏《红色警戒》的开源代码库。亮点:1. 提供Steam Workshop支持,助力游戏模组创作;2. 包含完整的源代码,方便开发者研究和学习;3. 代码涵盖多种编程语言,适合作为技术研究案例 No 17. [348星]Probly:AI赋能的智能电子表格应用,让数据分析变得简单高效。亮点:1. 交互式电子表格,支持公式计算;2. 浏览器内运行Python代码,无需安装依赖;3. AI智能分析,一键获取数据洞察 No 18. [CL]《Thinking Slow, Fast: Scaling Inference Compute with Distilled Reasoners》 No 19. OmniAlign-V:让多模态大语言模型(MLLMs)更好地符合人类偏好,提升对齐能力。亮点:1. 提供20.5万高质量图像问答对,助力模型学习;2. 专为DPO优化的负样本数据集,提升对齐效果;3. MM-AlignBench基准测试,用GPT-4o作为裁判,客观评估模型表现 No 20. [127星]llms-from-scratch-rs:用Rust语言重新实现Sebastian Raschka的《从零构建LLM》一书中的代码。亮点:1. 使用Rust语言,性能提升显著;2. 完整覆盖书中7章内容,从基础到指令微调;3. 提供丰富的示例和练习,助力深度学习实践 No 21. 晚安~ [月亮] No 22. [179星]Minions:让本地小模型与云端大模型高效协作的通信协议。亮点:1. 仅需本地读取长文本,大幅降低云端成本;2. 支持多种本地和云端模型,灵活适配不同需求;3. 最新研究支持,结合Ollama和OpenAI等前沿技术 No 23. [269星]mcp-obsidian:让Claude Desktop轻松读取和搜索Obsidian笔记库的连接器。亮点:1. 无缝集成,一键安装;2. 支持任何Markdown笔记目录,不限于Obsidian;3. AGPL-3.0开源许可,自由使用 No 24. [LG] Taxonomy, Opportunities, and Challenges of Representation ...... No 25. [59星]Reasoning-Attack:揭示大... No 26. [CL]《Distill Not Only Data but Also Rewards: Can Smaller Language Models Surpass Larger Ones?》 No 27. [214星] DeepSeek R1:介绍了如何从... No 28. [IR]《Granite Embedding Models》 No 29. [95星]Spark-TTS:基于LLM的高效文本转语音模型,让语音合成更自然、更高效。亮点:1. 零样本文本到语音的无缝转换,无需额外训练;2. 支持中英双语,轻松实现跨语言合成;3. 可控语音生成,可调节音色、语速等参数 No 30. [23星]Awesome-Spatial-Reasoning:为大语言模型(LLM)和视觉语言模型(VLM)的空间智能研究提供全面的论文清单。亮点:1. 涵盖视觉和文本两种空间推理方法;2. 提供20多个空间推理数据集和基准;3. 涵盖从2023年到2025年的最新研究成果 No 31. [199星]Mahilo:一个灵活的多Agent系统框架,让Agent在人类监督下协同工作,共享上下文信息,提升复杂任务处理效率。亮点:1. 支持实时语音交互,让沟通更自然;2. 采用WebSocket实现多用户同时通信,响应迅速;3. 提供灵活的通信模式,满足多种场景需求 No 32. OpenEvals:为LLM应用提供强大的评估工具。亮点:1. 提供多种预建评估器,如正确性、简洁性和幻觉检测;2. 支持Python和TypeScript,适配多种开发环境;3. 集成LangSmith,方便实验跟踪和结果记录 No 33. Wan2.1-quantized:一款优化后的开源视频生成模型,专为消费级显卡(如3090/4090)设计。亮点:1. 仅需8.19GB显存即可运行,适配几乎所有消费级显卡;2. 支持多任务,包括文本到视频、图片到视频、视频编辑等;3. 首个支持中英文文本生成的视频模型 No 34. [126星]Fire Red Agent:用大型语言模型自主地玩 Pokémon FireRed 游戏,该机器人具备基本的游戏玩力,如探索、战斗和响应游戏事件。 亮点:1. 利用大语言模型实现游戏自主探索和战斗;2. 通过OCR技术解析游戏文本,让AI理解游戏事件;3. 记忆系统记录AI行为,避免重复错误 No 35. Self-rewarding-reasoning-... No 36. [115星]CS598:专注于生成式人工智能(GenAI)系统的课程资源库。亮点:1. 提供前沿GenAI系统研究的课程资料;2. 包含丰富的学术论文和项目实践指导;3. 课程设计结合理论与实践,助力学生深入理解GenAI系统 No 37. [37星]All-Hands-AI/openhands-aci:为AI软件工程师打造的Agent计算机接口,助力高效开发。亮点:1. 提供代码编辑、修改和配置管理的强大工具;2. 内置代码分析功能,支持Python语言;3. 提供实用功能模块,如命令行执行和日志记录 No 38. 早![太阳] No 39. 开箱即用的企业级嵌入模型 //@爱可可-爱生活:IBM Granite Embeddings 模型系列创新性地提出了一系列高性能、企业级文本嵌入模型,通过检索导向预训练、多阶段知识蒸馏和模型合并等技术,在稠密和稀疏检索任务中均取得了优异性能,并以开源许可发布,为企业检索应用提供了高效、 No 40. [92星]Diffusion-Pipe-UI:为扩散模型训练提供一站式解决方案。亮点:1. 通过Gradio界面简化训练流程,无需复杂命令;2. 支持Docker部署,轻松适配Windows和Linux环境;3. 提供Tensorboard可视化训练损失,直观掌握训练进度 No 41. [112星]Open Gemini Deep Research:基于谷歌Gemini AI的深度研究助手,一键生成高质量研究报告。亮点:1. 三种研究模式,满足不同需求;2. 自动生成3000字以上详细报告,附带引用;3. 并行处理多个研究问题,效率提升3倍 No 42. [986星]Emblor:一个功能强大的标签输入组件,让开发者轻松实现高效、美观的多标签输入功能。亮点:1. 支持21种特性,包括自动补全、去重、排序等;2. 高度可定制,满足多种开发需求;3. 兼容主流前端框架,无缝集成 No 43. 初始权重对神经网络归纳偏差的重要影响 查看图片 //@爱可可-爱生活:本文通过元学习方法揭示了神经网络初始权重在塑造归纳偏差方面的巨大潜力,证明了优化初始权重可以显著缩小不同架构间的性能差距,但在分布外泛化方面,架构的固有偏置仍然不可或缺,暗示了未来需要更加关注架构与初始权...全文//[LG]《Teasing Apart Architecture and Initial Weights as Sources of Inductive Bias in Neural Networks》 No 44. [61星]UniCodec:一个支持多领域音频数据的统一音频编解码器,包括语音、音乐和声音。亮点:1. 单个码本实现多领域音频处理;2. 自监督掩码预测建模,无需辅助模块即可增强语义密度;3. 在语音、音乐、声音三大领域均实现高压缩率与优越的主观重建性能 No 45. [23星]GeneralistYOLO:一个实时多任务视觉语言模型,一站式解决多种视觉任务。亮点:1. 单模型支持目标检测、分割、图像描述等多任务;2. MS COCO数据集上目标检测AP达52.4%,实例分割AP达43.0%;3. 实时性能,640尺寸下FLOPs仅122.2G No 46. [21星]Awesome-Human-Centri... No 47. [LG]《Implicit Search via Discrete Diffusion: A Study on Chess》 No 48. [1.5k星]Smallpond:DeepSeek开源的基于DuckDB和3FS的轻量数据处理框架,让你轻松搞定海量数据!亮点:1. 高性能数据处理,借助DuckDB实现秒级响应;2. 可扩展至PB级数据,轻松应对大数据挑战;3. 无需长时运行服务,操作简单易上手 No 49. [1k星]typescript-types-only-wasm-runtime:用TypeScript类型实现的WebAssembly运行时,让C代码或WebAssembly直接在TypeScript中运行。亮点:1. 纯TypeScript实现,无需JavaScript代码;2. 成功运行Doom,展示强大性能;3. 实现了64位的除法运算,突破技术瓶颈 No 50. [474星]AtomixDB:用Go语言打造的迷你持久化关系型数据库。亮点:1. B+树存储引擎,支持索引,数据检索速度飞快;2. 事务支持,确保数据一致性;3. 并发读取,提升读取性能
The text was updated successfully, but these errors were encountered:
No branches or pull requests
No 1. [323星]LLMs-from-scratch-CN:从零构建大模型的中文翻译项目,助力中文学习者深入理解大语言模型的构建与实践。亮点:1. 详细中文注释的Jupyter代码,快速上手;2. 提供丰富的附加学习材料,拓展知识边界;3. 适配国内学习习惯,优化翻译表达
No 2. Andrej Karpathy:我们正处在一个新的计算范式转变的开端,LLM将成为新的CPU,这个转变堪比上世纪80年代的个人电脑革命
No 3. [238星]Prompt Optimizer:一个强大的提示词优化工具,帮助你一键提升AI回复的准确度。亮点:1. 支持多轮智能优化,显著提升AI回答质量;2. 集成OpenAI、Gemini等主流AI模型,满足多样化需求;3. 纯客户端处理,数据安全无忧
No 4. #转发抽奖[超话]# 转发抽三本@图灵文化 的《走进具身智能》
No 5. [109星]LangGraph Swarm Py:用Python搭建智能多Agent协作系统,让AI像团队一样高效协作!亮点:1. 动态Agent切换,无缝衔接对话;2. 支持短时和长时记忆,对话历史不丢失;3. 流式处理与人机协作,交互体验更流畅
No 6. 《走进具身智能》核心八问
No 7. Phi 4 Multimodal:微软开源的多模态大模型,支持音频、视觉和文本处理。亮点:1. 使用“LoRAs混合”技术,在不微调基础模型的情况下添加模态适配器;2. 在OpenASR排行榜上排名第一,性能超越多个大型模型;3. Phi-4-Mini版本参数量达38亿,性能卓越
No 8. Search-R1:高效、可扩展的强化学习训练框架,用于训练具有推理和搜索引擎调用能力的大型语言模型(LLM)。亮点:1. 基于veRL构建,支持3B规模的基础LLM;2. 通过规则化奖励机制,让LLM自主学会推理和搜索;3. 提供完整的训练流程和工具支持,助力研究和开发
No 9. Ryan Hart 的LLM学习法:用 AI 助手 Grok 作为个人导师,实现超快速学习。亮点:1. 提供 8 种学习提示,涵盖从技能特定学习到资源整理的全方位方法;2. 强调个性化学习计划,帮助用户高效掌握任何技能;3. 结合实际案例和加速学习技巧,让学习事半功倍
No 10. AgenticMemory:为LLM Agent打造的新型动态记忆系统,助力Agent高效管理历史经验,提升任务处理能力。亮点:1. 基于Zettelkasten原则的动态记忆组织;2. 智能索引与链接,实现记忆的高效检索;3. 6大基础模型实验证明性能优于现有SOTA基线
No 11. [15星]AI2 Scholar QA:一个强大的多文档问答系统,能够从海量学术文献中提取证据并生成结构化的回答。亮点:1. 采用RAG架构,结合检索和多步生成技术;2. 支持多种LLM模型,灵活适配不同需求;3. 提供完整的Python包和Web应用,易于集成和部署
No 12. Gemini Code Assist:Google...
No 13. nanoGRPO:一个轻量的Group Relative Policy Optimization (GRPO) 实现,为语言模型优化带来高效解决方案。亮点:1. 仅需8GB显存即可运行,适配RTX 4060;2. 120步训练即可显著提升模型表现;3. 独特的GRPO损失函数,优化效果显著
No 14. GRPO Reasoning Model:关于如何...
No 15. [193星]Autiobooks:一键将电子书转换为有声读物,让阅读更轻松。亮点:1. 利用Kokoro高质量语音合成技术,输出自然流畅;2. 支持多种语言和语音风格,满足不同需求;3. 生成的.m4b文件可直接在有声书播放器上使用
No 16. [3.2k星]Command & Conquer Red Alert:经典即时战略游戏《红色警戒》的开源代码库。亮点:1. 提供Steam Workshop支持,助力游戏模组创作;2. 包含完整的源代码,方便开发者研究和学习;3. 代码涵盖多种编程语言,适合作为技术研究案例
No 17. [348星]Probly:AI赋能的智能电子表格应用,让数据分析变得简单高效。亮点:1. 交互式电子表格,支持公式计算;2. 浏览器内运行Python代码,无需安装依赖;3. AI智能分析,一键获取数据洞察
No 18. [CL]《Thinking Slow, Fast: Scaling Inference Compute with Distilled Reasoners》
No 19. OmniAlign-V:让多模态大语言模型(MLLMs)更好地符合人类偏好,提升对齐能力。亮点:1. 提供20.5万高质量图像问答对,助力模型学习;2. 专为DPO优化的负样本数据集,提升对齐效果;3. MM-AlignBench基准测试,用GPT-4o作为裁判,客观评估模型表现
No 20. [127星]llms-from-scratch-rs:用Rust语言重新实现Sebastian Raschka的《从零构建LLM》一书中的代码。亮点:1. 使用Rust语言,性能提升显著;2. 完整覆盖书中7章内容,从基础到指令微调;3. 提供丰富的示例和练习,助力深度学习实践
No 21. 晚安~ [月亮]
No 22. [179星]Minions:让本地小模型与云端大模型高效协作的通信协议。亮点:1. 仅需本地读取长文本,大幅降低云端成本;2. 支持多种本地和云端模型,灵活适配不同需求;3. 最新研究支持,结合Ollama和OpenAI等前沿技术
No 23. [269星]mcp-obsidian:让Claude Desktop轻松读取和搜索Obsidian笔记库的连接器。亮点:1. 无缝集成,一键安装;2. 支持任何Markdown笔记目录,不限于Obsidian;3. AGPL-3.0开源许可,自由使用
No 24. [LG] Taxonomy, Opportunities, and Challenges of Representation ......
No 25. [59星]Reasoning-Attack:揭示大...
No 26. [CL]《Distill Not Only Data but Also Rewards: Can Smaller Language Models Surpass Larger Ones?》
No 27. [214星] DeepSeek R1:介绍了如何从...
No 28. [IR]《Granite Embedding Models》
No 29. [95星]Spark-TTS:基于LLM的高效文本转语音模型,让语音合成更自然、更高效。亮点:1. 零样本文本到语音的无缝转换,无需额外训练;2. 支持中英双语,轻松实现跨语言合成;3. 可控语音生成,可调节音色、语速等参数
No 30. [23星]Awesome-Spatial-Reasoning:为大语言模型(LLM)和视觉语言模型(VLM)的空间智能研究提供全面的论文清单。亮点:1. 涵盖视觉和文本两种空间推理方法;2. 提供20多个空间推理数据集和基准;3. 涵盖从2023年到2025年的最新研究成果
No 31. [199星]Mahilo:一个灵活的多Agent系统框架,让Agent在人类监督下协同工作,共享上下文信息,提升复杂任务处理效率。亮点:1. 支持实时语音交互,让沟通更自然;2. 采用WebSocket实现多用户同时通信,响应迅速;3. 提供灵活的通信模式,满足多种场景需求
No 32. OpenEvals:为LLM应用提供强大的评估工具。亮点:1. 提供多种预建评估器,如正确性、简洁性和幻觉检测;2. 支持Python和TypeScript,适配多种开发环境;3. 集成LangSmith,方便实验跟踪和结果记录
No 33. Wan2.1-quantized:一款优化后的开源视频生成模型,专为消费级显卡(如3090/4090)设计。亮点:1. 仅需8.19GB显存即可运行,适配几乎所有消费级显卡;2. 支持多任务,包括文本到视频、图片到视频、视频编辑等;3. 首个支持中英文文本生成的视频模型
No 34. [126星]Fire Red Agent:用大型语言模型自主地玩 Pokémon FireRed 游戏,该机器人具备基本的游戏玩力,如探索、战斗和响应游戏事件。 亮点:1. 利用大语言模型实现游戏自主探索和战斗;2. 通过OCR技术解析游戏文本,让AI理解游戏事件;3. 记忆系统记录AI行为,避免重复错误
No 35. Self-rewarding-reasoning-...
No 36. [115星]CS598:专注于生成式人工智能(GenAI)系统的课程资源库。亮点:1. 提供前沿GenAI系统研究的课程资料;2. 包含丰富的学术论文和项目实践指导;3. 课程设计结合理论与实践,助力学生深入理解GenAI系统
No 37. [37星]All-Hands-AI/openhands-aci:为AI软件工程师打造的Agent计算机接口,助力高效开发。亮点:1. 提供代码编辑、修改和配置管理的强大工具;2. 内置代码分析功能,支持Python语言;3. 提供实用功能模块,如命令行执行和日志记录
No 38. 早![太阳]
No 39. 开箱即用的企业级嵌入模型 //@爱可可-爱生活:IBM Granite Embeddings 模型系列创新性地提出了一系列高性能、企业级文本嵌入模型,通过检索导向预训练、多阶段知识蒸馏和模型合并等技术,在稠密和稀疏检索任务中均取得了优异性能,并以开源许可发布,为企业检索应用提供了高效、
No 40. [92星]Diffusion-Pipe-UI:为扩散模型训练提供一站式解决方案。亮点:1. 通过Gradio界面简化训练流程,无需复杂命令;2. 支持Docker部署,轻松适配Windows和Linux环境;3. 提供Tensorboard可视化训练损失,直观掌握训练进度
No 41. [112星]Open Gemini Deep Research:基于谷歌Gemini AI的深度研究助手,一键生成高质量研究报告。亮点:1. 三种研究模式,满足不同需求;2. 自动生成3000字以上详细报告,附带引用;3. 并行处理多个研究问题,效率提升3倍
No 42. [986星]Emblor:一个功能强大的标签输入组件,让开发者轻松实现高效、美观的多标签输入功能。亮点:1. 支持21种特性,包括自动补全、去重、排序等;2. 高度可定制,满足多种开发需求;3. 兼容主流前端框架,无缝集成
No 43. 初始权重对神经网络归纳偏差的重要影响 查看图片 //@爱可可-爱生活:本文通过元学习方法揭示了神经网络初始权重在塑造归纳偏差方面的巨大潜力,证明了优化初始权重可以显著缩小不同架构间的性能差距,但在分布外泛化方面,架构的固有偏置仍然不可或缺,暗示了未来需要更加关注架构与初始权...全文//[LG]《Teasing Apart Architecture and Initial Weights as Sources of Inductive Bias in Neural Networks》
No 44. [61星]UniCodec:一个支持多领域音频数据的统一音频编解码器,包括语音、音乐和声音。亮点:1. 单个码本实现多领域音频处理;2. 自监督掩码预测建模,无需辅助模块即可增强语义密度;3. 在语音、音乐、声音三大领域均实现高压缩率与优越的主观重建性能
No 45. [23星]GeneralistYOLO:一个实时多任务视觉语言模型,一站式解决多种视觉任务。亮点:1. 单模型支持目标检测、分割、图像描述等多任务;2. MS COCO数据集上目标检测AP达52.4%,实例分割AP达43.0%;3. 实时性能,640尺寸下FLOPs仅122.2G
No 46. [21星]Awesome-Human-Centri...
No 47. [LG]《Implicit Search via Discrete Diffusion: A Study on Chess》
No 48. [1.5k星]Smallpond:DeepSeek开源的基于DuckDB和3FS的轻量数据处理框架,让你轻松搞定海量数据!亮点:1. 高性能数据处理,借助DuckDB实现秒级响应;2. 可扩展至PB级数据,轻松应对大数据挑战;3. 无需长时运行服务,操作简单易上手
No 49. [1k星]typescript-types-only-wasm-runtime:用TypeScript类型实现的WebAssembly运行时,让C代码或WebAssembly直接在TypeScript中运行。亮点:1. 纯TypeScript实现,无需JavaScript代码;2. 成功运行Doom,展示强大性能;3. 实现了64位的除法运算,突破技术瓶颈
No 50. [474星]AtomixDB:用Go语言打造的迷你持久化关系型数据库。亮点:1. B+树存储引擎,支持索引,数据检索速度飞快;2. 事务支持,确保数据一致性;3. 并发读取,提升读取性能
The text was updated successfully, but these errors were encountered: