2026-06-12

采集 146 精选 20

该GitHub仓库(Ollama)是一个开源本地AI模型运行工具,支持快速部署Kimi-K2.6、GLM-5.1、Qwen、Gemma等主流开源及商用大模型。

GitHub ollama · ★173.9K
查看原文 →

本文详细介绍了Google ADK(Agent Development Kit)中用于防御提示注入攻击的五层安全架构,并提供了具体配置方法和防护实践建议。

Dev.to Omotayo Aina · ♥7 · 5 comments
查看原文 →

LangChain 是一个开源的代理工程平台,用于构建基于大语言模型的应用程序,支持链式调用、工具集成和自主代理开发。

GitHub langchain-ai · ★139.1K
查看原文 →

NousResearch/hermes-agent 是一个开源的自主智能体框架,旨在随用户需求演进并支持多步推理与工具调用,适用于构建可扩展的AI代理系统。

GitHub NousResearch · ★191.2K
查看原文 →

Dify 是一个面向生产环境的开源平台,用于构建和部署基于智能体(agentic)的工作流,支持可视化编排、模型集成与应用发布。

GitHub langgenius · ★144.9K
查看原文 →

HazelJS 1.0.0 是一个专为AI原生应用设计的稳定版TypeScript框架,支持LLM集成、智能代理和可组合AI工作流,面向开发者提供生产级AI工具链。

Dev.to Muhammad Arslan · ♥11 · 0 comments
查看原文 →

vLLM 是一个高性能、内存高效的大型语言模型推理与服务引擎,专为加速 LLM 部署而设计,支持 PagedAttention 等创新技术。

GitHub vllm-project · ★82.6K
查看原文 →

Firecrawl 是一个开源的 Web 数据获取工具,提供可扩展的 API,支持大规模网页搜索、爬取和交互,专为 AI 应用(如 RAG)优化。

GitHub firecrawl · ★131.6K
查看原文 →

Langflow 是一个开源的低代码可视化平台,用于构建、调试和部署基于 LLM 的 AI 工作流与智能体。

GitHub langflow-ai · ★149.6K
查看原文 →

本文介绍了如何将 mirrord 工具集成到 AI-SRE(AI 驱动的站点可靠性工程)工作流中,实现对 AI 建议修复方案在真实集群上的自动验证,提升运维决策可信度。

Dev.to Eyal Bukchin · ♥6 · 1 comments
查看原文 →

本文探讨AI代理系统中“静默失败”问题,指出单纯提升速率限制等容量措施无法保障结果正确性,强调需区分“可用性”与“正确可用性”两类服务等级目标(SLO),并呼吁在工程实践中优先保障输出质量。

Dev.to Sergei Parfenov · ♥7 · 1 comments
查看原文 →

browser-use 是一个开源库,旨在为 AI 智能体提供标准化、可编程的网页交互能力,支持自动化在线任务,填补了 AI 代理与真实 Web 环境之间的关键桥梁。

GitHub browser-use · ★98.4K
查看原文 →

Anthropic就Claude模型中未公开的“Fable”蒸馏式安全护栏向公众致歉,该隐形机制引发AI社区对透明度与安全治理的广泛质疑。

HN rarisma · ↑350 · 346 comments
查看原文 →

LobeHub 是一个开源的 AI 代理编排平台,旨在将多个 AI 智能体组织成可 7×24 小时自主运行的‘AI 团队’,支持智能体招聘、调度与绩效报告。

GitHub lobehub · ★78.5K
查看原文 →

MoneyPrinterTurbo 是一个开源项目,利用大语言模型和多模态AI技术实现一键生成高清短视频,支持本地部署与定制化扩展。

GitHub harry0703 · ★86.3K
查看原文 →

MuJoCo-Drones-Gym 是一个开源的、支持 GPU 加速的多无人机仿真环境,专为控制算法开发和强化学习训练设计,兼容 Gymnasium 接口。

HF Papers Manan Tayal · 👍0
查看原文 →

本文提出EvoBrowseComp——一个面向动态演进知识的搜索智能体评测基准,旨在解决现有静态基准(如BrowseComp)易受测试集污染和参数记忆干扰的问题,从而更真实地评估模型的检索推理能力。

HF Papers Yunhan Wang · 👍0
查看原文 →

EvoArena 是一个面向动态环境的新型基准套件,旨在评估大语言模型智能体在环境持续变化(如终端、软件、任务条件更新)下的记忆演化与鲁棒性。该工作填补了现有静态评测与真实部署场景之间的关键鸿沟。

HF Papers Jundong Xu · 👍0
查看原文 →

Evoflux 提出一种推理时进化可执行工具工作流的方法,旨在提升紧凑型语言模型在动态工具调用场景下的鲁棒性与成功率,解决小规模规划器在工具发现、依赖追踪和执行验证中的常见失败问题。

HF Papers Kushal Raj Bhandari · 👍0
查看原文 →

本文提出了一种名为检索增强强化微调(RA-RFT)的新框架,旨在通过检索类比性推理示例提升大语言模型的复杂推理能力,突破传统基于语义相似性的检索局限。

arXiv Zilin Xiao · paper
查看原文 →