2026-06-06

采集 149 精选 20

NousResearch/hermes-agent 是一个开源的、可扩展的智能体框架,旨在随用户需求演进,支持自主任务规划与工具调用。

GitHub NousResearch · ★183.4K
查看原文 →

Ollama 是一个用于本地运行大型语言模型的开源工具,支持 Kimi-K2.6、GLM-5.1、Qwen、Gemma 等多种主流开源与商业对齐模型的一键拉取和运行。

GitHub ollama · ★173.3K
查看原文 →

微软开源了pg_durable项目,这是一个为PostgreSQL设计的数据库内持久化执行框架,支持长时间运行、容错且状态可恢复的AI/数据工作流。该项目填补了传统数据库在有状态异步任务调度方面的空白,对AI工程化和MLOps场景具有实用价值。

HN coffeemug · ↑352 · 82 comments
查看原文 →

Dify 是一个面向生产环境的开源平台,用于构建和部署基于智能体(agentic)的工作流,支持可视化编排、模型集成与应用发布。

GitHub langgenius · ★144.1K
查看原文 →

本文介绍了防御AI推理端点遭受推理窃取(inference theft)和“钱包拒绝服务”(denial-of-wallet)攻击的实用方法,包括机器人检测、防护护栏、成本感知路由和预算控制。

Dev.to Morgan Willis · ♥12 · 3 comments
查看原文 →

本文介绍了Gemini团队发布的Gemma 4量化感知训练(QAT)模型,专为在移动设备和笔记本电脑等资源受限设备上高效运行而优化,强调模型压缩与推理效率提升。

HN theanonymousone · ↑298 · 90 comments
查看原文 →

Gemma 4 12B 是一款新型免编码器的统一多模态模型,专为本地高效运行设计,但当前内容仅宣布发布,未提供技术细节、代码或使用指南。

Dev.to Olivier Lacombe · ♥34 · 2 comments
查看原文 →

Open WebUI 是一个开源的、用户友好的本地化 AI 界面,支持 Ollama、OpenAI API 等多种后端模型服务,便于快速部署和交互式使用大语言模型。

GitHub open-webui · ★140.2K
查看原文 →

这是一个基于大语言模型的开源股票分析系统,支持A股、港股和美股,整合多源行情数据、实时新闻与LLM决策仪表盘,并提供零成本定时运行和多渠道推送功能。

GitHub ZhuLinsen · ★41.0K
查看原文 →

vLLM 是一个高性能、内存高效的大型语言模型推理与服务引擎,专为优化吞吐量和降低显存开销而设计。

GitHub vllm-project · ★82.0K
查看原文 →

Langflow 是一个开源的低代码平台,用于可视化构建、调试和部署基于 LLM 的 AI 代理与工作流。它支持与 LangChain 等主流框架集成,适合开发者快速原型设计。

GitHub langflow-ai · ★149.3K
查看原文 →

Firecrawl 是一个开源的 Web 数据获取工具,提供可扩展的 API,支持大规模网页搜索、爬取和交互,专为 AI 应用(如 RAG)优化。

GitHub firecrawl · ★129.2K
查看原文 →

本文是一篇反思性技术随笔,探讨在AI代理(agent)执行任务过程中人类主动介入(如中途接管键盘)所揭示的当前AI系统在可控性、可中断性和人机协作方面的局限性,并指出现有评估框架(如PMP)未能覆盖这些关键维度。

Dev.to Mykola Kondratiuk · ♥24 · 2 comments
查看原文 →

本文分享了通过在Claude Code中添加一项关键配置(未明示但 implied 为 caching、state reuse 或 deterministic sampling),显著降低AI工程成本的实践案例,强调实操优化而非 prompt 工程。

Dev.to Gaurav Vij · ♥8 · 0 comments
查看原文 →

Lowfat 是一款轻量级可插拔的命令行过滤工具,专为减少 LLM 处理 CLI 输出时的 token 消耗而设计,实测节省高达 91.8% 的 token;支持作为 shell 包装器或 agent 钩子使用,并提供按命令定制的插件系统。

HN zdkaster · ↑121 · 61 comments
查看原文 →

该内容介绍了一种使用现代大语言模型进行风格化微调的实践方法,聚焦于让模型生成1995年风格的技术文档(如早期HTML指南、终端手册),涵盖数据准备、LoRA微调和提示工程等关键步骤。

HN taubek · ↑178 · 64 comments
查看原文 →

LobeHub 是一个开源的 AI 代理编排平台,旨在将多个 AI 智能体组织为 7×24 小时持续运行的自动化团队,提供招聘、调度与报告等类管理功能。

GitHub lobehub · ★78.3K
查看原文 →

AnythingLLM 是一个开源的本地优先大语言模型(LLM)智能体框架,支持私有化部署、文档加载、RAG 和多模型后端集成,旨在让用户完全掌控自己的AI工作流。

GitHub Mintplex-Labs · ★61.1K
查看原文 →

SABER 是一项针对大语言模型编码智能体的新基准,聚焦于有状态项目工作区中的操作安全性评估,弥补了现有安全评测忽视环境状态演变的缺陷。

HF Papers Qi Hu · 👍0
查看原文 →