2026-06-16

采集 145 精选 20

本文是一篇实操性教程,指导开发者如何构建一个Chrome扩展程序,以增强AI工具使用的专注度和意图性,涵盖设计思路、技术选型与实现步骤。

Dev.to Julien Avezou · ♥29 · 6 comments
查看原文 →

Hugging Face Transformers 是一个广泛使用的开源库,支持文本、视觉、音频及多模态模型的定义、训练与推理,是AI开发工作流中的核心基础设施。

GitHub huggingface · ★161.6K
查看原文 →

NousResearch/hermes-agent 是一个开源的智能体(agent)框架,旨在随用户需求演进,支持可扩展的任务自动化与多步推理。该项目提供代码、配置示例和基础文档,但尚未包含完整教程或生产级部署指南。

GitHub NousResearch · ★194.6K
查看原文 →

f/prompts.chat 是一个开源的社区驱动型提示词共享平台,前身是 Awesome ChatGPT Prompts,支持自托管以保障数据隐私。

GitHub f · ★163.8K
查看原文 →

LangChain 是一个开源的、用于构建基于大语言模型应用的框架,专注于代理(Agent)工程、链式调用与工具集成。它为开发者提供了标准化的抽象层和可复用模块。

GitHub langchain-ai · ★139.4K
查看原文 →

Dify 是一个面向生产环境的开源平台,专为构建和部署基于智能体(agentic)的工作流而设计,支持可视化编排、模型集成与应用发布。

GitHub langgenius · ★145.4K
查看原文 →

本文记录了Fable 5因政府指令突然停服后,作者在备用系统上运行关键AI工作流时遭遇的故障与应对反思,聚焦AI服务稳定性与运维韧性问题。

Dev.to Mykola Kondratiuk · ♥13 · 8 comments
查看原文 →

Open WebUI 是一个开源的、用户友好的本地化 AI 界面,支持 Ollama、OpenAI API 等多种后端模型,便于快速部署和交互式使用。

GitHub open-webui · ★141.7K
查看原文 →

这是一则 Hacker News 上的社区讨论帖,询问开发者是否已将 Claude/GPT 等云端大模型完全替换为本地运行的 AI 模型用于日常编程工作,并征集实际部署配置与性能反馈。

HN cloudking · ↑791 · 376 comments
查看原文 →

本文作为系列终篇,提出核心观点:AI不应被盲目信任,而应被主动设计;强调通过知识图谱、自动审查、自修复和复发预防等机制构建可信赖的AI系统,而非依赖其生成能力本身。

Dev.to Ryosuke Tsuji · ♥13 · 1 comments
查看原文 →

llama.cpp 是一个在 C/C++ 中实现的轻量级、高性能大语言模型推理框架,支持在 CPU 和边缘设备上高效运行量化模型。

GitHub ggml-org · ★116.7K
查看原文 →

Nemotron 3 Ultra 是一款开源的混合专家(MoE)大模型,融合 Mamba 与 Transformer 架构,具备 5500 亿总参数和 550 亿激活参数,支持 100 万 token 上下文,并采用 LatentMoE 和多 Token 预测等前沿技术优化智能体推理能力。

HF Papers NVIDIA · 👍0
查看原文 →

本文分析了Google Gemini API账单中模型名称与实际计费项不一致的现象,揭示了底层模型映射、版本切换和定价分层等隐藏机制。

Dev.to Tessl · ♥12 · 1 comments
查看原文 →

Langflow 是一个开源的低代码可视化平台,用于构建、调试和部署基于大语言模型的AI智能体与工作流。

GitHub langflow-ai · ★149.7K
查看原文 →

Firecrawl 是一个开源的 Web 数据获取工具,提供可编程 API,支持大规模网页搜索、爬取和交互,专为 AI 应用(如 RAG)优化。

GitHub firecrawl · ★133.3K
查看原文 →

本文是一篇实操性教程,介绍如何微调Google的Gemma模型(文中误称‘Gemma 4’,实际Gemma最新公开版本为Gemma 2)以实现古韩文(如朝鲜王朝时期文献)的翻译任务。

Dev.to bebechien · ♥27 · 1 comments
查看原文 →

本文探讨欧洲是否具备自主训练前沿AI模型所需的算力基础设施,聚焦地缘政治、产业能力与技术主权等宏观议题。

HN smashini · ↑122 · 222 comments
查看原文 →

本文提出Tangram方法,通过非均匀KV缓存压缩技术优化多轮对话场景下的大语言模型服务效率,在保持高精度的同时缓解内存瓶颈。该方法挑战了现有推理框架对各注意力头KV长度一致性的隐含假设。

HF Papers Hyungmin Kim · 👍0
查看原文 →

本文提出了一种端到端的‘数据记者智能体’(Data Journalist Agent),旨在整合数据分析、叙事构建与多模态可视化能力,实现从原始数据到可验证新闻故事的自动化生成。

HF Papers Kevin Qinghong Lin · 👍0
查看原文 →