#大模型训练 | opc.ren

Home 新闻商城

Tag

# 大模型训练

围绕大模型训练这个主题，opc.ren 当前收录了 5 篇相关文章。

Latest under #大模型训练

5 items

大模型训练大模型模型训练模型

SaaStr3月20日

如今想真正做好 AI，你得成为智能体部署专家

文章认为，AI 应用已经经历了几个阶段：从早期必须具备较强技术能力，才能从原始大模型 API 中获得可用结果；到后来更多人开始接触和使用；再到当下，真正稀缺的能力变成了把“智能体”实际部署到业务流程中并稳定落地。作者强调，今天要想真正受益于 AI，不只是会使用模型，而是要成为擅长智能体部署与应用实施的人，但具备这种能力的人仍然很少。

AI智能体 SaaS 大模型部署实施

simonwillison.net3月18日

利用苹果“LLM in a Flash”在本地运行Qwen 397B的研究

文章介绍了Dan Woods的研究：基于苹果“LLM in a Flash”，让定制版Qwen3.5-397B-A17B在48GB内存的MacBook Pro M3 Max上实现本地运行并达到5.5+ tokens/second。

大模型本地运行

Latent Space3月14日

AI新闻：上下文窗口“旱季”

文章借“消息清淡”的一天，回顾并讨论 Anthropic 在 Gemini 和 OpenAI 之后，才正式普及 100 万上下文窗口这一进展及其意义。

AI新闻 Anthropic 大模型长上下文

matduggan.com2月16日

每月 20 美元换来“完美生成”的 Terraform

作者此前认为多种大模型工具效果很差：Copilot 只会写冗长注释，Gemini 把 200 行脚本膨胀成 700 行乱码，因此长期忽视 LLM。

Copilot Gemini 大模型开发工具

gilesthomas.com1月9日

从零写 LLM（30）：深入分析 LLM 评判结果

作者继续在完成《Build a Large Language Model (from Scratch)》后做“加分”项目，回顾上次使用书中 GPT‑2 架构在 Lambda Labs 上训练四个基础模型，并进一步分析“LLM 作为评判者”的结果。

LLM 模型训练评测

浙ICP备2026018761号-1