大语言模型能做什么:一份面向初学者的鸟瞰

星期三, 4月 1, 2026 | 1分钟阅读 | 更新于 星期三, 4月 8, 2026

@

大语言模型(Large Language Model,常简称 LLM)本质上是在海量文本上训练出来的概率模型:给定前文,预测下一个词(或子词)。听起来简单,但规模上来之后,会涌现出对话、摘要、翻译、简单推理、按格式输出等能力,因此成了近两年 AI 产品的核心引擎。

它通常很擅长的事

  • 改写与润色:把口语改成书面语、统一语气、缩短或扩写段落。
  • 头脑风暴:在同一约束下给出多份提纲、标题、类比或反例。
  • 格式化处理:表格、列表、JSON 大纲、按模板填空——前提是需求说得清楚。
  • 辅助阅读:对长文做摘要、提取论点、用问答方式帮你「带着问题读」。
  • 编程辅助:在给出足够上下文时,补全函数、解释报错、生成测试用例(仍需人审)。

它容易翻车的地方

  • 事实与引用:可能「一本正经胡说」,尤其是冷门领域或需要精确数字、法规条文的场景。
  • 时效性:训练数据有截止日期,对「上周的新闻」未必可靠,需要检索或插件补足。
  • 长程一致:对话很长时可能前后矛盾,重要结论要交叉核对。
  • 价值与合规:涉及医疗、法律、金融等决策,应把模型输出当作参考而非结论。

怎么开始用(实践向)

  1. 先选一个常用平台(聊天机器人或带 API 的服务),从小任务试起:邮件润色、周报提纲、代码解释。
  2. 养成习惯:对重要输出追问依据要求列出不确定点
  3. 需要准确事实时,明确说「若不确定请说明」,并配合搜索引擎或专业数据库。

下一篇会写「提示词」怎么写更容易得到稳定结果——那是把 LLM 用好的关键杠杆之一。

关于我

大家好,我是 lew。这里主要记录学习、工作与阅读里的碎片想法——偏工程实践,少空话;写给自己备忘,也欢迎路过的你顺手翻翻。

经历与方向

从事互联网研发与技术管理十余年,长期负责团队建设、架构演进、技术选型与交付节奏;经历从客户端到服务端、从功能迭代到线上治理的完整链路,习惯在稳定性、成本与交付速度之间做权衡。

技术栈与工程

后端以 GolangNode.js(及常见服务端框架)为主;在分布式与实时服务微服务(RPC、服务发现、可观测)、容器与编排Docker / Kubernetes)、CI/CD 与云上架构上有较多实践。数据侧熟悉多种关系型 / 文档型数据库、缓存与消息队列;关注高可用、安全与弹性,也关注研发协作与发布效率。

AI / 大模型工程化

持续跟进 LLM 落地与工程化,方向包括但不限于 RAGLoRAAgentMCPSKILL 等缩写所指领域;更关心「模型能力」如何与业务约束、数据边界、可观测与发布节奏对齐,而不是单点炫技。文里会尽量直接用这些缩写,避免冗长中文释义。

管理与协作

在敏捷与 Scrum 实践、跨职能沟通与版本迭代上有较多经验;习惯用可度量的目标、评审与回顾推动改进,而不是只堆流程文档。

学习

MBA 在读,侧重创新创业与组织管理,用来补足商业与战略视角,和技术判断互相校准。

博客里可能写什么
  • LLMRAGAgent 等在实际业务里的取舍与踩坑
  • 后端、分布式与可观测的一得之见
  • 工具链、CI/CD 与个人工作流里的「人机协作」节奏

若你也关心 LLMRAG、软件工程或知识管理,欢迎偶尔回来看看。

联系可通过站点页脚邮箱;合作与交流请说明来意。