大语言模型 (LLM) 探索

欢迎来到大语言模型技术探索专区！这里将深入探讨大语言模型的核心原理、实践应用和前沿技术。

📚 内容概览

本模块专注于大语言模型 (Large Language Model, LLM) 相关的技术内容，涵盖从基础理论到实际应用的完整知识体系。

🧠 核心主题

基础理论

Transformer 架构
预训练与微调
- 预训练目标函数
- 监督微调 (SFT)
- 强化学习人类反馈 (RLHF)
- 参数高效微调 (LoRA, P-Tuning 等)
模型架构演进
- GPT 系列模型
- BERT 系列模型
- T5 与编码器-解码器架构
- 最新架构创新

实践应用

模型训练
- 数据准备与清洗
- 训练策略与技巧
- 分布式训练
- 模型评估与验证
模型部署
- 模型量化与压缩
- 推理优化
- 服务化部署
- 性能监控
应用开发
- Prompt 工程
- 上下文工程 (Context Engineering)：上下文设计、窗口管理与少样本
- RAG（检索增强生成）：检索、重排序、上下文注入与生成
- 向量嵌入 (Vector Embedding)
- 文本相似度计算：Jaccard、余弦相似度与层次聚类
- Skills / Agent Skills：可复用技能、技能编排与扩展
- MCP（Model Context Protocol）：工具与资源的标准化协议、MCP 服务与客户端
- Agent 开发
- 多 Agent 独立部署与协作
- LangChain 调用外部工具实战
- 活文件理论 (Living Files)
- OpenClaw 记忆系统架构
- 多模态应用

前沿技术

模型能力
优化技术
- 模型压缩与加速
- 知识蒸馏
- 模型剪枝
- 量化技术
安全与对齐
- 模型安全性
- 对齐技术
- 偏见与公平性
- 可解释性

工具与框架

开发框架
- Hugging Face Transformers
- LangChain / LangGraph
- LlamaIndex
- vLLM / TensorRT-LLM
训练框架
- DeepSpeed
- FSDP (Fully Sharded Data Parallel)
- Megatron-LM
- Colossal-AI
开发工具
- Claude Code 使用技巧
- Ghostty 终端使用技巧
部署工具
- Ollama
- Text Generation Inference (TGI)
- TensorRT
- ONNX Runtime

🎯 学习路径

Agent 开发专项学习

🎯 Agent 面试准备：6周系统学习路线 + 面试题库，面试+实战双管齐下
Agent 开发学习指南：每周详细任务与知识点详解
AI Agent 面试题库：30题完整面试题
多 Agent 独立部署与协作：协议、架构与实战代码示例
LangChain 调用外部工具实战：Tools、Function Calling、MCP 集成
LangChain 开发实战指南：核心组件、LCEL、RAG、Agent 生产实践
Learn Claude Code：12 篇系列教程，深入理解 AI Agent 开发

LLM 基础学习

入门阶段：理解 Transformer 架构和基础概念
进阶阶段：掌握模型训练、微调和优化技术
实践阶段：开发实际应用，解决具体问题
深入阶段：研究前沿技术和架构创新

💡 持续更新中，让我们一起探索大语言模型的无限可能！