Skip to content

大语言模型 (LLM) 探索

欢迎来到大语言模型技术探索专区!这里将深入探讨大语言模型的核心原理、实践应用和前沿技术。

📚 内容概览

本模块专注于大语言模型 (Large Language Model, LLM) 相关的技术内容,涵盖从基础理论到实际应用的完整知识体系。

🧠 核心主题

基础理论

实践应用

前沿技术

工具与框架

  • 开发框架

    • Hugging Face Transformers
    • LangChain / LangGraph
    • LlamaIndex
    • vLLM / TensorRT-LLM
  • 训练框架

    • DeepSpeed
    • FSDP (Fully Sharded Data Parallel)
    • Megatron-LM
    • Colossal-AI
  • 开发工具

  • 部署工具

    • Ollama
    • Text Generation Inference (TGI)
    • TensorRT
    • ONNX Runtime

🎯 学习路径

Agent 开发专项学习

LLM 基础学习

  1. 入门阶段:理解 Transformer 架构和基础概念
  2. 进阶阶段:掌握模型训练、微调和优化技术
  3. 实践阶段:开发实际应用,解决具体问题
  4. 深入阶段:研究前沿技术和架构创新

💡 持续更新中,让我们一起探索大语言模型的无限可能!

Released under the MIT License.