学习大纲

第一阶段：语言

目标：掌握编程语言工具，补齐必要的数学基础，理解AI基本概念。

编程语言：Python（核心中的核心）

基础语法：变量、数据类型、控制流（if/for/while）、函数、模块与包。

面向对象：类与对象、继承、多态。

数据处理三剑客：

NumPy：矩阵运算、数组操作（AI的数学基石）。

Pandas：数据清洗、DataFrame操作、数据预处理。

Matplotlib / Seaborn：数据可视化，绘制图表分析数据。

数学基础（够用即可，不必深究证明）

线性代数：向量、矩阵乘法、特征值与特征向量（理解神经网络权重的关键）。

微积分：导数、偏导数、梯度下降法（理解模型如何“学习”和优化的核心）。

概率论与统计：条件概率、贝叶斯定理、分布（正态分布等）、期望与方差。

AI通识

了解AI发展史、主要流派（符号主义、连接主义）。

区分概念：人工智能(AI) vs 机器学习(ML) vs 深度学习(DL) vs 大语言模型(LLM)。

第二阶段：算法

目标：掌握传统机器学习算法，学会使用经典框架解决分类、回归等问题。

机器学习理论

监督学习：

回归算法：线性回归、逻辑回归。

分类算法：K近邻(KNN)、支持向量机(SVM)、决策树、随机森林。

无监督学习：

聚类：K-Means、DBSCAN。

降维：主成分分析(PCA)。

模型评估：准确率、精确率、召回率、F1分数、ROC曲线、过拟合与欠拟合的处理（正则化、交叉验证）。

工具框架

Scikit-learn：熟练掌握其API，完成从数据加载、预处理、训练到评估的全流程。

实战项目

泰坦尼克号生存预测（经典入门）。

房价预测模型。

手写数字识别（使用传统ML方法）。

第三阶段：大模型

目标：进入现代AI核心，掌握神经网络、Transformer架构及大模型应用。

深度学习基础

神经网络原理：感知机、激活函数(ReLU, Sigmoid)、反向传播、损失函数。

框架选择：PyTorch（目前学术界和工业界主流，推荐首选）或 TensorFlow/Keras。

核心网络结构：

CNN（卷积神经网络）：用于图像识别、物体检测。

RNN/LSTM/GRU：用于序列数据（虽逐渐被Transformer取代，但需了解原理）。

Transformer与大语言模型 (LLM)

Transformer架构：Self-Attention机制、Encoder-Decoder结构（理解BERT, GPT系列的基础）。

大模型应用开发：

Prompt Engineering（提示词工程）：如何高效与大模型对话。

RAG（检索增强生成）：结合外部知识库构建问答系统（LangChain框架）。

微调技术：LoRA、P-Tuning等参数高效微调方法，让大模型适应特定任务。

多模态技术：理解图文生成（如Stable Diffusion, Midjourney原理）、视频生成模型。

实战项目

使用PyTorch从头搭建一个CNN识别猫狗图片。

基于Hugging Face调用预训练大模型，构建一个垂直领域的智能客服助手。

利用LoRA微调开源模型（如Llama 3或Qwen），使其能写特定风格的诗歌或代码。

第四阶段：工程化

目标：将模型部署落地，关注前沿方向，构建个人作品集。

MLOps与模型部署

环境管理：Docker容器化、Conda虚拟环境。

模型服务化：使用FastAPI/Flask将模型封装为API接口。

云端部署：熟悉AWS、Azure或阿里云的AI算力平台，或使用Hugging Face Spaces部署Demo。

版本控制：Git与GitHub协作流程。

前沿方向探索

具身智能 (Embodied AI)：AI与机器人结合，感知并物理交互。

强化学习 (RL)：AlphaGo原理，用于游戏AI或复杂决策控制。

AI Agent (智能体)：让AI自主规划任务、使用工具、多步推理。

AI

相关概念

AI的核心特点

AI的主要类型

AI的应用领域

学习大纲

第一阶段：语言

目标：掌握编程语言工具，补齐必要的数学基础，理解AI基本概念。

第二阶段：算法

目标：掌握传统机器学习算法，学会使用经典框架解决分类、回归等问题。

第三阶段：大模型

目标：进入现代AI核心，掌握神经网络、Transformer架构及大模型应用。

第四阶段：工程化

目标：将模型部署落地，关注前沿方向，构建个人作品集。