这是一份入门AI/LLM大模型的逐步指南,包含教程和演示代码,带你从API走进本地大模型部署和微调,代码文件会提供Kaggle或Colab在线版本,即便没有显卡也可以进行学习。项目中还开设了一个小型的代码游乐场🎡,你可以尝试在里面实验一些有意思的AI脚本。同时,包含李宏毅 (HUNG-YI LEE)2024生成式人工智能导论课程的完整中文镜像作业。
Stars
3.9k
Forks
413
Watchers
3.9k
Open Issues
3
Overall repository health assessment
No package.json found
This might not be a Node.js project
🔧 修改 Demo 06 使用 TRL SFTTrainer + completion_mask 实现 output-only 训练,对齐原始代码的预期行为(#17)
97e012bView on GitHub🔧 Demo 14 更换失效的 SD 模型(cyberrealistic-41 → cyberrealistic),添加 use_safetensors=False 去除部分警告
32dc565View on GitHub✍️ 文章《14. PEFT:在大模型中快速应用 LoRA》增加实际的样例数据集演示,更新相关代码,补充关于 PEFT get_peft_model() 的官方修复进度
90025a0View on GitHub✍️ 更新文章 19a/19b 对于 GPTQModel/vLLM/llama-cpp-python 的相关描述和代码
0c038e1View on GitHub