使用 C++ 实现完整 Transformer 训练实现中英文翻译的模型,蒸馏,微调模型、LORA、RAG、向量数据库等等
Stars
1
Forks
0
Watchers
Open Issues
Overall repository health assessment
No package.json found
This might not be a Node.js project
User
27
commits
[注释]
7943eb4
[1. 适度增加 Stream 2:数据缓存 + 混合精度训练]
d33950b
[增加多进程加载数据 和 延迟 loss 提取 优化]
81bb13b
6fe052b
[多进程加载数据集]
2147cde
[中文日志改为英文日志]
8b94d22
[GPU使用率不高问题分析]
9f20d28
[增加cuda stream 处理增加GPU使用效率]
a9c6265
[修复训练过程中 显存 不释放问题 , 每次batch 就不释放上一次的显存]
a61b035
[使用 C++ 实现完整 Transformer 训练实现中英文翻译的模型,蒸馏,微调模型、LORA、RAG、向量数据库等等]
1ca1445
[保存数据格式config.yal]
b250a8e
[训练过程显示每秒处理token数量]
11369f7
[训练过程输出格式参考yolov5风格]
281de64
[训练显示和yolov5显示风格一样的]
7ee6393
[GPUProfiler 显示]
cb1e92a