开源大模型
10 个项目Llama、Qwen、MiniCPM、FinGPT 等模型权重本身
这是什么
开源大语言模型本身(权重 + 推理代码),不含 runtime 或前端。Llama / Qwen / MiniCPM / FinGPT 等开源 LLM 在这里。
用什么场景
- 本地部署私有问答(数据不出本地,符合合规)
- 在自家产品里嵌入对话能力,避免 API 成本
- 学术研究、模型 fine-tune
- 边缘设备 / 端侧部署(小模型)
选型考虑
显存:7B 模型 fp16 需 14GB,量化后 4-8GB;13B 起步 24GB;70B 推理需多卡。商用授权:Llama 协议有限制(>7 亿月活需谈),Qwen / MiniCPM 协议宽松可商用。中文表现:Qwen / MiniCPM / 文心明显好于纯英文模型。
主流项目
本分类下 10 个开源 LLM,按 GitHub stars 与中文社区活跃度排序。
所有项目10
浏览该分类下的所有开源项目
MiniCPM-o
A Gemini 2.5 Flash Level MLLM for Vision, Speech, and Full-Duplex Multimodal Live Streaming on Your Phone
minimind
🧠「大模型」2小时完全从0训练64M的小参数LLM!Train a 64M-parameter LLM from scratch in just 2h!
FinGPT
FinGPT: Open-Source Financial Large Language Models! Revolutionize 🔥 We release the trained model on HuggingFace.
MiniCPM
MiniCPM4 & MiniCPM4.1: Ultra-Efficient LLMs on End Devices, achieving 3+ generation speedup on reasoning tasks
MiniCPM-V
MiniCPM-V 4.5: A GPT-4o Level MLLM for Single Image, Multi Image and High-FPS Video Understanding on Your Phone
Qwen2.5
Qwen2.5 is the large language model series developed by Qwen team, Alibaba Cloud.
Llama-Chinese
Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用
llama3
The official Meta Llama 3 GitHub site
grok-1
Grok open release
Meta出品下一代开源大语言模型
Inference code for LLaMA models
相关分类
探索其他开源项目分类