GPT 大语言模型 Vicuna 本地化部署实践（效果秒杀 Alpaca） | 京东云技术团队_手机搜狐网

相关文章推荐

腼腆的柑橘 · 灵境行者女主几个-QQ阅读· 2 月前 ·

销魂的大白菜 · erp系统常见面试题及答案 - CSDN文库· 2 月前 ·

不爱学习的柠檬 · 南京投资25亿有轨电车逾期1年仍未开跑，季建 ...· 5 月前 ·

大鼻子的打火机 · 齐越：播音到“开国大典”---党建网· 7 月前 ·

怕老婆的鸵鸟 · “汉味小吃第一街”户部巷重回人间烟火_手机新浪网· 1 年前 ·

上一篇文章《GPT 大语言模型 Alpaca-lora 本地化部署实践》介绍了斯坦福大学的 Alpaca-lora 模型的本地化部署，并验证了实际的推理效果。

总体感觉其实并不是特别理想，原始 Alpaca-lora 模型对中文支持并不好，用 52k 的中文指令集对模型进行 fine-tuning 之后，效果依然达不到网上说的媲美 GPT-3.5 的推理效果，验证了那句话：“事不目见耳闻，而臆断其有无，可乎？”

在具有 3 块 Tesla P40 显卡的服务器上，利用 3 块 GPU 显卡加载模型参数和计算，进行一次简单的推理（非数学运算和逻辑运算）也需要大概 30s-1min 的时间，效率简直慢的惊人。在京东云 GPU 云主机部署上，虽然推理效率提高了很多，用中文数据集对模型进行了 fine-tuning，然而对中文的支持也并不是很好，经常会出现乱码、重复问题、词不达意等情况。

最近大模型也同雨后春笋般的层出不穷，各个大厂和科研机构都推出了自己的大模型，其中基于 LLaMA（开源且好用）的最多，所以决定再看看其他模型，有没有推理效果好，中文支持好，同时推理效率高的模型。

展开剩余 94 %

推荐文章

腼腆的柑橘 · 灵境行者女主几个-QQ阅读

2 月前

销魂的大白菜 · erp系统常见面试题及答案 - CSDN文库

2 月前

不爱学习的柠檬 · 南京投资25亿有轨电车逾期1年仍未开跑，季建业曾力推_长三角政商_澎湃新闻-The Paper

5 月前

大鼻子的打火机 · 齐越：播音到“开国大典”---党建网

7 月前

怕老婆的鸵鸟 · “汉味小吃第一街”户部巷重回人间烟火_手机新浪网

1 年前

总结一下：