张士玉小黑屋

一个关注IT技术分享，关注互联网的网站，爱分享网络资源，分享学到的知识，分享生活的乐趣。

当前位置：首页 » 《随便一记》 » 正文

开源模型：小羊驼（Vicuna-13B），可达chatGPT九成效果。

6 人参与 2023年05月04日 10:25 分类 : 《随便一记》评论

点击全文阅读

参考链接：https://mp.weixin.qq.com/s/OK5NLLVSBLb-4QsnqGp45g

文章目录

简要介绍模型介绍数据来源模型评估方法模型局限性模型总体评价

简要介绍

以 Meta 开源 LLaMA（直译为「大羊驼」）系列模型为起点，研究人员逐渐研发出基于LLaMA的Alpaca（羊驼）、Alpaca-Lora、Luotuo（骆驼）等轻量级类 ChatGPT 模型并开源。

近日，研究者们又提出了一个新的模型：Vicuna（小羊驼）。该模型基于LLaMA，参数量13B。Vicuna-13B 就是通过微调 LLaMA 实现了高性能的对话生成

有趣的是，在该模型的评测环节中，作者没有通过某种“标准化考试”来测定模型性能，而是让GPT-4当考官，看看 GPT-4 更倾向于 Vicuna-13B 还是其他基线模型的答案。结果显示，相比于现有的 SOTA 开源模型（LLaMA、Alpaca），GPT-4 在超过 90% 的问题中更倾向于 Vicuna，并且 Vicuna 在总分上达到了 ChatGPT 的 92%。

Vicuna（小羊驼）已开源，项目地址：https://github.com/lm-sys/FastChat
demo 地址：https://chat.lmsys.org/

PS：浅浅玩了一下。总结：虽然没有chatGPT厉害，但是也不能算差了吧！而且开源是真香：）
在这里插入图片描述

在这里插入图片描述

模型介绍

数据来源

Vicuna 使用从 ShareGPT 收集的用户共享数据对 LLaMA 模型进行微调。从 ShareGPT 收集了大约 7 万个对话。ShareGPT 是一个 ChatGPT 数据共享网站，用户会上传自己觉得有趣的 ChatGPT 回答。

在这里插入图片描述

模型评估方法

该研究创建了 80 个不同的问题，并利用 GPT-4 来初步评估模型的输出质量，其中将每个模型的输出组合成每个问题的单个 prompt。然后将 prompt 发送到 GPT-4，由 GPT-4 来根据有用性、相关性、准确性和细节来评估上述模型生成的答案质量。

在这里插入图片描述
下面是小羊驼-13B和其他模型的一些比较：

模型局限性

不擅长推理或数学任务，还有在输出信息的准确性和偏见等方面存在缺陷。

模型总体评价

作为一个开源模型，性能总体上可以达到 ChatGPT 的 90%，已经非常难得，并且成本较低，只需 300 美元。

点击全文阅读

本文链接：http://zhangshiyu.com/post/60604.html

《随便一记》

<< 上一篇下一篇 >>

评论（0）

赞助本站

search zhannei

最新文章
替兄弟结婚，我的新娘竟是绝色总裁（林婉儿唐建业王腾） 出狱当天，前夫另娶，我夺走他千亿家产 我听话引诱别人后，京圈太子爷悔哭了 春风与你不同归 转职做恶女，怎么深陷修罗场了！ 夫人白月光回国，沈总你出局了 我离开以后，全家悔不当初（赵芷萱程慕深）_我离开以后，全家悔不当初 重生后，我天天给老公儿子暖被窝 夫君纳妾忙，我偷心上月 重生后，我把渣男送上了电椅（周辰林薇顾衍）全书免费_（周辰林薇顾衍）重生后，我把渣男送上了电椅后续（周辰林薇顾衍） 长公主黑化归来，满朝文武争红眼（楚凝秦撼）_长公主黑化归来，满朝文武争红眼 闺蜜双穿后，渣男皇帝火葬场了全书林婉萧儿在线

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1