当前位置:首页 > 百科 > 正文

跑分达ChatGPT的99%,人类难以分辨!开源「原驼」大模型爆火

跑分达ChatGPT的99%,人类难以分辨!开源「原驼」大模型爆火

梦晨 发自 凹非寺量子位 | 公众号 QbitAI自动测试分数达到ChatGPT的99.3%,人类难以分辨两者的回答……这是开源大...

梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

自动测试分数达到ChatGPT的99.3%人类难以分辨两者的回答……

这是开源大模型新成果,来自羊驼家族的又一重磅成员——华盛顿大学原驼(Guanaco)

更关键的是,与原驼一起提出的新方法QLoRA把微调大模型的显存需求从>780GB降低到> 数据数量

  • 指令微调有利于推理,但不利于聊天
  • 后,QLoRA的高效率,还意味着可以用在手机上,论文共同一作Tim Dettmers估计以iPhone 12 Plus的算力每个晚上能微调300万个单词的数据量。

    这意味着,很快手机上的每个App都能用上专用大模型。

    论文:

    https://arxiv.org/abs/2305.14314

    GitHub:

    https://github.com/artidoro/qlora

    与ChatGPT对比测试:

    https://colab.research.google.com/drive/1kK6xasHiav9nhiRUJjPMZb4fAED4qRHb

    330亿参数版在线试玩:

    https://huggingface.co/spaces/uwnlp/guanaco-playground-tgi

    参考链接:

    [1]https://twitter.com/Tim_Dettmers/status/1661379376225697794

    [2]https://huggingface.co/blog/4bit-transformers-bitsandbytes

    — 完 —

    量子位 QbitAI · 头条号签约

    以上就是【跑分达ChatGPT的99%,人类难以分辨!开源「原驼」大模型爆火】的相关内容,查看其它热门资讯请持续关注DDX指标网

    发表评论

    新文章