冬奥会有哪些比赛项目视频回放_冬奥会有哪些比赛项目 天天短讯
1、-冬奥会项目介绍--滑板滑雪-冬奥会项目介绍--自由式滑雪-冬奥会项目介绍--速滑-冬奥会项目介绍--
站长之家(ChinaZ.com)5月26日 消息:有一种名为 QLoRA 的新方法可以在单个 GPU 上微调大型语言模型。目前已经有研究人员用它来训练 Guanaco,这是一个性能效果99% 接近ChatGPT的聊天机器人。
(资料图)
华盛顿大学的研究人员提出了微调大型语言模型的方法 QLoRA。该团队利用 QLoRA 发布了 Guanaco,这是一个基于Meta 的 LLaMA模型的聊天机器人系列。最大的 Guanaco 变体具有650亿个参数,在与GPT-4的基准测试中实现了ChatGPT ( GPT-3.5-turbo )99% 以上的性能。
微调大型语言模型是提高其性能和训练的最重要技术之一。然而,这个过程对于大型模型来说计算量非常大,例如 LLaMA65B ,在这种情况下需要超过780GB 的 GPU RAM。虽然开源社区使用各种量化方法将16位模型简化为4位模型,从而大大减少了推理所需的内存,但类似的方法还没有用于微调。
QLoRA 允许在单个 GPU 上微调650亿个参数 LLM
通过 QLoRA,该团队展示了一种方法,允许将 LLaMA 等模型量化为4位,并添加LORA模型,然后通过反向传播进行训练。通过这种方式,该方法可以实现4位模型的微调,并将650亿参数模型的内存需求从超过780GB 降低到不到48GB 的 GPU 内存,其结果与微调16位模型相同。
“这标志着LLM微调的可访问性发生了重大转变:现在是迄今为止在单个GPU上微调的最大公开可用模型,”该团队说。
为了测试 QLoRA 和不同微调数据集的影响,该团队在八个不同的数据集上训练了1,000多个模型。一个关键发现:数据的质量比任务的数量更重要。例如,在OpenAssistant 的9,000个人类样本上训练的模型比在 FLANv2的100万个样本上训练的模型更适合聊天机器人。因此,对于 Guanaco,该团队依赖于 OpenAssistant 数据。
开源模型 Guanaco 达到 ChatGPT 级别
该团队使用 QLoRA 训练了 Guanaco 系列模型,表现第二好的模型在基准测试中以330亿个参数实现了 ChatGPT 性能的97.8%,同时在不到12小时的时间内在单个普通的 GPU 上对其进行了训练。在专业 GPU 上,该团队仅用24小时就训练了具有650亿个参数的最大模型,并达到了ChatGPT 性能的99.3% 。
最小的 Guanaco 模型具有70亿个参数,仅需要5GB 的 GPU 内存,并且在 Vicuna 基准测试中比26GB 的羊驼模型高出20个百分点以上。
除了 QLoRA 和 Guanaco,该团队还发布了 OpenAssistant 基准测试,该基准测试在953个提示示例中让模型相互竞争。然后可以由人类或 GPT-4对结果进行评分。
Guanaco数学不好,QLoRA可用于移动微调
不过,该团队引用数学能力和4位推理目前非常慢。接下来,该团队希望提高推理能力,预计速度提升8至16倍。
由于微调是将大型语言模型转变为类似 ChatGPT 的聊天机器人的重要工具,该团队相信 QLoRA 方法将使微调更容易获得——尤其是对于资源较少的研究人员而言。他们认为,这对于自然语言处理领域尖端技术的可访问性来说是一个巨大的胜利。
论文指出:“QLORA 可以被视为一个平衡因素,有助于缩小大型企业与拥有消费类 GPU 的小型团队之间的资源差距。这也意味着,小企业可以通过像 Colab 这样的云服务进行微调大模型。
除了微调当今最大的语言模型外,该团队还看到了私有模型在移动硬件上的应用。“QLoRA 还将在您的手机上启用隐私保护微调。我们估计您每晚可以使用 iPhone12Plus 微调300万个单词。这意味着,很快我们将在手机上拥有专门针对每个应用程序的LLM。”第一作者 Tim Dettmers 在 Twitter 上说。
关于Guanaco-33B 更多信息和代码可到 GitHub 查看。
参考网址:
https://github.com/artidoro/qlora
相关产品可访问《有哪些类似chatgpt产品? 17 个ChatGPT/GPT4 开源替代品推荐(附网址)》一文了解。
关键词:
1、-冬奥会项目介绍--滑板滑雪-冬奥会项目介绍--自由式滑雪-冬奥会项目介绍--速滑-冬奥会项目介绍--
中国佛教协会代表团赴韩国出席燃灯会庆祝活动
由于可能存在的数据隐私问题,特拉斯接受德国和荷兰当局的调查,据悉涉及该公司的自动驾驶辅助驾驶产品。特
视频截图前天傍晚,上海内环高架宜山路附近发生一起交通事故,一辆黄色工程车,骑上了高架边上的护栏……网
1、唐玉秀-闫妮程小林-佟悦顾丽丽-姚晨程媛媛-代乐乐程母-宫景华老路-白志迪唐秉福-张绍荣
1、毫无违和感:一点都不会与周围的环境有冲突,非常协调。2、违和感,就是指因为与周围的环境不适应、不协
波罗的海干散货运价指数周四录得2月中旬以来最大单日跌幅,所有型船运价指数继续走低。波罗的海干散货运价
来为大家解答以下的问题,付宝会员积分怎么获得最快,支付宝会员积分有什么用这个很多人还不知道,现在让我
1、武汉科技大学城市建设学院开设建筑学、土木工程、建筑环境与设备工程、给水排水工程、城乡规划五个本科
国内大大小小的电动车品牌数不胜数,不少品牌虽然有影响力,不过都带有一定的“地域”属性,比如只在某一区
点击图片观看视频大象新闻中心记者:夏继锋向光笑薇苏珊成娟丁阳明全王朔你好,欢迎来到《锋评》,有句话说
央广网北京1月20日消息(北京台记者石兴瑞)据中国之声《全国新闻联播》报道,北京市统计局、国家统计局北京
经济学家民调显示,印度央行将在今年12月前将回购利率提高至6%。自5月累计加息140个基点后,经济学家们预计
由于业绩的发布的延期,国美零售已经停牌。停牌前,国美零售的股价仅为0 105港元 股,市值也仅剩下了50 15
过去,连接发动机与动力系统的核心装置是变速箱。电动汽车时代来临,牵引逆变器成功代替变速箱,成为电力驱
“考虑到原材料价格逐步趋于理性,各地能源配储政策逐步完善,商业模式不断优化的独立储能有望持续高速增长
惠州市三县四区同步严查“摩电”交通违法行为。针对分析研判出来的“摩电”交通违法重点路段、重点区域,进
5月25日,随着右幅悬臂现浇箱梁节段的浇筑完成,黄沙港特大桥连续梁顺利合龙,标志着国道204江苏省盐阜快速
25日,美团发布2023年一季度财报。财报显示,一季度,美团各项业务继续取得稳步增长,实现营收586亿元,同
近日,一段国泰航空成都飞往香港航班上空乘人员歧视非英语乘客的录音曝光,引来社会广泛关注与谴责。录音中
“走向世界,创一流企业。”在ST泰禾(000732 SZ)官网上,创始人黄其森如此畅想泰禾未来。这位外表敦厚、但
据英国《金融时报》和《华尔街日报》5月24日消息,花旗集团表示,将通过IPO剥离2001年收购的墨西哥零售银行
大家好,今日关于【四川一初中生疑被同学围殴致死】的话题登上了各大平台的热搜榜,受到全网的关注度非常高
1、将军崖第二组岩画位于连云港市海州区锦屏镇桃花村、锦屏山南麓的后小山的南侧,长9米、宽9米,以太阳、
5月23日,“昆明银行口专家路演要点”和《昆明城投专家会议纪要》的文件在网上掀起风波。这些文件透露出信