号称优于ChatGPT,Meta加入AI军备竞赛:发布开源大语言模型
(资料图片)
继微软、谷歌之后,脸书(Facebook)母公司Meta(Nasdaq:META)也加入AI军备竞赛。当地时间2月24日,Meta官网公布了一款新的人工智能大型语言模型LLaMA,从参数规模来看,Meta提供有70亿、130亿、330亿和650亿四种参数规模的LLaMA模型,并用20种语言进行训练。Meta首席执行官马克·扎克伯格表示,LLaMA模型旨在帮助研究人员推进工作,在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面有很大的前景。怎么理解人工智能大型语言模型的参数?据悉,AIGC(利用人工智能技术来生成内容)形成的学习能力在一定程度上取决于参数的规模。Open AI推出的ChatGPT是通过其AI大模型GPT-3的基础上通过指令微调后得到的,参数量达1750亿,谷歌推出的Bard使用的是轻量级LaMDA模型,相比标准版本,轻量化版本模型所需要的运算能力较小,能面向更多使用者开放,使其参与体验,有报道指出LaMDA模型参数量在1370亿。百度文心大模型参数量达到2600亿,阿里则表示,从过往实践来看,其具备支撑超万亿参数大模型研发的技术实力。Meta此次推出的大模型实力如何呢?Meta首席AI科学家杨立昆(Yann LeCun)表示,在一些基准测试中,LLaMA 130亿参数规模的模型性能优于OpenAI推出的GPT3,且能跑在单个GPU上;650亿参数的LLaMA模型能够和DeepMind 700亿参数的Chinchilla模型、谷歌5400亿参数的PaLM模型竞争。法新社称,按照Meta的表述,LLaMA是一套“更小、性能更好”的模型,且不同于谷歌的LaMDA和OpenAI的GPT机密训练资料和演算,LLaMA是基于公开资料进行训练。Meta在官网表示,在大型语言模型中,像LLaMA这样的小型基础模型是可取的,因为测试新方法、验证他人的工作和探索新用例所需的计算能力和资源要少得多。基础模型基于大量未标记的数据进行训练,这使得它们非常适合于各种任务的微调。与其他大型语言模型一样,LLaMA的工作原理是将一系列单词作为输入,并预测下一个单词以递归生成文本。Meta称将致力于这种开源模型的研究,新模型会开源给整个AI研究社区使用,并授予大学、非政府组织和行业实验室访问权限。另外,Meta表示其还有更多研究需要做,以解决大型语言模型中的偏见、有害评论等风险。Meta披露的2022年第四季度财报显示,该公司已连续第三个季度出现营收同比下滑,四季度营收312.54亿美元,同比下降4%。广告为Meta的支柱业务,为第四季度的总营收贡献超97%,报告期内,尽管广告展现量增长了23%,但单位广告价格下滑了22%。截至美东时间2月24日,Meta股价跌0.96%报170.390美元/股,总市值4418亿美元。相关阅读
精彩推荐
- 号称优于ChatGPT,Meta加入AI军备竞赛:发布开源大语言模型
- 每日热门:终日乾乾
- 烧碱专题报告——供需分析
- 报道:酒店一次性刮胡刀怎么用_刮胡刀怎么用
- 巨神兵 天天时讯
- 怎样提高学生解决问题的能力 如何提高学生解决问题的能力|每日关注
- PremiereProCS5.5具有改进的监视文件夹功能 环球快播报
- 每日消息!童话大王
- 资讯推荐:苦水高高跷_关于苦水高高跷的简介
- 第73届柏林国际电影节公布获奖名单
- 董重
- 博物馆美术馆探路美育新发展
- 全球热点评!上海旅游必去景点_上海有什么好玩的旅游景点
- 全球今日报丨摩托罗拉me525
- 热门看点:无人深空太空站有什么用_无人深空太空站有什么用途
- 中国政治年报 2014年版
- 人到中年,进行“夫妻生活”应该注意什么,听听这三位女士的说法|全球热议
- 每日速讯:无主之地剧情深度解析_无主之地剧情
- 前海p2p_全球快播报
- p 和a 的拼读_p health 简讯
- 世界滚动:柏林奇遇记!李梦晒与金敏喜合照 网友:梦幻联动
- 总统我们离婚吧 每日快看
- 每日消息!结婚整人游戏特别坏的_结婚整人游戏
- 义乌市易开盖实业公司-当前快播
- 云南蒙自市冷泉镇壮大村集体经济:走好“牛路子” 赚得“牛票子”_当前信息
- 团购机票哪个平台最便宜_团购机票 焦点
- 天津动物园门票多少钱_福州动物园门票多少钱 全球快资讯
- 全球快看点丨九河寻真_2016
- 甲醇期现价格双双企稳回升 上半年或维持震荡偏强走势
- 桂林生育保险缴费指南