发布时间:2023-08-07 15:06:12
来源:股票啦
股票啦网 www.gupiaola.com 2023年08月07日报道:周一股市大盘走势预测通义千问Qwen7B是支持中英等多种语言的基座模型
摘要:全球紧紧围绕大模型生态迎来了新一轮道路之争。
今年以来,全球互联网大厂掀起“百模大战”,微软、谷歌、百度(BIDU)、阿里等接连下场。经过半年多的竞争周一股市大盘走势预测,科技巨头们紧紧围绕大模型生态正迎来新一轮道路之争:面对参数“天花板”,大模型的将来走向封闭還是开放?
开源模型可在家用电脑运作
8月3日,国内AI开发者社区“魔搭”(ModelScope)上架两款开源模型Qwen-7B和Qwen-7B-Chat,分别为阿里云通义千问的70亿参数通用模型和对话模型,两款模型均开源、免费、可商用。
据介绍,通义千问Qwen-7B是支持中英等多种语言的基座模型,在超过2万亿token(文本单位)数据集上训练,而Qwen-7B-Chat是基于基座模型的中英文对话模型,已达到人类的认知水平。简而言之周一股市大盘走势预测,前者好比“地基”,后者是地基之上的“房屋”。
经过实际测试显示,Qwen-7B模型的综合表现不俗。其中在英文能力测评基准MMLU上,得分普遍高于同等参数规模的主流模型,乃至赶超120亿、130亿参数规模的部分模型。而在中文评测C-Eval验证集上,该模型也取得了同等规模的最高分。在数学解题能力评测GSM8K和代码能力评测HumanEval方面,Qwen-7B模型表现也独占鳌头。
也就是说,在中英文写作、数学解题以及写代码等考试中,Qwen-7B模型妥妥是一名“学霸”,分数乃至超过同等参数级别的国际主流大模型。
除此之外,业界更关怀Qwen-7B模型的易用性。众所周知,主流大模型的训练和运作需要特意的AI训练芯片(如英伟达A100),这些芯片不仅售价昂贵,每块英伟达A100售价高达1万—1.5万美元周一股市大盘走势预测,而且被欧美等國家垄断,国内几乎无法购买。而国产Qwen-7B模型支持消费级显卡上部署,相当于高性能的家用电脑就能运作该模型。
得益于免费商用加上低门槛,Qwen-7B模型的上架,引起了AI开发者的关心。短短一天,在代码托管平台GitHub上,Qwen-7B模型已被千余名开发者标星收藏,绝大多数提问者均为中文开发者。正如阿里云在声明中所说:“相比英文世界喧闹的AI开源生态,中文社区缺少优秀的基座模型。通义千问的加入有望为开源社区提供更多挑选,促进中国AI开源生态建设。”
开源還是封闭
事实上,Qwen-7B模型并非首款开源的大模型,其实ChatGPT的“前辈”GPT-2还是彻底开源的,其代码和框架在互联网上均可免费使用周一股市大盘走势预测,还有相关论文可供查阅。而OpenAI在ChatGPT火遍全球之后挑选了闭源进展,GPT-3和GPT-4等模型代码已成为OpenAI的商业机密。
所谓开源,就是开放源代码。比如大模型一旦宣布开源后,在版权限制范围内,任何人可以公布猎取模型源代码,并进行修改乃至重新开发。打个容易的比方,源代码就像是一幅画的底稿,全部人可以照着底稿填色建造自己的艺术画作。
闭源与开源恰好相反,只有源代码全部者(通常是软件开发商)把握代码修改的权力,其他人没方法猎取“底稿”,只能向软件开发商购买成品。
开源和闭源的优劣都比较突出。大模型开源后无疑会吸引更多开发者,大模型的应用也将更加丰富,但相应的监管和商业化将成为难题,简单隐藏“替人做嫁衣”的尴尬局面。毕竟,开源考虑的是生态共荣周一股市大盘走势预测,究竟能赚多少钱的经济发展账,这一阶段很难算清晰,而这些难题恰好是闭源的机会。
开源還是闭源,这是一道大模型的生死题,国际巨头已给出答案。
Facebook母公司Meta在上个月公布了大模型Llama2,开源免费给开发者和商业同伴使用,而OpenAI则坚定地挑选了GPT-4闭源进展,不仅能维持OpenAI在生成式AI行业的领先地位,还能赚取更多营收。根据权威杂志《Fast Company》预测周一股市大盘走势预测,OpenAI在2023年的收入将达到2亿美元,包含提供API数据接口服务、谈话机器人(300024)订阅服务费等。
国内大模型也渐渐开端“分道扬镳”。阿里云的通义大模型早在今年4月宣布向企业开放,Qwen-7B模型的开源将开放之路走的更远一些。百度(BIDU)的文心一言也在最近宣布,将逐步开放插件生态给第三方开发者,帮忙开发者基于文心大模型打造自己的应用。
相比之下,华为则不走平常路。在公布盘古大模型3.0时,华为云公布表达,盘古大模型全栈技术均由华为自主创新的,没有运用任何开源技术,同时盘古大模型将聚拢无数行业大数据(涉及行业机密等),因此盘古大模型在将来也不会开源。
大参数還是小而美
除此之外周一股市大盘走势预测,Qwen-7B模型的开源,还带来了另一个思考:人们究竟需要多大参数的大模型?
不可否认,大模型的参数规模正在不断膨胀。以OpenAI旗下的GPT大模型为例,GPT-1仅包含1.17亿参数,GPT-3的参数已经高达1750亿,几年时间内增长了1000多倍,而GPT-4的参数已超过万亿级别。
国内大模型亦是如此。百度(BIDU)文心大模型为2600亿参数,腾讯混元大模型达到千亿级参数,华为盘古大模型参数规模推测贴近GPT-3.5,阿里通义大模型官宣已达10万亿参数……据不良好统计,中国10亿参数规模以上的大模型至少有79个。
遗憾的是,参数越大并不代表大模型的能力越强。在世界人工智能(161631)大会上,腾讯云副总裁吴运声有一个很恰当的比喻:“就像运动员练体力,举重运动员要举200斤杠铃周一股市大盘走势预测,游泳运动员举100斤就够了,不同类型的运动员不需要每个人都练习200斤重的杠铃。”
众所周知,大模型的参数越高,消耗的资源和成本也越相应增加。而深耕行业的垂直类大模型,并不需要一味追求“规模大”或是“参数高”,更应该根据客户需求制定相关的模型参数。比如生物大模型BioGPT-Large仅有15亿参数,而在生物医学专业测试中的精确率,却优于千亿级别参数的通用大模型。
OpenAI联合创始人Sam Altman也公布表达,OpenAI正贴近LLM(大型语言模型)规模的极限,规模越大并不肯定意味着模型越好,参数规模不再是衡量模型质量的重大指标。
火山引擎智能算法负责人吴迪也有类似观点,长期看来,降低成本将成为大模型应用落地的重大因素,“一个经过良好精调的中小规格模型周一股市大盘走势预测,在特定工作上的表现可能不亚于通用大模型,而成本可仅为原来的非常之一。”
当下,国内科技大厂几乎都拿到了大模型的入场券,但真正的道路抉择才刚开端。
snakeliar福建南安中信一看好就没好事!
红彤彤99999浙江江山我只想问一下目前这种情况下美国的信用评级下调了吗
股友Iiw6dZ四川万源将贷款利率吗,请问是房贷还是消费贷?
中线主力88888广西宜州别老骂别人了
牛逼可拉斯山西太原如何监控?
k小散甘肃敦煌什么动作,砸盘
价值投机的文书江苏灌南县我许愿这些机构早日倒闭
俯首弄股湖北潜江利好以岭药业
阅微股堂宁夏青铜峡股民的获得感就是帐户数字常红,分红送股不除权
心有信仰必有厚报内蒙古阿尔山稳了,看来真稳了,这下A股真的是稳了!
四明农夫河南郑州[赞]
股友bldGhI江西赣州真刺激
股友i5VouK甘肃武威利好股市!3000点可期!
华为概念叠加5G江苏溧阳预计:恩华药业三年之内股价涨幅10倍的概率较大
上一篇:每日股票大盘分析_玉米等粮食作物的种植具有相对的固定性和规划性 下一篇:股市大盘行情分析_航天通信2016年
今日股市行情 | 美股行情 | 明日股市预测 | 最新股市消息 | 今日股票推荐 | 今日股市新闻 | 股票入门基础知识