原文地址:http://news.sciencenet.cn/htmlnews/2023/9/508206.shtm
近日,在北京市科委、中关村管委会和北京市海淀区政府的指导下,以“百川汇海,开源共赢”为主题的大模型发布会在京召开。会上,百川智能宣布正式开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat与其4bit量化版本,并且均为免费可商用。
中国科学院院士张钹致辞 主办方供图
据悉,Baichuan2-7B和Baichuan2-13B将对学术研究完全开放。百川智能此次还开源了模型训练的Check Point,并宣布将发布 Baichuan 2 技术报告,详细介绍Baichuan 2 的训练细节,帮助大模型学术机构、开发者和企业用户更深入地了解其训练过程,更好地推动大模型学术研究和社区的技术发展。
中国科学院院士张钹在致辞中指出,当前我国推出的大模型主要集中于垂直领域的应用上,目前关于大模型本身的研究亟待推进。他认为,目前世界上对大模型的理论工作原理、产生现象等仍不清楚,只有将这些问题研究清楚,才能发展出具有中国特色的大模型。
百川智能相关负责人介绍说,Baichuan 2-7B-Base 和 Baichuan 2-13B-Base,均基于 2.6万亿高质量多语言数据进行训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署门槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。其中Baichuan 2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。
此外,本次开源的两个模型在各大评测榜单上也表现优秀,在MMLU、CMMLU、GSM8K等几大权威评估基准中,远远领先LLaMA2,相比其他同等参数量大模型,表现也十分亮眼,性能大幅度优于LLaMA2等同尺寸模型竞品。尤其是,根据MMLU等多个权威英文评估基准评分 Baichuan2-7B以70亿的参数在英文主流任务上与130亿参数量的LLaMA2持平。
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515398.shtm近日,油料所油料作物基因组学与抗病性改良创新团队创制出一种同时抗菌核病和灰霉病的新种......
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515397.shtm......
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515395.shtm......
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515394.shtm近日,华东理工大学教授郭旭虹团队提出了一种通过反应扩散控制动态超分子自组装的新策略,......
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515393.shtm近日,2024龙年指导性年度汉字“家”在郑州黄河人文馆正式揭晓,河南文教界200人参......
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515392.shtm2023年12月31日,AI科学跨年大型直播《科技向未来》在“科普中国”和“北京时间......
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515391.shtm甘肃省科学院生物研究所绿色农药科研团队承担的应用研发项目,“黄帚橐吾提取物的杀虫机理......
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515390.shtm......
原文地址:http://www.mee.gov.cn/xxgk2018/xxgk/xxgk06/202401/t20240103_1060505.html名称关于公开征求《火电行业建设项目温室气体排放......
原文地址:http://www.mee.gov.cn/xxgk2018/xxgk/xxgk06/202401/t20240103_1060504.html名称关于公开征求《国家危险废物名录(修订稿)(......