阿里云宣布通义千问 720 亿参数模型开源
本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向 72B、1.8B 对话模型提供了 4bit / 8bit 量化版模型,便于开发者们推理训练。
IT之家注:阿里云此前已经开源了 70 亿参数模型 Qwen-7B 以及 140 亿参数模型 Qwen-14B。
据介绍,Qwen-72B 搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制自己的 AI 助手,要求大模型扮演某个角色,或者执行特定的回复任务。
IT之家附模型链接:
通义千问-72B-预训练:
- https://modelscope.cn/models/qwen/Qwen-72B
通义千问-72B-Chat:
- https://modelscope.cn/models/qwen/Qwen-72B-Chat
通义千问-72B-Chat-Int8:
- https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int8
通义千问-72B-Chat-Int4:
- https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int4
通义千问-1.8B-预训练:
- https://modelscope.cn/models/qwen/Qwen-1_8B
通义千问-1.8B-Chat:
- https://modelscope.cn/models/qwen/Qwen-1_8B-Chat
通义千问-1_8B-Chat-Int8:
- https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int8
通义千问-1_8B-Chat-Int4:
- https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int4
通义千问-Audio-预训练:
- https://modelscope.cn/models/qwen/Qwen-Audio
通义千问-Audio-Chat:
- https://modelscope.cn/models/qwen/Qwen-Audio-Chat
模型下载(以通义千问-72B-Chat-Int4 为例):
from modelscope import snapshot_downloadmodel_dir = snapshot_download("qwen/Qwen-72B-Chat-Int4")
免责声明:以上内容(如有图片或视频亦包括在内)为本站用户上传并发布,本站仅提供信息存储服务。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,如有侵权违规信息请联系删除。