千问14b-int4模型加载失败 #2993

leizhu1989 · 2024-02-18T09:43:28Z

问题描述 / Problem Description
CUDA_VISIBLE_DEVICES=2,3 python startup.py -a --model-name Qwen-14B-Chat-Int4 运行startup.py 报错

环境信息 / Environment Information

langchain-ChatGLM 版本/commit 号：master分支
是否使用 Docker 部署（是/否）：是 / Is Docker deployment used (yes/no): no
使用的模型（ChatGLM2-6B / Qwen-7B 等）：ChatGLM-6B / Model used (ChatGLM2-6B / Qwen-7B, etc.): Qwen-14B-Chat-Int4
使用的 Embedding 模型（moka-ai/m3e-base 等）：m3e-base
使用的向量库类型 (faiss / milvus / pg_vector 等)： faiss
操作系统及版本 / Operating system and version: ubuntu18.04
Python 版本 / Python version: 3.11
显卡：tesla v100
其他相关环境信息 / Other relevant environment information:

附加信息 / Additional Information

错误信息：
2024-02-18 17:21:16 | ERROR | stderr | Process model_worker - Qwen-14B-Chat-Int4:
2024-02-18 17:21:16 | ERROR | stderr | Traceback (most recent call last):
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/importlib/metadata/init.py", line 563, in from_name
2024-02-18 17:21:16 | ERROR | stderr | return next(cls.discover(name=name))
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | StopIteration
2024-02-18 17:21:16 | ERROR | stderr |
2024-02-18 17:21:16 | ERROR | stderr | During handling of the above exception, another exception occurred:
2024-02-18 17:21:16 | ERROR | stderr |
2024-02-18 17:21:16 | ERROR | stderr | Traceback (most recent call last):
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/multiprocessing/process.py", line 314, in _bootstrap
2024-02-18 17:21:16 | ERROR | stderr | self.run()
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/multiprocessing/process.py", line 108, in run
2024-02-18 17:21:16 | ERROR | stderr | self._target(*self._args, **self._kwargs)
2024-02-18 17:21:16 | ERROR | stderr | File "/home/lei/NLP/Langchain-Chatchat-master/startup.py", line 387, in run_model_worker
2024-02-18 17:21:16 | ERROR | stderr | app = create_model_worker_app(log_level=log_level, **kwargs)
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/lei/NLP/Langchain-Chatchat-master/startup.py", line 215, in create_model_worker_app
2024-02-18 17:21:16 | ERROR | stderr | worker = ModelWorker(
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/site-packages/fastchat/serve/model_worker.py", line 77, in init
2024-02-18 17:21:16 | ERROR | stderr | self.model, self.tokenizer = load_model(
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/site-packages/fastchat/model/model_adapter.py", line 323, in load_model
2024-02-18 17:21:16 | ERROR | stderr | model, tokenizer = adapter.load_model(model_path, kwargs)
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/site-packages/fastchat/model/model_adapter.py", line 1583, in load_model
2024-02-18 17:21:16 | ERROR | stderr | model = AutoModelForCausalLM.from_pretrained(
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/site-packages/transformers/models/auto/auto_factory.py", line 561, in from_pretrained
2024-02-18 17:21:16 | ERROR | stderr | return model_class.from_pretrained(
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/site-packages/transformers/modeling_utils.py", line 3013, in from_pretrained
2024-02-18 17:21:16 | ERROR | stderr | gptq_supports_cpu = version.parse(importlib.metadata.version("auto-gptq")) > version.parse("0.4.2")
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/importlib/metadata/init.py", line 1008, in version
2024-02-18 17:21:16 | ERROR | stderr | return distribution(distribution_name).version
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/importlib/metadata/init.py", line 981, in distribution
2024-02-18 17:21:16 | ERROR | stderr | return Distribution.from_name(distribution_name)
2024-02-18 17:21:16 | ERROR | stderr | ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2024-02-18 17:21:16 | ERROR | stderr | File "/home/anaconda3/envs/Langchain_chat/lib/python3.11/importlib/metadata/init.py", line 565, in from_name
2024-02-18 17:21:16 | ERROR | stderr | raise PackageNotFoundError(name)
2024-02-18 17:21:16 | ERROR | stderr | importlib.metadata.PackageNotFoundError: No package metadata was found for auto-gptq

请问大佬这是什么原因

dosubot · 2024-02-18T09:43:45Z

🤖

嗨，@leizhu1989！很高兴再次见到你。希望你一切都好！

您的错误信息 "PackageNotFoundError: No package metadata was found for auto-gptq" 表示您正在尝试加载的包或模型 "auto-gptq" 在您的环境中未找到。

然而，根据提供的上下文，您似乎正在尝试在 Langchain-Chatchat 中加载 "Qwen-14B-Chat" 模型。在配置文件的 "llm_model" 字典中确实列出了 "Qwen-14B-Chat" 模型，这意味着它应该可以使用。

"llm_model": {
    ...
    "Qwen-14B-Chat": "Qwen/Qwen-14B-Chat",
    ...
}

错误可能是由以下原因之一导致的：

"Qwen-14B-Chat" 模型没有正确下载或放置在正确的目录中。请确保模型已下载并放置在由 MODEL_ROOT_PATH 指定的目录中，或在 llm_model 字典中指定的路径中。
在您尝试加载模型的代码中可能存在拼写错误或模型名称错误。请确保在尝试加载模型时使用正确的模型名称 "Qwen-14B-Chat"。

如果错误仍然存在，请提供更多的上下文或您尝试加载模型的具体代码片段以便进一步协助。

另外，我在Langchain-Chatchat的问题库中找到了一些类似的已解决问题，可能对您有所帮助：

加载Qwen-14B-Chat-Int4模型报错更新于2023年11月14日
建议的解决方案是：在原始模型的 config.json 中添加 "disable_exllama": true。
【bug】选择用chatglm-api 加载模型时报错更新于2023年9月8日
此问题被引用于：Mac上运行本地的chatglm3-6b模型对话报错更新于2024年2月14日
问题已关闭，没有任何评论
load model failed. 加载模型失败更新于2023年8月17日
此问题被引用于：执行python startup.py -a 报错更新于2024年2月7日
建议的解决方案是：我是ice_text.model模型没有下载下来。开启lfs，再下载hugging face的代码仓,你先看下glm的下载下来ice_text.model这个模型了没有

希望这些信息对您有所帮助。如果还有其他问题，欢迎继续提问。

Sources

About Dosu

This response is meant to be useful and save you time. It is not meant to be a precise solution, but rather a starting point for your own research.

Help me be more useful! Please leave a 👍 if this is helpful and 👎 if it is irrelevant.

If you want to continue the conversation, start your reply with @dosu-bot.

zRzRzRzRzRzRzR · 2024-02-20T04:47:00Z

装对应依赖就行了

ponponon · 2024-10-11T14:31:03Z

装对应依赖就行了

是什么依赖？可以告知对应的名称吗？

ponponon · 2024-10-11T14:35:40Z

装对应依赖就行了

是什么依赖？可以告知对应的名称吗？

看到了

def validate_environment(self, *args, **kwargs):
    gptq_supports_cpu = version.parse(importlib.metadata.version("auto-gptq")) > version.parse("0.4.2")
    if not gptq_supports_cpu and not torch.cuda.is_available():
        raise RuntimeError("GPU is required to quantize or run quantize model.")
    elif not (is_optimum_available() and is_auto_gptq_available()):
        raise ImportError(
            "Loading a GPTQ quantized model requires optimum (`pip install optimum`) and auto-gptq library (`pip install auto-gptq`)"
        )
    elif version.parse(importlib.metadata.version("auto_gptq")) < version.parse("0.4.2"):
        raise ImportError(
            "You need a version of auto_gptq >= 0.4.2 to use GPTQ: `pip install --upgrade auto-gptq`"
        )

所以只要 pip install auto-gptq 就行

leizhu1989 added the bug Something isn't working label Feb 18, 2024

zRzRzRzRzRzRzR closed this as completed Feb 20, 2024

zRzRzRzRzRzRzR self-assigned this Feb 20, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

千问14b-int4模型加载失败 #2993

千问14b-int4模型加载失败 #2993

leizhu1989 commented Feb 18, 2024

dosubot bot commented Feb 18, 2024 •

edited

Loading

About Dosu

zRzRzRzRzRzRzR commented Feb 20, 2024

ponponon commented Oct 11, 2024

ponponon commented Oct 11, 2024

千问14b-int4模型加载失败 #2993

千问14b-int4模型加载失败 #2993

Comments

leizhu1989 commented Feb 18, 2024

dosubot bot commented Feb 18, 2024 • edited Loading

Sources

About Dosu

zRzRzRzRzRzRzR commented Feb 20, 2024

ponponon commented Oct 11, 2024

ponponon commented Oct 11, 2024

dosubot bot commented Feb 18, 2024 •

edited

Loading