We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
我在移植Deepseek的Janus Pro 1B 多模态大模型到RK3588, ONNX CPU已经可以跑通 (https://gist.github.com/happyme531/fa6123078399e8c721f7233b205be030) 这个模型是llama架构, 可以转换, 但是有自定义的Embedding和Head层, 按道理rkllm支持输入embedding输出last hidden state其实是可以推理的, 但是还有个大问题, 目前的API只能自动运行推理, 没办法手动逐个token的运行推理来控制每次推理的输入. 希望可以加一个类似 forward() 的API解决这一问题.
(以下内容由Gemini 2.0 Flash Thinking Experimental 0121生成) 好的,没问题。为了让你的 GitHub issue 更有效,我们需要强调 forward() API 的重要性和它能解决的实际问题,以及为什么这对 rknn-llm 框架本身是有益的。
forward()
以下是一个 GitHub issue 的模板,你可以根据你的具体情况进行修改和润色:
Issue Title: Feature Request: 请求添加 forward() API 以支持更灵活的推理和模型移植,例如 Deepseek Janus
Issue Body:
尊敬的 rknn-llm 团队,
我是一名 rknn-llm 的用户,目前正在尝试将 Deepseek 的 Janus 模型移植到 rknn-llm 框架上进行推理。在移植过程中,我遇到了一个重要的功能缺失,希望能得到团队的重视和支持,并考虑添加到未来的版本中。
问题描述:
当前 rknn-llm 框架主要提供了类似 generate() 这样的高层 API,这对于快速部署和简单的文本生成任务非常方便。然而,对于一些需要更精细控制推理过程的模型,例如 Deepseek Janus,以及需要进行自定义采样策略、中间层特征提取等高级操作的场景,现有的 API 就显得不够灵活。
generate()
具体来说,Deepseek Janus 模型采用了外部的 head 和 embedding 层来处理输入输出。为了正确地移植和运行 Janus 模型,我需要能够:
建议的解决方案:
为了解决上述问题,我强烈建议 rknn-llm 框架添加一个类似 forward() 的底层 API。 forward() API 的功能应该类似于 PyTorch 和 TensorFlow 等深度学习框架中的 forward 函数,即:
forward
有了 forward() API,用户就可以:
为什么这个功能很重要?
添加 forward() API 对于 rknn-llm 框架来说,具有以下重要的意义:
总结:
我深信,添加 forward() API 将极大地增强 rknn-llm 框架的实用性和竞争力,使其能够更好地适应快速发展的大模型领域,并服务更广泛的用户群体。 我希望 rknn-llm 团队能够认真考虑这个 feature request,并尽快将其加入到开发计划中。
非常感谢 rknn-llm 团队的辛勤工作和持续付出!期待您的回复和进一步的讨论。
此致,
[你的 GitHub 用户名]
Issue 标签建议:
feature request
api
inference
customization
deepseek-janus
提交 Issue 前的建议:
希望这个模板能帮助你写出一个更有说服力的 GitHub issue,祝你的请求能够得到 rknn-llm 团队的积极响应!
The text was updated successfully, but these errors were encountered:
你好,感谢建议,后续版本会考虑。
Sorry, something went wrong.
No branches or pull requests
我在移植Deepseek的Janus Pro 1B 多模态大模型到RK3588, ONNX CPU已经可以跑通 (https://gist.github.com/happyme531/fa6123078399e8c721f7233b205be030)
这个模型是llama架构, 可以转换, 但是有自定义的Embedding和Head层, 按道理rkllm支持输入embedding输出last hidden state其实是可以推理的, 但是还有个大问题, 目前的API只能自动运行推理, 没办法手动逐个token的运行推理来控制每次推理的输入.
希望可以加一个类似 forward() 的API解决这一问题.
(以下内容由Gemini 2.0 Flash Thinking Experimental 0121生成)
好的,没问题。为了让你的 GitHub issue 更有效,我们需要强调
forward()
API 的重要性和它能解决的实际问题,以及为什么这对 rknn-llm 框架本身是有益的。以下是一个 GitHub issue 的模板,你可以根据你的具体情况进行修改和润色:
Issue Title: Feature Request: 请求添加
forward()
API 以支持更灵活的推理和模型移植,例如 Deepseek JanusIssue Body:
尊敬的 rknn-llm 团队,
我是一名 rknn-llm 的用户,目前正在尝试将 Deepseek 的 Janus 模型移植到 rknn-llm 框架上进行推理。在移植过程中,我遇到了一个重要的功能缺失,希望能得到团队的重视和支持,并考虑添加到未来的版本中。
问题描述:
当前 rknn-llm 框架主要提供了类似
generate()
这样的高层 API,这对于快速部署和简单的文本生成任务非常方便。然而,对于一些需要更精细控制推理过程的模型,例如 Deepseek Janus,以及需要进行自定义采样策略、中间层特征提取等高级操作的场景,现有的 API 就显得不够灵活。具体来说,Deepseek Janus 模型采用了外部的 head 和 embedding 层来处理输入输出。为了正确地移植和运行 Janus 模型,我需要能够:
generate()
API 无法提供这种灵活性。generate()
API 通常内置了固定的采样方法(例如 greedy decoding, beam search)。在研究和实验中,我们可能需要尝试各种自定义的采样策略,例如 nucleus sampling, top-k sampling 的变体,甚至更复杂的基于强化学习的采样方法。这些都需要能够直接访问模型的原始输出,并在其基础上进行自定义操作。建议的解决方案:
为了解决上述问题,我强烈建议 rknn-llm 框架添加一个类似
forward()
的底层 API。forward()
API 的功能应该类似于 PyTorch 和 TensorFlow 等深度学习框架中的forward
函数,即:有了
forward()
API,用户就可以:forward()
API 返回的原始输出,自由地实现各种自定义的采样算法,进行更灵活的文本生成控制。forward()
API 可以帮助用户更深入地了解模型在 rknn 硬件上的运行细节,方便进行性能优化和问题排查。为什么这个功能很重要?
添加
forward()
API 对于 rknn-llm 框架来说,具有以下重要的意义:generate()
API,到同时提供底层forward()
API,体现了 rknn-llm 框架从易用性向易用性和专业性并重的转变。这将吸引更多有经验的开发者和研究人员使用 rknn-llm 进行更高级的应用开发和研究工作。forward()
API 正是满足这种需求的必要功能,它能够帮助用户更好地驾驭大模型,发挥其更大的潜力。总结:
我深信,添加
forward()
API 将极大地增强 rknn-llm 框架的实用性和竞争力,使其能够更好地适应快速发展的大模型领域,并服务更广泛的用户群体。 我希望 rknn-llm 团队能够认真考虑这个 feature request,并尽快将其加入到开发计划中。非常感谢 rknn-llm 团队的辛勤工作和持续付出!期待您的回复和进一步的讨论。
此致,
[你的 GitHub 用户名]
Issue 标签建议:
feature request
api
inference
customization
deepseek-janus
(可选,如果希望更具体地关联到你的用例)提交 Issue 前的建议:
希望这个模板能帮助你写出一个更有说服力的 GitHub issue,祝你的请求能够得到 rknn-llm 团队的积极响应!
The text was updated successfully, but these errors were encountered: