Данный репозиторий создан в рамках хакатона "Цифровой прорыв".
Создать программный модуль для планирования поведения робота с использованием языковых моделей.
В данном репозитории содержатся файлы, необходимые для запуска предложенных решений. Перед запуском необходимо также будет скачать датасет.
- Скачать проект с репозитория на GitHub
git clone https://github.com/ulvivl/robotics_llm.git
- Скачать файлы из репозитория с моделью LLava
git clone https://github.com/haotian-liu/LLaVA.git cd LLaVA
- Установить необходимые для запуска библиотеки
conda create -n llava python=3.10 -y conda activate llava pip install --upgrade pip # enable PEP 660 support pip install -e .
- Запустить ноутбука llava_pipeline.ipynb
- Выполнить шаги, необходимые для запуска Первого метода.
- Запустить ячейки ноутбука zephyr_llava_dual_multithread_dataframe.ipynb
- Результат выполнения будет в ячейке
parsed_cmd
- Использование модели Llava (llava_pipeline.ipynb)
- Использование модели Llava совместно с моделью на базе мистраль (zephyr_llava_dual_multithread_dataframe.ipynb)
- Попытка обучить модель на задачу VQA на обучающем датасете (fine-tune-BLIP.ipynb)