《王者荣耀》多模态问答助手 【RAG】【AGENT】【RolePlay】【Deploy】【MultiModal】 #594
chg0901
started this conversation in
MultiModal
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
数据介绍
队友招募
这是一个和王者有关的多模态项目,
打算使用rag,和agent, roleplay,lmdeploy等技术,
欢迎感兴趣的大佬联系,利用这份数据,一起开发有趣的应用
招募要求
数据背景
《王者荣耀》是由腾讯游戏天美工作室群开发并运营在Android、IOS平台上的MOBA类国产手游,是目前中国最流行的智能手机游戏之一,王者荣耀中的玩法以竞技对战为主,玩家之间进行1V1、3V3、5V5等多种方式的PVP对战,在满足条件后可以参加游戏的排位赛等,还可以参加PVE的闯关模式,是属于推塔类型的游戏。
王者荣耀中英雄众多,主要分为五个分路和七个职业,每个英雄最多有十几款皮肤,很多皮肤除了和原皮海报不同,还有不同的故事和语音,因此王者荣耀的有关数据是很好的多模态数据。
HoK 多模态toy数据集
这个多模态数据集包括来自手机游戏《王者荣耀》的图像、文本和音频,这是中国最流行的智能手机游戏之一。
王者荣耀故事英雄与技能-toy.xlsx包含每个英雄详细信息的主要文本数据。 作为一个玩具数据集,我只上传了4个英雄的数据“英雄Q版头像”、“英雄档案图片”和“英雄海报”是包含这些英雄的各种图像的文件夹。
英雄语音和对应台词是包含每个英雄每种皮肤对应的语音(音频)和台词(文本)的文件夹。 (有些皮肤没有对应的声音,使用默认皮肤的声音和台词。)在线试听蔡文姬原皮语音
王者荣耀 蔡文姬原皮语音
各个英雄的默认皮肤
有一些数字,例如'116_阿轲__迷踪丽影'中的116和'142_安琪拉_东瞰扶胥选自广东通志.mp3'中的142。 这些数字与王者荣耀网站中的英雄索引有关,你可以忽略它,因为我提供了每个英雄的中文名。
我可能会考虑稍后上传更多数据。
简单的文件结构
│ 王者荣耀故事英雄与技能-toy.xlsx ├───英雄Q版头像 ├───英雄档案图片 ├───英雄海报 ├───英雄皮肤 │ ├───安琪拉 │ ├───艾琳 │ ├───阿古朵 │ └───阿轲 └───英雄语音和对应台词 ├───安琪拉 │ ├───142_安琪拉__乘龙·聚宝船 │ ├───142_安琪拉__心灵骇客 │ ├───142_安琪拉__时之奇旅 │ ├───142_安琪拉__暗夜萝莉 │ ├───142_安琪拉__追逃游戏 │ └───142_安琪拉__魔法小厨娘 ├───艾琳 │ ├───155_艾琳__奇遇舞章 │ ├───155_艾琳__精灵之舞 │ └───155_艾琳__觅芳踪 ├───阿古朵 │ ├───533_阿古朵__山林之子 │ ├───533_阿古朵__江河有灵 │ └───533_阿古朵__顽趣 └───阿轲 ├───116_阿轲__信念之刃 ├───116_阿轲__暗夜猫娘 ├───116_阿轲__节奏热浪 └───116_阿轲__迷踪丽影数据集整理日志
更多详情,请查看王者荣耀问答助手[大模型实战营 结题项目][更新更多数据,计划采用RAG方法进行多模态检索搜索查询] - 知乎
HoK Text 数据集
数据介绍
目前,此文件夹中有两个 processed.jsonl 和 processed2.jsonl 数据集。
数据OriginalData_inChinese.xlsx是生成processed.jsonl和processed2.jsonl的原始数据,
处理代码为text_processing. py 和 text_processing3.py .
它们是 Xtuner 用于微调手机游戏《王者荣耀》英雄属性搜索的 LLM 模型的两个版本的文本数据。
如何使用
详细如何使用这两个数据集,请参考以下两个知乎链接
Beta Was this translation helpful? Give feedback.
All reactions