AnimeGamer动漫生活模拟器，能根据指令生成动态动画和角色状态

AnimeGamer 是一个无限动漫生活模拟器，使用多模态大型语言模型（MLLM）来模拟一个动漫世界，能预测下一时刻的游戏状态，用户可以通过开放式的语言指令与这个动态世界互动，就像扮演动漫角色一样。

AnimeGamer能够生成一致的多回合游戏状态，包括动态动画镜头和角色状态的更新，如体力、社交和娱乐值。玩家可以将《魔女宅急便》中的Qiqi和《天空之城》中的Pazu聚合在一起，让他们在动漫世界中相遇并进行互动。

AnimeGamer基于多模态大型语言模型（MLLMs），用于生成每个游戏状态，包括展示角色动作的动态动画镜头和角色状态的更新。

训练过程分为三个阶段：

1、使用动作感知的多模态表示来建模动画镜头，训练基于扩散的解码器来重建视频，输入还包括指示动作强度的运动范围。

2、训练一个MLLM来预测下一个游戏状态表示，输入为历史指令和游戏状态表示。

3、在适应阶段，通过使用MLLM的预测作为输入来微调解码器，提高解码动画镜头的质量。

快速开始

AnimeGamer的推理代码设计用于低VRAM环境（24GB内存），MLLM和VDM_Decoder可以分开运行，要设置推理环境，可以执行以下命令：

git clone https://github.com/TencentARC/AnimeGamer.git
cd AnimeGamer
conda create -n animegamer python==3.10 -y
conda activate animegamer
pip install -r requirements.txt

下载AnimeGamer和Mistral-7B的检查点，将它们保存在./checkpoints文件夹下，然后下载CogvideoX的3D-VAE：

cd checkpoints
wget https://cloud.tsinghua.edu.cn/f/fdba7608a49c463ba754/?dl=1
mv 'index.html?dl=1' vae.zip
unzip vae.zip

要生成动作感知的多模态表示并更新角色状态，可以运行：

python inference_MLLM.py

要将表示解码为动画镜头，可以运行：

python inference_Decoder.py

可通过修改./game_demo中的指令来自定义。

漫画翻译器

AnimeGamer动漫生活模拟器，能根据指令生成动态动画和角色状态

微软Playwright MCP 网页自动化测试框架，支持跨浏览器Web测试

AI 有声书自动化生成工具

OI Wiki 编程竞赛知识库

OpenDeepSearch 开源搜索工具

WhatsApp MCP Server：连接Claude管理个人消息的AI工具

Flowise 零代码搭建AI应用

地图瓦片图下载工具，支持OpenStreetMap、天地图、谷歌地图、高德地图、腾讯地图、必应地图的XYZ瓦片图下载与合并

Pake打包工具：可将网页快速打包成桌面应用

XianyuAutoAgent 智能闲鱼客服机器人系统

漫画翻译器

Escrcpy ：基于 Scrcpy 的图形化安卓手机投屏+控制软件，支持Windows、macOS、Linux

插件化、定制化、无广告的免费音乐播放器 MusicFree

动漫工具

插件化、定制化、无广告的免费音乐播放器 MusicFree

Reubah 基于网页的图像处理与文档转换工具

Ward服务器监控工具

Escrcpy ：基于 Scrcpy 的图形化安卓手机投屏+控制软件，支持Windows、macOS、Linux

KrillinAI 基于LLMs的本地视频翻译、配音和语音克隆的工具

MarkitDown：可以将PDF，PPT，word，Excel、图片、音频、html、csv 等转化成Markdown格式

Together Open Deep Research由AI驱动的深度研究工具，能生成含引用的综合性报告

LLManager 用于管理审批请求的 LangGraph 工作流

Python A2A：Google A2A协议的Python实现，集成MCP，用于构建可互操作的多智能体系统

OpenAI.fm 基于 OpenAI Text-to-Speech 模型的交互式演示项目，使用 OpenAI Speech API 将文本转换成语音