重点:此项目节点连接方式是p2p,必须保证udp连接正常
这个项目容易出大毛,融资大,操作麻烦,劝退不少人。多号也不方便。所以有条件的试一试。
可以用CPU也可以用GPU来跑。
CPU: 8核 内存16G及以上,用20G试过可以跑。
GPU: 显存10G及以上。3080可以跑。
操作系统 Ubuntu-24.04及更新。
本地的话,win10 或win11, 自己提前安装好wsl2 安装 Ubuntu-24.04(用显卡跑还要在wsl2里面安装cuda 12.8),要开全局。– 提前开全局, 即先在主机开全局,再打开wsl。
安装步骤:
1, 更新系统
sudo apt-get update && sudo apt-get upgrade -y
2, 安装各种库,工具
sudo apt install screen curl iptables build-essential git wget lz4 jq make gcc nano automake autoconf tmux htop nvme-cli libgbm1 pkg-config libssl-dev libleveldb-dev tar clang bsdmainutils ncdu unzip libleveldb-dev git -y
3, 安装 python
sudo apt-get install python3 python3-pip python3-venv python3-dev -y
4, 安装 node
sudo apt-get update
curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -
sudo apt-get install -y nodejs
sudo npm install -g yarn
5, 安装yarn
curl -o- -L https://yarnpkg.com/install.sh | bash
export PATH="$HOME/.yarn/bin:$HOME/.config/yarn/global/node_modules/.bin:$PATH"
source ~/.bashrc
6, 下载 rl-swarm, 这里以单机单号为例,单机多号要自己做隔离,分别安装到不同的目录下。
我们下载到用户目录下。
cd ~
# 如果重新安装,且之前正常运行过的,则参考最后面先把swarm.pem文件保存好。
# 如果重新安装,则先把原来的 swarm删除 rm -rf ~/rl-swarm
git clone https://github.com/gensyn-ai/rl-swarm/
cd ~/rl-swarm/modal-login && yarn install && yarn upgrade && yarn add next@latest && yarn add viem@latest
cd ~/rl-swarm
sed -i '1i # ~/.bashrc: executed by bash(1) for non-login shells.\n\n# If not running interactively, don'\''t do anything\ncase $- in\n *i*) ;;\n *) return;;\nesac\n' ~/.bashrc
# sed -i '101s|^|# |' run_rl_swarm.sh
cd ~ && python3 -m venv .venv && source .venv/bin/activate
# 手动安装几个包 可能有点慢。
cd ~/rl-swarm
# 用CPU跑的安装这一行,如M4, 服务器
pip3 install -r requirements-cpu.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
# 用显卡跑的安装这一行
pip3 install -r requirements-gpu.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
7, 运行 swarm, 第一次会安装一些包,比较慢。
tmux new -s gensyn
cd ~ && python3 -m venv .venv && source .venv/bin/activate
# 如果指定要CPU运行,则提前运行这一行 export CPU_ONLY=1 && export CUDA_VISIBLE_DEVICES=""
cd ~/rl-swarm && bash ./run_rl_swarm.sh
# 以后想进服务器查看可以 tmux a -t gensyn
8, 安装过程的交互 – 安装完成后,无法进入,无法使用,则可以考虑用后面的文件来覆盖。
Would you like to connect to the Testnet? [Y/n] 直接回车
Waiting for modal userData.json to be created.. 打开谷哥浏览器。
服务器的话就是 服务器IP:3000 且把端口3000要打开。防火墙打开。(也可以本地转发到服务器)
输入邮箱,Continue, 然后到邮箱收验证码,填进去, 可能要到垃圾箱找。
Would you like to push models you train in the RL swarm to the Hugging Face Hub? [y/N] 直接回车
接下来连上网络。
Hello 后面就是你的节点名称, []里面就是节点ID, 记下这个节点ID. 也叫peer ID, 把这个节点文件swarm.pem 保存好。它跟邮箱是绑定的,如果这个文件丢了,则邮箱也作废了。
节点文件默认在 ~/rl-swarm/swarm.pem, 保存好。
9, 验证节点状态
复制上述的节点ID 到网站查询 https://gensyn-node.vercel.app, 主要看evm地址,如果是 0x0000000000000000 后面全是0,则这个邮箱作废。换一个新邮箱,重新安装重新来。先跑一下再查。
也可以进电报查 @gensyntrackbot /check 你的节点ID
10, 查看链上纪录,估计会是空投的条件之一。跑100多条纪录,混个低保有吧。
复制你上面的EVM地址到浏览器里面搜索。
11, 通过邮箱,验证码登录,保存 ~/rl-swarm/swarm.pem 文件,挖吧。一直到空投。很大概率有大毛。
杂项:
内存低于官方推荐的可以修改配置文件,把参数调低点。
GPU ~/rl-swarm/hivemind_exp/configs/gpu/grpo-qwen-2.5-0.5b-deepseek-r1.yaml
CPU ~/rl-swarm/hivemind_exp/configs/mac/grpo-qwen-2.5-0.5b-deepseek-r1.yaml
文件里面 大概第17行 max_steps: 20 原来是20步,可以改为10或5步。
官方后台查 https://dashboard.gensyn.ai/
修改文件:
其中可能有3个文件涉及到改动,如果不正常,可以恢复默认的或者找群主要, 覆盖原来的文件。
1, ~/.bashrc # 可能在 /root下面
2,~/.run_rl_swarm.sh # 可能在 /root/rl-swarm下面
3,参数文件,根据电脑性能来改 grpo-qwen-2.5-0.5b-deepseek-r1.yaml 可能在 /root/rl-swarm/hivemind_exp/configs/gpu 下面
如果是CPU则 /root/rl-swarm/hivemind_exp/configs/mac 下面
其它
建立会话来运行节点 tmux new -s gensyn
终端可以关闭,下次重新进入 ,查看运行状态 tmux attach -t gensyn
hivemind.p2p.p2p_daemon_bindings.utils.P2PDaemonError: Daemon failed to start in 15.0 seconds
~/rl-swarm/.venv/lib/python3.12/site-packages/hivemind/p2p/p2p_daemon.py
机场问题,换个机场即可。
机场及全局代理
可用一云梯。 机场注册 https://inv01.1ytaff.com/register?aff=nRmn0eie
或者自己搭建,证书要正确一般可行。以及安装过程中的各种错误,也是机场IP原因。
可以试下这个机场以及在ubuntu里面安装V2RayA软件来运行全局代理 。
v2raya 安装方法 https://v2raya.org/docs/prologue/installation/debian
安装后进入后台 http://localhost:2017/,导入订阅或新建自己搭建的节点,
1 先手工选择一个快的节点, 推荐香港
2 设置 启用:大陆白名单 或者 启用:不进行分流
3, 左上角,启动,然后显示 正在运行。
检测可否打开谷歌 curl -v google.com
连不上 3000这个端口,防火墙关掉。
查节点名称 https://dashboard.gensyn.ai/ 很多节点查不到
查节点ID https://gensyn-node.vercel.app/ 可查到多少wins以及evm地址
链上查纪录 https://gensyn-testnet.explorer.alchemy.com/ 通过evm地址可以查到纪录
5.2 更新节点 – 以后官方有更新也可以这么操作
无须重新登录,无须收验证码。
1, 锁定之前的登录信息
sudo chattr +i ~/rl-swarm/modal-login/temp-data/*.json
如果是M4,则用这个命令
sudo chflags schg ~/rl-swarm/modal-login/temp-data/*.json
2, 进入会话
tmux a -t gensyn
3, 停止节点,按 CTRL C , 到这一步才停止节点。
4, 更新节点
cd ~/rl-swarm && git reset --hard HEAD && git pull
5, 运行节点
cd ~ && python3 -m venv .venv && source .venv/bin/activate && cd ~/rl-swarm && bash ./run_rl_swarm.sh
一路回车即可。