RainCrack的SSH隧道型AI算力负载均衡 (如AutoDL)，支持SSH转发，HTTP转发 1.0.0.4

raincrack · 发表于 2025-5-19 09:51

本帖最后由 raincrack 于 2025-5-19 20:27 编辑

AI算力调度与加速中间件：多节点GPU资源智能路由系统，同时可以作为http反向代理(暂未支持HTTPS)，SSH隧道映射工具使用，异步网络构建，性能很好,同时支持AutoDL之类多家算力服务器负载均衡！

开发背景
在分布式AI推理场景中，我们遇到以下技术瓶颈：

跨区域网络延迟：通过AutoDL租赁的内蒙古GPU节点，在调用语音合成API时，单次64KB音频文件传输延迟高达5秒（实测RTT 220ms+），严重影响实时性需求
服务暴露限制：AutoDL平台默认屏蔽端口映射功能，需通过SSH隧道穿透实现内网穿透，手动维护多隧道配置复杂且缺乏容灾机制
算力调度低效：单卡并发推理任务数受限（实测NVIDIA 4090卡在TTS场景下最大并发2实例），导致GPU资源利用率不足30%，多客户端需独占GPU资源造成硬件浪费

核心功能特性

智能路由引擎
- 支持自定义权重轮询与最小连接数负载均衡算法
安全隧道管理
- 自主开发自动化隧道管理模块，支持TLS加密与双因素认证
- 支持Http端口转发功能，更安全
其他功能
- 可以将软件当SSH隧道映射工具用
- 可以将软件当http反向代理用
- 使用异步网络模型，作为中间服务器的性能绝对没问题的，测试用来中转简单http网页服务时候，几万并发下资源占用也很小！

技术架构

	┌───────────────────────────────────────────────┐
	│ 客户端集群 │
	└───────────────┬───────────────┬───────────────┘
	│
	┌───────▼───────┐
	│ 负载均衡器 │
	└───────┬───────┘
	│
	┌───────▼─────────────────▼───────┐
	│ GPU资源调度集群 │
	│ ┌─────────┐ ┌─────────┐ ┌─────┐ │
	│ │ GPU节点1 │ │ GPU节点2 │ │... │ │
	│ └─────────┘ └─────────┘ └─────┘ │
	└───────────────────────────────────┘

应用价值

硬件成本降低：通过多任务并发使单卡利用率提升至80%+
运维效率提升：隧道配置自动化
网络延迟优化：智能路由算法选择最优传输路径

目前该系统已稳定运行于生产环境。
捕获11111111.PNG

下载地址

下载地址.txt (178 Bytes, 下载次数: 26)

gettr · 发表于 2025-5-19 11:58

这工具是干嘛的用

旧时光的小夏天 · 发表于 2025-5-19 13:42

还得有linux端的配套代码吧

你好，再见 · 发表于 2025-5-19 15:12

调api延迟高会不会是因为冷启动的原因？模型要从磁盘读取

raincrack · 发表于 2025-5-19 20:27

我一不小心设置成权限20了，现已修改！

wl823 · 发表于 2025-5-21 06:59

提示: 作者被禁止或删除内容自动屏蔽

812290870 · 发表于 2025-5-23 09:32

如果用来进行绘画，模型是否可以直接调用本地磁盘模型？

rpzfkd · 发表于 2025-5-23 18:11

对大模型的开发测试还是很方便的

MR_梁 · 发表于 2025-7-9 01:31

谢谢分享好资源

MR_梁 · 发表于 2025-7-9 01:32

这个怎么使用啊

帐号		自动登录	找回密码
密码			注册[Register]

[原创工具] RainCrack的SSH隧道型AI算力负载均衡 (如AutoDL)，支持SSH转发，HTTP转发 1.0.0.4

免费评分

本帖被以下淘专辑推荐:

浏览过的版块

wl823 wl823 当前离线好友阅读权限 0 听众最后登录 1970-1-1 头像被屏蔽	wl823 发表于 2025-5-21 06:59 提示: 作者被禁止或删除内容自动屏蔽

	回复举报