吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2670|回复: 9
收起左侧

[原创工具] RainCrack的SSH隧道型AI算力负载均衡 (如AutoDL),支持SSH转发,HTTP转发 1.0.0.4

[复制链接]
raincrack 发表于 2025-5-19 09:51
本帖最后由 raincrack 于 2025-5-19 20:27 编辑

AI算力调度与加速中间件:多节点GPU资源智能路由系统,同时可以作为http反向代理(暂未支持HTTPS),SSH隧道映射工具使用,异步网络构建,性能很好,同时支持AutoDL之类多家算力服务器负载均衡!


开发背景
在分布式AI推理场景中,我们遇到以下技术瓶颈:
  • 跨区域网络延迟:通过AutoDL租赁的内蒙古GPU节点,在调用语音合成API时,单次64KB音频文件传输延迟高达5秒(实测RTT 220ms+),严重影响实时性需求
  • 服务暴露限制:AutoDL平台默认屏蔽端口映射功能,需通过SSH隧道穿透实现内网穿透,手动维护多隧道配置复杂且缺乏容灾机制
  • 算力调度低效:单卡并发推理任务数受限(实测NVIDIA 4090卡在TTS场景下最大并发2实例),导致GPU资源利用率不足30%,多客户端需独占GPU资源造成硬件浪费
核心功能特性
  • 智能路由引擎
    • 支持自定义权重轮询与最小连接数负载均衡算法
  • 安全隧道管理
    • 自主开发自动化隧道管理模块,支持TLS加密与双因素认证
    • 支持Http端口转发功能,更安全
  • 其他功能
    • 可以将软件当SSH隧道映射工具用
    • 可以将软件当http反向代理用
    • 使用异步网络模型,作为中间服务器的性能绝对没问题的,测试用来中转简单http网页服务时候,几万并发下资源占用也很小!

技术架构

┌───────────────────────────────────────────────┐
│                                             客户端集群                                                     │
└───────────────┬───────────────┬───────────────┘
                                                        │                              
                                     ┌───────▼───────┐
                                     │           负载均衡器          │
                                     └───────┬───────┘
                                                        │               
              ┌───────▼─────────────────▼───────┐
              │           GPU资源调度集群                                            │
              │  ┌─────────┐ ┌─────────┐ ┌─────┐        │
              │  │ GPU节点1     │ │ GPU节点2     │ │...           │        │
              │  └─────────┘ └─────────┘  └─────┘         │
              └───────────────────────────────────┘
应用价值
  • 硬件成本降低:通过多任务并发使单卡利用率提升至80%+
  • 运维效率提升:隧道配置自动化
  • 网络延迟优化:智能路由算法选择最优传输路径
目前该系统已稳定运行于生产环境。
捕获11111111.PNG
下载地址 下载地址.txt (178 Bytes, 下载次数: 26)


免费评分

参与人数 3吾爱币 +9 热心值 +3 收起 理由
rpzfkd + 1 热心回复!
qn542231788 + 2 + 1 不明觉厉
Hmily + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

gettr 发表于 2025-5-19 11:58
这工具是干嘛的用
旧时光的小夏天 发表于 2025-5-19 13:42
你好,再见 发表于 2025-5-19 15:12
调api延迟高会不会是因为冷启动的原因?模型要从磁盘读取
 楼主| raincrack 发表于 2025-5-19 20:27
我一不小心设置成权限20了,现已修改!
头像被屏蔽
wl823 发表于 2025-5-21 06:59
提示: 作者被禁止或删除 内容自动屏蔽
812290870 发表于 2025-5-23 09:32
如果用来进行绘画,模型是否可以直接调用本地磁盘模型?
rpzfkd 发表于 2025-5-23 18:11
对大模型的开发测试还是很方便的
MR_梁 发表于 2025-7-9 01:31
谢谢分享好资源
MR_梁 发表于 2025-7-9 01:32
这个怎么使用啊
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - 52pojie.cn ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2026-6-3 02:08

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表