吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1647|回复: 17
收起左侧

[Java 原创] 简单优化-java小白针对大数据多表联查的一些小思路

[复制链接]
Dellevin 发表于 2024-4-10 14:19

此帖子用于抛砖引玉

我的member_user里面有352599条数据,gp_project里面有1211974条数据,

SELECT gp.*, mu.linkmanName , mu.linkmanPhone, mu.legalPersonName, mu.legalPersonPhone, mu.address, mu.registerArea FROM gp_project gp LEFT JOIN member_user mu ON mu.supplierId = gp.supplier_id WHERE DATE(gp.publicity_time) >= '2024-04-03' AND DATE(gp.publicity_time) <= '2024-04-07' and mu.deleted = 0

针对这样的数据,我的数据表里面数据太多,导致了查询需要512秒的时间,而且这仅仅是两个表的关联,之后还需要关联四五个表组成一条查询语句,如果仅在mysql里面查,未免有些太为难服务器了。

因为平常批量数据用的sql里面的in语法比较多,所以尝试了一下用关联字段in数据的情况,突然发现,这样还挺快,主要是因为关联字段是索引,所以比较快,通过单表查出数据,然后将关键字段提取出来,in到另一个表里面快速查询,最后拼接字段,来实现数据的查询结果。

另外因为涉及到多个循环,如果仅仅遵循  循环的外小内大原则,这样未免要写多个循环,降低了程序的运行效率多个O(n^2)的程序跑的,这样未免太致命了。改用map的key和value对照关系这样通过一个循环+map的方式降低时间复杂度为O(1)  ,这样就会快很多

其实我在网上找了很多办法都挺无力的,排除掉物理升级和缓存这两个(因为没钱和数据每天都在更新),索引优化,分页查询,改数据类型,这些能做到的都是微不足道。还希望有大佬可以给出一些新的思路和想法,万分感谢,本贴的丑陋代码仅作抛砖引玉。

下面是操作案例(取自部分的项目代码)

mybaits部分(单个案例)


<?xml version="1.0" encoding="UTF-8"?>  
<!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd">  

<mapper namespace="com.xyjq.mapper.db1.LoginMemberUserDao">  

    <!--根据供应商id判断是否为注册用户 -->  
    <select id="isRegisterSupplier" resultType="com.xyjq.entity.db1.LoginMemberUserEntity">  
        SELECT supplierId,createTime FROM `login_member_user` WHERE supplierId in  
        <foreach collection="supplierIdList" item="supplierId" open="(" separator="," close=")">  
            #{supplierId}  
        </foreach>  
    </select>  

</mapper>

业务层部分

List<GpProjectEntity> list = baseDao.queryList(params);  

Set<Integer> supplierIdList =  list.stream()  
                            .map(GpProjectEntity::getSupplierId)  
                            .filter(Objects::nonNull)  
                            .collect(Collectors.toSet());  
SimpleDateFormat inputFormat = new SimpleDateFormat("yyyyMMddHHmmss");  
SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");  
// 以下遍历中防止嵌套for循环O(n^2),使用map对象存储降低时间复杂度为O(1)  
Map<String, MemberUserEntity> memberUserInfoMap = new HashMap<>();  
memberUserDao.getMemberUserInfo(supplierIdList).forEach(memberUser -> memberUserInfoMap.put(memberUser.getSupplierId().toString(), memberUser));  

Map<String, SupplierBussinessInformationEntity> supplierBusinessInfoMap = new HashMap<>();  
supplierBussinessInformationDao.getSupplierBusinessInfo(supplierIdList).forEach(supplierBusinessInfo -> supplierBusinessInfoMap.put(supplierBusinessInfo.getSupplierId().toString(), supplierBusinessInfo));  

Map<String, LoginMemberUserEntity> loginMemberUserMap = new HashMap<>();  
loginMemberUserDao.isRegisterSupplier(supplierIdList).forEach(loginMemberUser -> loginMemberUserMap.put(loginMemberUser.getSupplierId().toString(), loginMemberUser));  

Map<String, String> financingNeedsMap = new HashMap<>();  
// 根据搜索结果,如果key一样就拼接value  
financingNeedsDao.getCompFinancingNeeds(supplierIdList).forEach(financingNeeds -> {  
    String key = financingNeeds.getSupplierId();  
    String value = FinancingStatus.getDescriptionByCode(financingNeeds.getFinancingProgress()) + "(" + financingNeeds.getCreateTime() + ")";  
    financingNeedsMap.merge(key, value, (oldValue, newValue) -> oldValue + ", " + newValue);  
});  

for (GpProjectEntity project : list) {  

    if (project.getAgName() != null && !project.getAgName().isEmpty()) {  
        project.setProjectNameMergeAgBid(project.getAgName());  
    } else if (project.getJatTpProName() != null && !project.getJatTpProName().isEmpty()) {  
        project.setProjectNameMergeAgBid(project.getJatTpProName());  
    }  

    if (project.getAgTotalMoney() != null) {  
        project.setProjectMoneyMergeAgBid(project.getAgTotalMoney());  
    } else {  
        project.setProjectMoneyMergeAgBid(project.getWinPriceRevised());  
    }  
    // 设置项目的日期  
    if (project.getAgSignDate() != null) {  
        Date date = null;  
        try {  
            date = inputFormat.parse(project.getAgSignDate());  
        } catch (ParseException e) {  
            throw new RuntimeException(e);  
        }  
        project.setProjectDateMergeAgBid(dateFormat.format(date));  
    } else {  
        project.setProjectDateMergeAgBid( dateFormat.format(project.getJatWinTime()) );  
    }  

    String supplierId = project.getSupplierId().toString();  
    // 设置供应商信息  
    MemberUserEntity memberUser = memberUserInfoMap.get(supplierId);  
    if (memberUser != null) {  
        project.setProjectLinkManName(memberUser.getLinkmanName());  
        project.setProjectLinkManPhone(memberUser.getLinkmanPhone());  
        project.setProjectLegalPersonName(memberUser.getLegalPersonName());  
        project.setProjectLegalPersonPhone(memberUser.getLegaPersonPhone());  
        project.setProjectAddress(memberUser.getAddress());  
        project.setProjectRegisterArea(memberUser.getRegisterArea());  
    }  
    // 设置工商信息省市区  
    SupplierBussinessInformationEntity supplierBussinessInformation = supplierBusinessInfoMap.get(supplierId);  
    if (supplierBussinessInformation != null) {  
        project.setProjectProvince(supplierBussinessInformation.getProvince());  
        project.setProjectCity(supplierBussinessInformation.getCity());  
        project.setProjectDistrict(supplierBussinessInformation.getDistrict());  
    }  
    // 设置是否是注册用户  
    LoginMemberUserEntity loginMemberUser = loginMemberUserMap.get(supplierId);  
    if (loginMemberUser != null) {  
        project.setProjectIsRegisterSupplier("已注册(" + dateFormat.format(loginMemberUser.getCreateTime()) + ")");  
    }  
    // 设置融资历史记录  
    String financingNeeds = financingNeedsMap.get(supplierId);  
    if (financingNeeds != null) {  
        project.setProjectFinancingNeeds(financingNeeds);  
    }  
}

免费评分

参与人数 3吾爱币 +9 热心值 +3 收起 理由
junjia215 + 1 + 1 用心讨论,共获提升!
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
AK471 + 1 + 1 此为违规行为,请遵守论坛版规!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| Dellevin 发表于 2024-4-11 09:33
Dellevin 发表于 2024-4-11 09:27
左表走的索引,右表不知道咋的索引没了。。。我再分析一下

这是我EXPLAIN后的结果
1        SIMPLE        mu                ALL        政采供应商iD                                334873        10.00        Using where
1        SIMPLE        gp                ref        idx_supplier_id        idx_supplier_id        5        xyjq_mp.mu.supplierId        9        100.00        Using where


大概找到原因了,因为mu.deleted = '0'这个字段没建立索引。。。建立索引之后也是两个表一起查16s
hwn0412 发表于 2024-4-10 17:09
你sql没走索引吧,这么点数据量10多分钟,而且你放java代码去做数据关联,不一样需要占用服务器内存,过段时候,这代码维护修改什么的你就会想死了。
SGC沉默 发表于 2024-4-10 14:31
思路:
去掉关联关系改为单表查询,代码逻辑层面改为多线程查询返回,然后数据组装为MAP进行hash匹配
 楼主| Dellevin 发表于 2024-4-10 14:33
SGC沉默 发表于 2024-4-10 14:31
思路:
去掉关联关系改为单表查询,代码逻辑层面改为多线程查询返回,然后数据组装为MAP进行hash匹配

哈哈哈,我后来就是这样想的
numberrr007 发表于 2024-4-10 14:36
你优化以后跑出结果是多少秒?或者说接口处理完花了多少秒?
 楼主| Dellevin 发表于 2024-4-10 14:37
numberrr007 发表于 2024-4-10 14:36
你优化以后跑出结果是多少秒?或者说接口处理完花了多少秒?

四五秒吧,不用关联查询的话很快
numberrr007 发表于 2024-4-10 14:42
Dellevin 发表于 2024-4-10 14:37
四五秒吧,不用关联查询的话很快

学习了!
 楼主| Dellevin 发表于 2024-4-10 18:10
hwn0412 发表于 2024-4-10 17:09
你sql没走索引吧,这么点数据量10多分钟,而且你放java代码去做数据关联,不一样需要占用服务器内存,过段 ...

你这么一说倒是提醒我了,,,我刚试了一下,本地计算机链接原创跑那个sql用了500s,服务器跑就16s。。。。。这个是啥情况啊。。。为啥差距那么大
破晓黎明丶 发表于 2024-4-10 19:40
对于这种业务场景,建议建表时对关联字段加上索引。
头像被屏蔽
hjsen 发表于 2024-4-10 19:52
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-13 08:18

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表